Home >  Stories > 

De-colonizzare la tecnologia per le lingue minoritarie

De-colonizzare la tecnologia per le lingue minoritarie

Anche se non ne siamo consapevoli, ogni volta che usiamo il computer o lo smartphone usiamo una qualche forma di tecnologia automatica del linguaggio (TAL o NLP, dall’inglese Natural Language Processing). La usiamo quando digitiamo e utilizziamo la funzionalità del testo predittivo, o quando ci serviamo di un motore di ricerca, oppure quando ricorriamo alla traduzione automatica per capire il senso di un testo scritto in un’altra lingua.

We see five people of all ages fishing together in a boat, with a cat playing with the fish in the water. Two elders are talking casually on the left side of the boat while they fish, and on the right side, a middle-aged person is teaching a child how to tie a hook onto their line. On the far right, a child has just caught a fish. Instead of a mast, the boat has an antenna with a glowing light on top. Glowing cables trail down from this antenna and connect to a light strip that wraps around the edges of the boat, as well as a glowing net that sits in the water. There are birds in the sky, flying close to two floating buildings off in the distance.
Illustration by Maggie Haughey

Introduzione

Anche se non ne siamo consapevoli, ogni volta che usiamo il computer o lo smartphone usiamo una qualche forma di tecnologia automatica del linguaggio (TAL o NLP, dall’inglese “Natural Language Processing”). La usiamo quando digitiamo e utilizziamo la funzionalità del testo predittivo, o quando ci serviamo di un motore di ricerca, oppure quando ricorriamo alla traduzione automatica per capire il senso di un testo scritto in un’altra lingua. La tecnologia del linguaggio si è insinuata nelle nostre vite senza che ce ne accorgessimo realmente. Tuttavia, la tecnologia non è mai neutrale: essendo sviluppata dagli uomini, riflette la loro mentalità e la loro cultura . In che misura quindi la tecnologia del linguaggio può 1 essere influenzata da atteggiamenti coloniali e quale effetto ha questo sull’usabilità digitale delle lingue minoritarie? Cercheremo di rispondere a questa domanda a partire dal caso di alcune lingue minoritarie dell’Unione Europea. L’Unione Europea ospita più di 60 lingue regionali o minoritarie e 24 lingue ufficiali. Molte di queste lingue minoritarie sono indigene, essendosi sviluppate sul territorio in tempi antichi. E' questo il caso, per esempio, del sardo in Italia, dell’occitano in Francia, del casciubo in Polonia o delle lingue sàmi in Norvegia e in Finlandia. Si tratta di lingue che erano intensamente parlate ed usate fino a tempi relativamente recenti, in molti casi almeno fino all’avvento degli stati-nazione, il costrutto politico che ha contribuito attivamente allo sradicamento di tutte le lingue diverse da quella scelta come lingua ufficiale dello Stato.

Fino a non molto tempo fa, l’avvento di Internet e della comunicazione digitale hanno replicato e rafforzato la dicotomia tra lingua ufficiale e lingue non ufficiali. I costi di sviluppo del software hanno fatto sì che le interfacce e le applicazioni internet basate sul linguaggio fossero disponibili solo per le lingue ufficiali. A causa del dominio dell’inglese, persino le altre lingue ufficiali hanno difficoltà ad essere rappresentate a sufficienza in Internet: nel 2012, una ricerca condotta dalla Rete di Eccellenza META-NET e culminata nella pubblicazione di 30 Libri Bianchi sulle Lingue ha mostrato come 29 lingue europee fossero a rischio di estinzione digitale 2 a causa della mancanza di tecnologie linguistiche sufficienti. Il rapporto tra lingue minoritarie e tecnologia può essere descritto in base ad almeno tre dimensioni diverse. La prima è quella della disponibilità della tecnologia: le lingue ufficiali tendono ad avere a disposizione l’intera gamma di media, servizi, interfacce e applicazioni. Le lingue minoritarie hanno opportunità molto minori: spesso non è disponibile nemmeno una tastiera per digitare con caratteri appropriati, per non parlare della tecnologia più avanzata come la traduzione automatica o il 3 riconoscimento vocale 4.

Un secondo aspetto è l’usabilità della tecnologia, se questa è disponibile. Sicuramente Internet e il dominio digitale hanno un lato positivo per le lingue minoritarie: la sua disponibilità (soprattutto in un’Europa iperconnessa) e il costo relativamente basso (rispetto all’accesso alla stampa, ad esempio), hanno reso possibile la creazione di contenuti in lingue diverse da quelle ufficiali, dominanti. Per la comunicazione interpersonale, le persone che usano lingue non ufficiali a casa hanno iniziato ad utilizzarle per la messaggistica e la chat. Sono nati movimenti spontanei che in alcuni casi hanno portato allo sviluppo di soluzioni software dedicate. C’è una tastiera per scrivere la lingua Sàmi, si può accedere a siti web e leggere ebook in gallese, ci sono videogiochi in bretone e in còrso. La disponibilità di servizi, interfacce, app e Wikipedia non implica però il loro effettivo utilizzo. Alcuni studi rivelano che chi parla una lingua minoritaria passa facilmente alla lingua dominante quando utilizza tecnologie digitali basate sulla lingua, sia perché per la lingua maggioritaria la tecnologia è intrinsecamente migliore, sia perché la gamma di servizi disponibili è molto più ampia. Nella maggior parte dei casi, l’uso di una lingua minoritaria richiede una buona dose di perseveranza, volontà e resistenza, poiché l’esperienza dell’utente nell’uso delle lingue minoritarie è costellata di problemi e difficoltà. È stato riferito, ad esempio, che le difficoltà di digitazione dovute alla mancanza di tastiere specifiche possono anche portare ad evitare completamente di scrivere nelle chat e di preferire invece la registrazione di messaggi vocali. E' molto probabile che un’esperienza costantemente difficile e faticosa nell’uso quotidiano di una lingua induca un utente medio ad abbandonare una lingua a favore di un’altra che abbia un migliore supporto o che dia accesso a più servizi e opportunità, soprattutto se quest’altra scelta è una lingua che è già tra quelle che compongono la competenza multilingue del parlante.

Il terzo aspetto è il modo in cui la tecnologia viene sviluppata per le lingue minoritarie. Abbiamo osservato che le iniziative tecnologiche per le lingue minoritarie tendono a polarizzarsi intorno a due estremi. Da un lato, la fornitura di tecnologia e di media viene riversata dall’alto verso il basso dalle grandi aziende, con un coinvolgimento minimo o nullo delle comunità di parlanti. In questo caso, si può anche notare un approccio paternalistico: poiché la disponibilità è molto scarsa, tutto ciò che viene fornito deve essere buono e benvenuto per definizione. Molto spesso le aziende offrono soluzioni già pronte senza tener conto delle reali esigenze, dei desideri e delle aspettative di chi parla una lingua minoritaria. È come se il presupposto fosse che queste persone debbano essere grate per qualsiasi prodotto o opportunità venga loro offerta, indipendentemente dal fatto che sia effettivamente interessante o rilevante per la loro vita. Un’eccezione notevole a questo comportamento è rappresentata per esempio da van Esch et al. (2019), che sottolineano ripetutamente la necessità di una stretta collaborazione con i parlanti quando si pianifica lo sviluppo di applicazioni di NLP. Dall’altra parte abbiamo l’approccio degli attivisti, che spesso danno vita a iniziative utili (le varie esperienze di localizzazione di Facebook, per esempio, o i progetti di Wikipedia). Anche se lodevoli, queste iniziative tendono a soffrire di mancanza di coordinamento, scarsa pianificazione e limitate possibilità di essere conosciute. Questo porta a un problema molto serio per comunità le cui risorse sono spesso molto limitate: la reduplicazione degli sforzi.

Per decolonizzare la tecnologia del linguaggio per le lingue minoritarie, è importante ottenere un quadro più chiaro della misura in cui le lingue minoritarie sono utilizzate sui media digitali, con quale frequenza e per quali scopi. Altrettanto importante è conoscere gli ostacoli che i parlanti di lingue minoritarie incontrano quando (o se) cercano di usare queste lingue: incontrano difficoltà tecniche? Sono bloccati da una sorta di paranoia autoindotta? Dato che scrivere in una lingua minoritaria implica una qualche esposizione al mondo esterno, le persone si astengono dal farlo per paura di essere derise o stigmatizzate? Allo stesso modo, si sa poco del desiderio dei parlanti di lingue minoritarie di avere opportunità digitali: cosa vogliono o si aspettano di ricevere?

L’indagine del progetto “The Digital Language Diversity Project”

Con l’obiettivo di comprendere le esigenze specifiche e il particolare comportamento dei parlanti di queste lingue, nel 2016 abbiamo condotto un’indagine per raccogliere informazioni sul loro modo di usare la lingua digitalmente e sulle risorse e servizi digitali che sanno fare uso della loro lingua. L’indagine rientrava nel lavoro svolto nell’ambito del Digital Language Diversity Project (DLDP, un progetto finanziato nell’ambito del programma di finanziamento europeo Erasmus+ ) 5.

L’obiettivo principale dell’indagine DLDP era capire il comportamento digitale dei parlanti di lingue regionali e minoritarie, i loro desideri e le loro aspettative. Lo studio era anche finalizzato a raccogliere dati e informazioni per compilare la Digital Language Vitality Scale, uno degli strumenti sviluppati dal progetto DLDP per misurare la presenza e l’usabilità digitale di una lingua, dal triplice punto di vista dell’infrastruttura disponibile a supporto dell’uso digitale, della disponibilità e usabilità dei media digitali e della disponibilità e usabilità dei servizi digitali. L’indagine è stata quindi progettata intorno a tre blocchi concettuali principali: in primo luogo, la capacità digitale della lingua, cioè se siano presenti le condizioni tecnologiche per il suo utilizzo digitale, come la disponibilità di una connessione a internet, o la possibilità di digitare i caratteri in cui una lingua è scritta. In secondo luogo, la possibilità di utilizzare la lingua, sotto forma dei contesti disponibili per il suo uso digitale, come i media e i servizi digitali. Terzo, l’atteggiamento dei parlanti nei confronti dell’uso digitale della lingua: se lo si ritenga auspicabile, quali siano le motivazioni alla base dell’uso digitale, e quali i fattori di blocco, se presenti. Particolare attenzione è stata dedicata ad evidenziare i possibili problemi incontrati nell’uso digitale della lingua.

Abbiamo ricevuto risposta da oltre 1300 parlanti, che hanno mostrato entusiasmo per l’iniziativa e si sono sentiti lusingati dall’interesse manifestato per la loro lingua madre. Il progetto ha focalizzato la sua attenzione su quattro lingue: bretone, basco, sardo e careliano. Queste lingue sono rappresentative di fasi di sviluppo digitale diverse e hanno diversi gradi di sostegno istituzionale e comunitario. Una breve descrizione introduttiva delle quattro lingue è fornita in Hernaiz e Berger (2017), Hicks (2017), Russo e Soria (2017) e Salonen (2017). Per garantire la massima comparabilità e riutilizzabilità del questionario, ne abbiamo sviluppato un modello in inglese e lo abbiamo tradotto e localizzato nelle quattro lingue.

Le lingue minoritarie hanno un uso digitale?

L’analisi dei dati ha mostrato alcuni risultati interessanti. In primo luogo, il fatto che le lingue minoritarie sono in effetti ampiamente utilizzate su Internet, in particolare per applicazioni di messaggistica e chat. Il 97% dei baschi, il 94,5% dei bretoni, l'85% dei sardi e il 74% dei careliani dichiarano di utilizzare la lingua online, per lo più in modo attivo. I media digitali sembrano essere disponibili in tutte e quattro le lingue considerate. Un gruppo di domande riguardava l’uso della lingua minoritaria per la comunicazione elettronica, ad esempio per scrivere e-mail, inviare SMS, o chattare tramite Whatsapp, Google chat, Snapchat, Skype, Facebook Messenger, ecc. I dati mostrano un uso esteso delle lingue minoritarie per la comunicazione elettronica. I parlanti careliani mostrano un uso più passivo della lingua, ma questo è probabilmente legato alla loro età più avanzata rispetto ai parlanti delle altre tre lingue.

In linea generale, quindi, abbiamo osservato che i parlanti di lingue regionali e minoritarie hanno un forte desiderio di utilizzare le loro lingue in modo digitale, in tutti i settori sociolinguistici e per tutti gli scopi per cui si utilizzano le lingue principali. La ricerca della normalità, di una lingua che compaia su tutti i media, compresi quelli digitali, è forte in tutte le lingue considerate. C’è anche un’ampia consapevolezza del fatto che le lingue siano pienamente adatte a funzionare perfettamente sui media digitali. C’è meno accordo, invece, riguardo alla domanda se usare la lingua ufficiale sia più o meno facile che usare quella minoritaria. Questo non solo è comprensibile, ma rappresenta bene il caso di tutte quelle lingue che competono con una lingua maggioritaria, che in molti casi è la lingua nazionale, per la quale le opportunità digitali sono maggiori e più varie. In questo contesto, non sorprende che le persone considerino "più facile" l’uso della lingua ufficiale. Questa tendenza è più evidente per il bretone e il sardo che per il basco, il che è probabilmente un segno di come il basco abbia una posizione forte nella società locale come lingua della comunicazione.

Per quali motivi le lingue minoritarie non vengono usate digitalmente?

Che cosa impedisce alle persone di usare una lingua sui media e i dispositivi digitali? Tramite l’indagine di DLDP abbiamo cercato di individuare alcune delle possibili ragioni. Le risposte predefinite del questionario sono state modellate sulla base delle motivazioni più comuni riportate nella letteratura sulle lingue minoritarie:

  • (vera o presunta) mancanza di capacità personale di scrivere nella lingua, in alcuni casi dovuta alla mancanza di un’ortografia standardizzata;
  • mancanza di supporto tecnologico e/o infrastrutturale che rende l’uso digitale della lingua faticoso, difficile, lento, poco pratico;
  • paura di essere fraintesi o derisi; paura di offendere altre persone;
  • una qualche forma di “stigma linguistico”, ovvero la convinzione che la lingua non debba essere usata al di fuori del contesto privato e parlato.

Per il basco ed il bretone, la percentuale di persone che hanno risposto di non usare la lingua per scopi digitali è molto bassa, e per questo le loro risposte non saranno discusse in questa sede. Per quanto riguarda il sardo, i due motivi più ricorrenti sono state la mancanza di competenza scritta della lingua e l’idea che il sardo sia una lingua non usata per scrivere, ma solo per parlare. Altre risposte chiaramente correlate sono state l’indisponibilità di correttori ortografici e la paura di non essere compresi. Nel caso del careliano, i fattori psicologici tendono a prevalere su quelli tecnologici: la percezione di una mancanza di capacità di scrittura nella lingua, la paura di essere presi in giro o di provocare un’offesa sono spesso segnalati come motivi per non usare il careliano per la comunicazione elettronica.

Le persone tendono a giustificare quello che percepiscono come una scarsa competenza nell’ortografia della lingua perpetuando l’errata rappresentazione della lingua come puramente o prevalentemente orale. La loro scarsa competenza può essere reale, oppure può darsi che venga attuata una sorta di autocensura. I parlanti sardi riferiscono anche della mancanza di un’ortografia standardizzata, una realtà ben nota per la lingua. A quanto pare, lo stigma esterno non viene mai riportato come motivo, il che potrebbe benissimo essere il caso, con uno stigma autoindotto più forte di quello proveniente dall’esterno. Ma potrebbe anche accadere, come è frequente nei questionari qualitativi, che gli intervistati tendano a negare di subire uno stigma dall’esterno e preferiscano descrivere la loro mancanza di uso della lingua come una scelta personale e indipendente.

Che cosa serve?

Quando una lingua mostra di non possedere tutto l’armamentario digitale, si sarebbe tentati di offrire qualsiasi prodotto o servizio. Ma cosa sappiamo veramente dei desideri e delle esigenze di chi parla quelle lingue? Le esigenze di una lingua che è parlata poco, e magari soprattutto dagli anziani, non possono essere le stesse di una comunità vivace, dove la lingua è sostenuta istituzionalmente e diffusa anche tra i bambini. Ignorare queste esigenze non solo non è corretto, ma è anche controproducente: una tecnologia che viene fornita troppo presto a una comunità di parlanti rischia di non essere utilizzata. È uno spreco di risorse e può scoraggiare ulteriormente l’uso della lingua. L’indagine del progetto DLDP ci ha offerto una visione privilegiata delle esigenze e delle aspettative di quattro comunità di parlanti molto diverse tra loro. Ai due estremi ci sono il basco e il careliano: una lingua forte, molto parlata, con una comunità impegnata da una parte e una lingua sparsa tra parlanti isolati, con poche opportunità di parlare la lingua al di fuori dei contesti familiari, dall’altra. Le loro esigenze non possono essere simili. Le richieste dei parlanti baschi sono chiare e mostrano fiducia in se stessi e conoscenza delle possibilità digitali della lingua. La prima richiesta riguarda strumenti di traduzione affidabili da e verso la lingua inglese senza dover passare per lo spagnolo. Una seconda preoccupazione è legata alla scarsa disponibilità di strumenti e interfacce tradotte e localizzate in basco, come iOS di Apple o MacOS. Le traduzioni devono essere di buona qualità: è preferibile utilizzare un’interfaccia in inglese o in spagnolo rispetto a una traduzione scadente in basco. Un’altra richiesta è la fornitura di prodotti digitali per bambini e ragazzi, in quanto i giovani tendono a usare videogiochi e a utilizzare applicazioni solo in inglese o in spagnolo, e la mancanza di prodotti di buona qualità in basco mirati per la loro età è un altro fattore che li scoraggia dall’utilizzare la lingua. Questa è anche la ragione principale della necessità di avere i sistemi Android e iOS localizzati: dato che sono parte integrante della vita di tutti, l’assenza del basco sugli smartphone può avere importanti conseguenze sulla percezione della lingua da parte dei giovani adulti.

I parlanti careliani, invece, si rivolgono alle tecnologie digitali per cercare opportunità di utilizzo o di apprendimento della lingua. In base alle loro risposte, anche un gruppo di Facebook potrebbe essere sufficiente. Questo è compatibile con il contesto sociolinguistico: il careliano è una lingua non territoriale che oggi viene parlata in diverse parti della Finlandia, e la trasmissione intergenerazionale complessiva è stata interrotta dopo la seconda guerra mondiale. I parlanti del careliano sono desiderosi di entrare in contatto con gli altri parlanti, ma per farlo devono superare la diversità delle varianti e la mancanza di uno standard comune concordato. Questo è un requisito che viene prima di qualsiasi uso digitale della lingua, ma è fortemente connesso ad essa: chi non è sicuro di sé per iscritto difficilmente si esporrà sui media digitali, dove la comunicazione è ancora prevalentemente fatta per iscritto.

Questo punto di vista è condiviso anche da coloro che parlano il sardo, una lingua minoritaria parlata sull’Isola di Sardegna, in Italia. Nonostante sia ufficialmente riconosciuta, la lingua è ancora percepita come frammentata in molteplici varianti e uno standard ortografico è disponibile, ma non diffuso. Per questo motivo i parlanti sottolineano la necessità di una presenza più forte della lingua nella scuola e nella vita pubblica quotidiana e di un’ortografia standardizzata. È interessante notare come il sardo appaia abbastanza ben dotato di media digitali e di software per l’elaborazione della lingua. In quanto tale, il suo potenziale è buono e i suoi parlanti hanno bisogno soprattutto di incoraggiamento e sostegno per utilizzare la lingua nel suo complesso. Una volta rimosse le barriere psicologiche, l’uso digitale sarà probabilmente un’evoluzione naturale. In una situazione del genere, azioni volte a promuovere la conoscenza delle opportunità esistenti per l’uso digitale del linguaggio possono essere più utili dello sviluppo di una nuova tecnologia.

Per quanto riguarda il bretone, la maggior parte degli intervistati è a conoscenza dell’esistenza di una Wikipedia in bretone, con un 19% di essi che vi contribuisce anche attraverso la modifica di articoli esistenti o la scrittura di nuovi articoli (8%). Mentre le basi digitali sono saldamente al loro posto, spicca la relativa mancanza (o la mancanza di consapevolezza) di servizi avanzati, applicazioni e software localizzati. Allo stesso tempo, gli intervistati mostrano un forte desiderio in questa direzione. Ad esempio, la traduzione automatica è quasi del tutto assente, ad eccezione della traduzione online del bretone in francese offerta da Ofis ar Brezhoneg; Google Translate non è ancora disponibile per il bretone. Se le applicazioni più popolari e le interfacce software chiave non saranno presto disponibili in bretone, non potendo competere con le applicazioni in francese, la lingua apparirà inevitabilmente meno attraente per le giovani generazioni.

Generalizzando, i parlanti di lingue minoritarie sottolineano la mancanza di un sito o di una piattaforma di riferimento in cui siano raccolti tutti i servizi, i siti, le applicazioni ma anche film, libri, musica, ecc. disponibili nella lingua minoritaria. La mancanza di informazioni sembra essere uno dei principali problemi che riguardano l’uso digitale di queste lingue: ad esempio, spesso i parlanti non sono nemmeno a conoscenza della disponibilità di un dispositivo, di un sito o di una risorsa (come nel caso di Wikipedia, ad esempio).

Conclusioni

“Se non andiamo avanti nel mondo digitale, molti giovani rifiuteranno il basco, e così stanno le cose al momento". Queste sono le parole di un parlante basco che commenta il sondaggio del progetto DLDP. Le tecnologie digitali sono certamente uno strumento estremamente importante per la rivitalizzazione e il recupero della lingua. Tuttavia, in questo breve saggio vogliamo sottolineare l’importanza di una stretta collaborazione dell’industria e del mondo accademico da un lato con le comunità di parlanti dall’altro. I parlanti di lingue minoritarie non hanno bisogno di soluzioni preconfezionate: le loro precise esigenze e necessità devono essere ascoltate e inserite in prodotti che siano adattati a tali esigenze. I contesti socio-linguistici delle varie lingue minoritarie possono essere molto diversi tra loro, così come le soluzioni che vengono fornite. Usando le parole di John Hobson: "Internet e il mondo digitale non possono salvarci. Non possono salvare le lingue indigene. Certo, queste cose hanno dei benefici, ma non sono il Messia. Non abbiamo bisogno di un altro sito web o di un DVD o di un’applicazione multimediale, queste sono soluzioni a breve termine e di pronto intervento. Ciò di cui abbiamo veramente bisogno sono iniziative sostenibili, per creare opportunità per gli utenti delle lingue indigene di comunicare tra loro nella loro lingua madre. Per far sì che le persone parlino di nuovo”.

I dati del sondaggio sono disponibili con licenza CC-BY 4.0 license e sono depositati nell’archivio ILC4CLARIN 6.

Riferimenti


  1. https://ars.electronica.art/aeblog/en/2017/08/29/how-culture-shapes-technology/ ↩︎

  2. http://www.meta-net.eu/whitepapers/overview ↩︎

  3. La traduzione automatica consente di tradurre automaticamente un testo da una lingua (lingua sorgente) ad un’altra (lingua target). Vedi https://en.wikipedia.org/wiki/Machine_translation ↩︎

  4. Il riconoscimento vocale è la tecnologia che consente di trascrivere automaticamente il parlato riconoscendo parole e gruppi di parole. Vedi https://en.wikipedia.org/wiki/Speech_recognition ↩︎

  5. https://wp.dldp.eu ↩︎

  6. http://hdl.handle.net/20.500.11752/ILC-777 ↩︎