Bienvenue sur le premier état des lieux des langues d’Internet !

Actuellement, Internet et ses différents espaces numériques représentent l’une des infrastructures les plus essentielles pour diffuser des savoirs, communiquer et agir. Pourtant, parmi les 7000 langues parlées et signées dans le monde, de combien pouvons-nous faire véritablement l’expérience en ligne ?

Nous sommes un collectif de trois organisations — Whose Knowledge?, l’Oxford Internet Institute et le Centre for Internet and Society (Inde) —, ainsi qu’un ensemble de personnes et de communautés du monde entier, qui essayons de répondre à cette question et de proposer différents points de vue, expériences et analyses des langues sur Internet.

Ce rapport décrit les manières dont les langues sont représentées sur Internet, sensibilise à la nécessité d’un Internet plus multilingue et propose un programme d’action. Nous appelons de multiples générations et communautés à rejoindre nos efforts, et espérons que cette initiative sera le point de départ pour des recherches et actions futures.

Résumé

Ce rapport est conçu pour le « numérique d’abord », c’est-à-dire que le meilleur moyen de le lire, de l’écouter et d’en tirer des connaissances est de le consulter via ce site Web. La version numérique est la plus adaptée, car le rapport est composé de différents niveaux et couches. Nous combinons des Chiffres, qui offrent une perspective statistique et une vue d’ensemble du statut des langues en ligne, et des Histoires qui nous permettent de mieux comprendre à quel point il est facile ou difficile pour les gens d’utiliser Internet dans leurs propres langues.

Dans cette synthèse, nous explorons les inégalités géographiques et numériques du savoir, ainsi que les sujets de la prise en charge linguistique et du contenu en ligne. Nous présentons ce que nous avons appris sur l’Internet multilingue et ce que nous pouvons améliorer, en nous intéressant de près aux dynamiques de pouvoir établies et aux moyens d’aller de l’avant.

Histoires

Cette section nous donne une compréhension approfondie de la manière dont différentes personnes et communautés du monde font l’expérience d’Internet dans leurs propres langues. À quel point notre accès au web est-il véritable et équitable ? Sommes-nous en mesure de créer et produire des savoirs publics en ligne dans une proportion égale à notre consommation ?

Nous avons recueilli ces histoires sous forme écrite et orale, notamment des textes et des entretiens audio et vidéo. Dans cette section, vous trouverez des contributions sur des langues autochtones d’Afrique, des Amériques et d’Australie, telles que le chindali, le cri, l’ojibwé, le mapudungun, le zapotèque et l’arrernte. Vous lirez des contributions sur des langues minoritaires comme le breton, le basque, le sarde et le carélien en Europe, ainsi que sur des langues dominantes aux niveaux régional ou mondial comme le bengali, l’indonésien et le cinghalais en Asie et différentes formes d’arabe en Afrique du Nord.

Chiffres

Nos chiffres analysent plusieurs problématiques linguistiques critiques sur certains appareils, plateformes et applications numériques que nous utilisons tous les jours. Ici, vous trouverez des analyses et des visualisations de données utilisant des jeux de données et supports ouverts et disponibles au public. Nous avons analysé la prise en charge linguistique proposée par 11 sites Web, 12 applications Android et 16 applications iOS. Dans cette analyse, les plateformes ont été classées en quatre catégories : accès au savoir, apprentissage des langues, réseaux sociaux et messagerie privée et de groupe. En complément d’une enquête plus générale sur les plateformes, nous analysons en profondeur deux sites : Google Maps et Wikipédia.

Les résultats sont présentés en détail dans cette section, ainsi que les contraintes méthodologiques et les possibilités de recherches futures.