Suivez nous sur

L’IA générative n’est pas une condamnation à mort pour les langues en danger

Des leaders d'opinion

L’IA générative n’est pas une condamnation à mort pour les langues en danger

mm

Selon l'UNESCO, jusqu'à la moitié des langues pourraient disparaître d'ici 2100. De nombreuses personnes affirment que l'IA générative contribue à ce processus.

Le déclin de la diversité linguistique n’a pas commencé avec l’IA ni avec Internet. Mais l'IA is en mesure d’accélérer la disparition des langues autochtones et à faibles ressources.

La plupart des plus de 7,000 XNUMX langues parlĂ©es dans le monde ne disposent pas de ressources suffisantes pour former des modèles d’IA, et nombre d’entre elles n’ont pas de forme Ă©crite. Cela signifie que quelques langues majeures dominent le stock de donnĂ©es potentielles de formation Ă  l'IA de l'humanitĂ©, tandis que la plupart risquent d'ĂŞtre laissĂ©es pour compte dans la rĂ©volution de l'IA et pourraient disparaĂ®tre complètement.

La raison simple est que la plupart des données de formation à l’IA disponibles sont en anglais. L'anglais est le principal moteur des grands modèles linguistiques (LLM), et les personnes qui parlent des langues moins courantes se retrouvent sous-représentées dans la technologie de l'IA.

Considérer ces statistiques du Forum économique mondial:

  • Les deux tiers de tous les sites Web sont en anglais.
  • Une grande partie des donnĂ©es dont GenAI apprend sont extraites du Web.
  • Moins de 20 % de la population mondiale parle anglais.

À mesure que l’IA s’intègre de plus en plus dans notre vie quotidienne, nous devrions tous réfléchir à l’équité linguistique. L’IA possède un potentiel sans précédent pour résoudre des problèmes à grande échelle, et ses promesses ne devraient pas se limiter au monde anglophone. L'IA crée des commodités et des outils qui améliorent la vie personnelle et professionnelle des habitants des pays riches et développés.

Les locuteurs de langues à faibles ressources sont habitués à constater un manque de représentation dans le domaine technologique, qu'il s'agisse de ne pas trouver de sites Web dans leur langue ou de ne pas faire reconnaître leur dialecte par Siri. Une grande partie du texte qui is disponibles pour former l’IA dans des langues à faibles ressources sont de mauvaise qualité (lui-même traduit avec une précision douteuse) et de portée limitée.

Comment la sociĂ©tĂ© peut-elle garantir que les langues Ă  faibles ressources ne soient pas exclues de l’équation de l’IA ? Comment pouvons-nous garantir que la langue ne constitue pas un obstacle aux promesses de l’IA ?

Dans un effort vers l'inclusivitĂ© linguistique, certains acteurs technologiques majeurs ont lancĂ© des initiatives pour former d'Ă©normes modèles linguistiques multilingues (MLM). Microsoft Translate, par exemple, s’est engagĂ© Ă  prendre en charge « toutes les langues, partout ». Et Meta a la promesse « Aucune langue laissĂ©e de cĂ´tĂ© Â». Ces propositions sont louables, mais sont-elles rĂ©alistes ?

Aspirer à un modèle unique qui gère toutes les langues du monde favorise les privilégiés car il existe des volumes de données bien plus importants sur les principales langues du monde. Lorsque nous commençons à travailler avec des langues à faibles ressources et des langues avec des écritures non latines, la formation des modèles d'IA devient plus ardue, plus longue et plus coûteuse. Considérez-le comme une taxe involontaire sur les langues sous-représentées.

Progrès de la technologie vocale

Les modèles d’IA sont en grande partie formés sur le texte, ce qui favorise naturellement les langues ayant des réserves de contenu textuelle plus profondes. La diversité linguistique serait mieux prise en charge par des systèmes qui ne dépendent pas du texte. À une certaine époque, l’interaction humaine était entièrement basée sur la parole, et de nombreuses cultures conservent cette orientation orale. Pour mieux répondre à un public mondial, l’industrie de l’IA doit passer des données textuelles aux données vocales.

La recherche fait d’énormes progrès dans le domaine des technologies vocales, mais elle reste encore à la traîne par rapport aux technologies basées sur le texte. La recherche sur le traitement de la parole progresse, mais la technologie de parole directe est loin d’être mature. La réalité est que l’industrie a tendance à évoluer avec prudence, et seulement une fois qu’une technologie atteint un certain niveau.

La nouvelle plateforme d'interprétation GlobalLink Live de TransPerfect utilise à nouveau les formes les plus matures de technologie vocale – reconnaissance automatique de la parole (ASR) et synthèse vocale (TTS), car les systèmes de synthèse vocale directe ne sont pas encore assez matures. . Cela étant dit, nos équipes de recherche se préparent pour le jour où les pipelines entièrement parole-parole seront prêts à être diffusés aux heures de grande écoute.

Parole-à-parole modèles de traduction offrent d’énormes promesses dans la préservation des langues orales. En 2022, Meta a annoncé le premier système de traduction parole-parole basé sur l'IA pour le hokkien, une langue principalement orale parlée par environ 46 millions de personnes dans la diaspora chinoise. Il fait partie du projet Universal Speech Translator de Meta, qui développe de nouveaux modèles d'IA qui, espère-t-il, permettront la traduction parole-parole en temps réel dans de nombreuses langues. Meta a choisi de rendre open source ses modèles de traduction Hokkien, ses ensembles de données d'évaluation et ses documents de recherche afin que d'autres puissent reproduire et développer son travail.

Apprendre avec moins

Le fait que nous, en tant que communauté mondiale, manquons de ressources pour certaines langues ne constitue pas une condamnation à mort pour ces langues. C’est là que les modèles multilingues présentent un avantage, dans la mesure où les langues apprennent les unes des autres. Toutes les langues suivent des modèles. En raison du transfert de connaissances entre les langues, le besoin de données de formation est réduit.

Supposons que vous disposiez d'un modèle qui apprend 90 langues et que vous souhaitiez ajouter l'Inuit (un groupe de langues autochtones d'Amérique du Nord). Grâce au transfert de connaissances, vous aurez besoin de moins de données inuites. Nous trouvons des moyens d’apprendre avec moins. La quantité de données nécessaires pour affiner les moteurs est moindre.

J'ai bon espoir d'un avenir avec une IA plus inclusive. Je ne crois pas que nous soyons condamnés à voir des hordes de langues disparaître, et je ne pense pas non plus que l’IA restera le domaine du monde anglophone. Nous constatons déjà une plus grande sensibilisation à la question de l’équité linguistique. De la collecte de données plus diversifiées à la création de modèles plus spécifiques à une langue, nous progressons.

Prenons le fon, une langue parlée par environ 4 millions de personnes au Bénin et dans les pays africains voisins. Il n’y a pas si longtemps, un modèle d’IA populaire décrivait le fon comme un langage fictif. Un informaticien nommé Bonaventure Dosseau, dont la mère parle le fon, était habitué à ce type d'exclusion. Dosseau, qui parle français, a grandi sans programme de traduction pour l'aider à communiquer avec sa mère. Aujourd'hui, il peut communiquer avec sa mère grâce à un traducteur fon-français qu'il a minutieusement construit. Aujourd’hui, il existe également un tout nouveau Wikipédia Fon.

Dans le but d'utiliser la technologie pour préserver les langues, l'artiste turc Refik Anadol a lancé la création d'un outil d'IA open source pour les peuples autochtones. Lors du Sommet économique mondial, il a demandé : « Comment diable pouvons-nous créer une IA qui ne connaît pas l’ensemble de l’humanité ?

Nous ne pouvons pas, et nous ne le ferons pas.

Julien Didier est vice-président de la technologie chez TransPerfect, le plus grand fournisseur mondial de solutions linguistiques et d'IA pour les entreprises mondiales. TransPerfect propose une gamme complète de services dans plus de 200 langues à ses clients du monde entier. Plus de 6,000 XNUMX organisations mondiales emploient TransPerfect
Technologie GlobalLink ® pour simplifier la gestion des contenus multilingues. TransPerfect a son siège mondial à New York, ainsi que des sièges régionaux à Londres et Hong Kong.