Connect with us

Tankeledere

Genererende AI er ikke en dødsdom for truede sprog

mm

Ifølge UNESCO, kan op til halvdelen af verdens sprog være uddøde inden 2100. Mange mennesker siger, at genererende AI bidrager til denne proces.

Declinen i sprogdiversitet startede ikke med AI – eller internettet. Men AI er i en position til at accelerere undergangen af indfødte og lavresurs-sprog.

De fleste af verdens 7.000+ sprog har ikke tilstrækkelige ressourcer til at træne AI-modeller – og mange mangler en skriftlig form. Dette betyder, at få store sprog dominerer menneskehedens lager af potentiel AI-træningsdata, mens de fleste står til at blive efterladt i AI-revolutionen – og kunne forsvinde helt.

Den simple årsag er, at det meste af den tilgængelige AI-træningsdata er på engelsk. Engelsk er den primære driver af store sprogmodeller (LLM), og mennesker, der taler mindre udbredte sprog, finder sig selv underrepræsenteret i AI-teknologi.

Overvej disse statistikker fra World Economic Forum:

  • To tredjedele af alle websites er på engelsk.
  • Meget af den data, som GenAI lærer af, er hentet fra web.
  • Færre end 20% af verdens befolkning taler engelsk.

Da AI bliver mere integreret i vores daglige liv, skal vi alle tænke på sprog-lighed. AI har en udenforstående potentiale til at løse problemer i stor skala, og dens løfte skal ikke være begrænset til den engelsktalende verden. AI skaber bekvemmeligheder og værktøjer, der forbedrer menneskers personlige og professionelle liv i rige, udviklede nationer.

Talere af lavresurs-sprog er vant til at finde en mangel på repræsentation i teknologi – fra ikke at finde websites på deres sprog til ikke at have deres dialekt genkendt af Siri. Meget af den tekst, der er tilgængelig til at træne AI i lavresurs-sprog, er af dårlig kvalitet (selv oversat med tvivlsom nøjagtighed) og smal i omfang.

Hvordan kan samfundet sikre, at lavresurs-sprog ikke bliver efterladt i AI-ligningen? Hvordan kan vi sikre, at sprog ikke er en barriere for AI’s løfte?

I et forsøg på at opnå sprog-inklusivitet har nogle store tech-spillere initiativer til at træne enorme multilinguale sprogmodeller (MLM). Microsoft Translate har for eksempel lovet at støtte “hvert sprog, overalt”. Og Meta har et “Ingen sprog tilbage” løfte. Disse er lovlige, men er de realistiske?

At stræbe efter en model, der kan håndtere hvert sprog i verden, favoriserer de privilegerede, da der er langt større mængder af data fra verdens store sprog. Når vi begynder at beskæftige os med lavresurs-sprog og sprog med ikke-latiniske skriftsystemer, bliver træningen af AI-modeller mere anstrengende, tidskrævende – og mere dyrt. Tænk på det som en ufrivillig skat på underrepræsenterede sprog.

Fremgang i tale-teknologi

AI-modeller er overvejende trænet på tekst, hvilket naturligt favoriserer sprog med dybere lagre af tekstindhold. Sprogdiversitet ville være bedre støttet med systemer, der ikke afhænger af tekst. Menneskelig interaktion var engang helt baseret på tale, og mange kulturer har beholdt denne mundtlige fokus. For bedre at betjene en global publikum må AI-industrien gå fra tekstdata til taledata.

Forskning gør store fremskridt i tale-teknologi, men den ligger stadig bagud i forhold til tekstbaserede teknologier. Forskning i talebehandling er i gang, men direkte tale-til-tale-teknologi er langt fra moden. Realiteten er, at industrien tendrer til at bevæge sig forsigtigt, og kun når en teknologi er avanceret til et visst niveau.

TransPerfect’s nyligt udgivne GlobalLink Live tolke-platform bruger de mere modne former for tale-teknologi – automatisk tale-genkendelse (ASR) og tekst-til-tale (TTS) – igen, fordi de direkte tale-til-tale-systemer ikke er modne nok på dette tidspunkt. Det skal dog siges, at vores forskningsteams er i gang med at forberede sig på den dag, hvor fuldt tale-til-tale-rører er klar til at gå i produktion.

Tale-til-tale oversættelsesmodeller tilbyder enormt løfte i bevaringen af mundtlige sprog. I 2022 annoncerede Meta den første AI-drevne tale-til-tale oversættelsessystem for Hokkien, et primært mundtligt sprog, der tales af omkring 46 millioner mennesker i den kinesiske diaspora. Det er en del af Metas Universal Speech Translator-projekt, der udvikler nye AI-modeller, som de håber vil kunne aktivere realtids tale-til-tale oversættelse på tværs af mange sprog. Meta valgte at åbne deres Hokkien-oversættelsesmodeller, evalueringssæt og forskningspapirer, så andre kan reproducere og bygge på deres arbejde.

Læring med mindre

Det faktum, at vi som en global samfund mangler ressourcer omkring visse sprog, er ikke en dødsdom for disse sprog. Dette er, hvor multilinguale modeller har en fordel, da sprogene lærer af hinanden. Alle sprog følger mønstre. På grund af vidensoverføring mellem sprog mindskes behovet for træningsdata.

Forestil dig, du har en model, der lærer 90 sprog, og du vil tilføje Inuit (en gruppe indfødte nordamerikanske sprog). På grund af vidensoverføring har du brug for mindre Inuit-data. Vi finder måder at lære med mindre. Mængden af data, der er nødvendig for at finjustere motorer, er lavere.

Jeg er optimistisk om en fremtid med mere inklusiv AI. Jeg tror ikke, vi er dømt til at se masser af sprog forsvinde – eller at AI skal forblive domænet for den engelsktalende verden. Allerede nu ser vi mere opmærksomhed omkring spørgsmålet om sprog-lighed. Fra mere divers dataindsamling til bygning af mere sprog-specifikke modeller er vi i gang med at gøre fremskridt.

Overvej Fon, et sprog, der tales af omkring 4 millioner mennesker i Benin og nærliggende afrikanske lande. Ikke så længe siden beskrev en populær AI-model Fon som et fiktivt sprog. En computervidenskabsmand ved navn Bonaventure Dosseau, hvis mor taler Fon, var vant til denne type udelukkelse. Dosseau, der taler fransk, voksede op med ingen oversættelsesprogram til at hjælpe ham med at kommunikere med sin mor. I dag kan han kommunikere med sin mor takket være en Fon-fransk oversætter, som han selv byggede. I dag findes der også en spæd Fon-Wikipedia.

I et forsøg på at bruge teknologi til at bevare sprog har den tyrkiske kunstner Refik Anadol iværksat skabelsen af et åbent AI-værktøj for indfødte folk. Ved World Economic Summit spurgte han: “Hvordan på jorden kan vi skabe en AI, der ikke kender hele menneskeheden?”

Vi kan ikke, og vi vil ikke.

Julien Didier er vicepræsident for teknologi i TransPerfect, verdens største leverandør af sprog- og AI-løsninger til globale virksomheder. TransPerfect tilbyder et fuldt udvalg af tjenester på 200+ sprog til kunder verden over. Over 6.000 globale organisationer anvender TransPerfects GlobalLink ®-teknologi til at forenkle ledelsen af multilingvalt indhold. TransPerfect har globale hovedkontorer i New York, med regionale hovedkontorer i London og Hong Kong.