Connect with us

Tankeledere

Hvem Vil Beskytte Os mod AI-Genereret Desinformation?

mm

Generativ AI er gået fra zero til hundred i under et år. Mens det er tidligt, har det vist sit potentiale til at forandre forretning. Det kan vi alle være enige om. Hvor vi divergerer er i, hvordan vi indeholder de farer det udgør. 

For at være tydelig, er jeg pro innovation, og langt fra en frygtsom. Men den seneste stigning i misinformations-aktiviteter – primært rettet mod polarisering omkring kontroversielle emner i øjeblikket – har gjort det klart, at hvis det ikke kontrolleres, kunne gen AI volde stor skade på samfundene.

Vi har set denne film før med sociale medier, men det tog år og hårde lektioner, før vi vågnede op til dets fejl. Vi har (formodentlig) lært noget. Spørgsmålet i dag er hvem der vil hjælpe med at dæmpe strømmen af virkelighedsforvrængning fra gen AI, og hvordan? 

Forudsigeligt er regeringer begyndt at handle. Europa er i spidsen for, som de har demonstreret mere og mere på regulering af tech. USA er lige bagved, med præsident Biden, der udstedte en executive ordre i oktober sidst.

Men det vil kræve en global landsby, der handler sammen for at “holde gen AI ærlig.” Og før regering kan hjælpe, har den brug for at forstå begrænsningerne af de tilgængelige tilgange.

Identitetsproblemet er blevet meget værre

I denne nye verden bliver sandheden til en nål i en høstak af meninger, der udgiver sig for at være fakta. At vide hvem indholdet kommer fra betyder mere end nogensinde. 

Og det er ikke så let som at dekretære, at hver enkelt sociale medie-konto skal være identitetsverificeret. Der er stærk modstand mod det, og i nogle tilfælde er anonymitet nødvendig for at berettiget beskytte konto-indehaverne. Desuden er mange forbrugere af det værste indhold ikke bekymret for, om det er troværdigt, eller hvor det kommer fra. 

Trods disse forbehold er identitetens potentielle rolle i at tackle gen AI underestimeret. Skeptikere, hør mig ud. 

Lad os forestille os, at regulering eller samvittighed får platforme til at give hver enkelt konto-indehaver disse valg: 

  1. Verificere deres identitet eller ej, og
  2. Offentligt afsløre deres verificerede identitet, eller blot blive mærket som “ID-verificeret”

Så kan det sociale medie-publikum bedre afgøre, hvem der er troværdig. Lige så vigtigt, om ikke mere, støtter identitet ansvarlighed. Platforme kan beslutte, hvilke handlinger der skal tages mod seriel “desinformations”-udbredere og gentagne misbrugere af AI-genereret indhold, selv hvis de dukker op under forskellige konto-navne. 

Med gen AI, der øger indsatsen, tror jeg, at identitet – at vide præcis hvem der har udgivet hvad – er kritisk. Nogle vil modsætte sig det, og identitet er ikke en omfattende løsning. I virkeligheden vil ingen løsning tilfredsstille alle interessenter. Men hvis regulering tvinger platforme til at tilbyde identitetsverificering til alle konti, er jeg overbevist om, at effekten vil være enormt positiv. 

DenModerationskonundrum

Indholdsmoderation – automatisk og menneskelig – er den sidste forsvarslinje mod uønsket indhold. Menneskelig moderation er et hårdt job, med risiko for psykologisk skade fra eksponering for det værste, menneskeheden kan tilbyde. Det er også dyrt og ofte anklaget for den fordømte censur, platforme stræber efter at reducere.

Automatisk moderation skalerer ud over menneskelig kapacitet til at tackle de enorme mængder af nyt indhold, men den fejler at forstå kontekst (memes er et almindeligt eksempel) og kulturelle nuancer. Begge former for moderation er afgørende og nødvendige, men de er kun en del af løsningen. 

Den ofte-hørte, konventionelle recept til at kontrollere gen AI er: “Sammenarbejde mellem tech-ledere, regering og civilsamfund er nødvendigt.” Sikker, men hvad specifikt?

Regeringer, for deres del, kan presse sociale og medie-platforme til at tilbyde identitetsverificering og prominently vise det på alle indlæg. Regulatorer kan også banke vejen til troværdigheds-målinger, der faktisk hjælper med at afgøre, om en kilde er troværdig. Sammenarbejde er nødvendigt for at udvikle universelle standarder, der giver specifik vejledning og retning, så den private sektor ikke behøver at gætte.

Til sidst, skal det være ulovligt at skabe ondsindet AI-udgang? Lovgivning til at forbyde indhold, der er beregnet til ulovlig aktivitet, kunne reducere mængden af giftigt indhold og lette arbejdsbyrden for moderatore. Jeg ser ikke regulering og love som i stand til at besejre desinformation, men de er essentielle i at konfrontere truslen.

Solsiden af gaden: innovation

Innovationsløftet gør mig til en optimist her. Vi kan ikke forvente, at politikere eller platform-ejere fuldt ud kan beskytte os mod AI-genereret bedrag. De efterlader en stor lukke, og det er netop det, der vil inspirere opfindelse af nye teknologier til at autentificere indhold og detektere falskneri. 

Siden vi nu kender bagsiden af sociale medier, har vi været hurtige til at realisere, at generativ AI kunne udvikle sig til at være et enormt net-negativt for menneskeheden, med dets evne til at polarisere og misinformere. 

Optimistisk ser jeg fordelene ved multi-prongede tilgange, hvor kontrolmetoder arbejder sammen, først ved kilden, begrænsning af skabelse af indhold designet til ulovlig brug. Derefter, før offentliggørelse, verificering af identiteten af dem, der afviser anonymitet. Næste, klare mærkning for at vise troværdigheds-ratings og posterens identitet eller manglen på den. Til sidst kan automatiseret og menneskelig moderation filtrere nogle af det værste ud. Jeg ville forvente, at nye autentificeringsteknologier kommer online snart. 

Tilføj det hele, og vi vil have en langt bedre, om end aldrig perfekt, løsning. I mellemtiden skal vi bygge op vores færdighedssæt til at afgøre, hvad der er ægte, hvem der fortæller sandheden, og hvem der prøver at narre os. 

Jeff Sakasegawa er Persona's Trust & Safety Arkitekt. Med over et årti lang erfaring i Trust & Safety området på virksomheder som Google, Facebook, Square og Sift, er Jeff en ekspert på Risikostyring og Overholdelse. Han er passioneret om at sikre sikre online oplevelser for alle brugere.