stubbur Hvað eru Deepfakes? - Unite.AI
Tengja við okkur

AI 101

Hvað eru Deepfakes?

mm
Uppfært on

Eftir því sem djúpfalsarnir verða auðveldari í gerð og afkastameiri er meiri athygli beint að þeim. Djúpfalsanir hafa orðið þungamiðjan í umræðum um siðfræði gervigreindar, rangar upplýsingar, hreinskilni upplýsinga og internetsins og reglugerðar. Það borgar sig að vera upplýstur um djúpfalsanir og hafa innsæi skilning á því hvað djúpfalsanir eru. Þessi grein mun skýra skilgreiningu á djúpfalsun, skoða notkunartilvik þeirra, ræða hvernig hægt er að greina djúpfalsa og kanna hvaða afleiðingar djúpfalsar hafa fyrir samfélagið.

Hvað eru Deepfakes?

Áður en haldið er áfram að ræða djúpfalsanir frekar, væri gagnlegt að taka sér smá tíma og skýra hvað „deepfakes“ eru í raun og veru. Það er töluverð ruglingur varðandi hugtakið Deepfake og oft er hugtakið ranglega notað á hvaða fölsuðu fjölmiðla sem er, óháð því hvort um raunverulegt deepfake er að ræða eða ekki. Til þess að geta talist Deepfake verður falsaði miðillinn sem um ræðir að vera búinn til með vélrænu kerfi, sérstaklega djúpt taugakerfi.

Lykilþáttur djúpfalsa er vélanám. Vélræn nám hefur gert tölvum kleift að búa til myndband og hljóð sjálfkrafa tiltölulega fljótt og auðveldlega. Djúp tauganet eru þjálfuð á myndefni af raunverulegri manneskju til þess að netið geti lært hvernig fólk lítur út og hreyfir sig við markmið umhverfisaðstæðna. Þjálfað netið er síðan notað á myndir af öðrum einstaklingi og aukið með viðbótar tölvugrafíktækni til að sameina nýja manneskjuna með upprunalegu myndefninu. Kóðunaralgrím er notað til að ákvarða líkindin á milli upprunalegu andlitsins og markandlitsins. Þegar sameiginlegir eiginleikar andlitanna hafa verið einangraðir er notað annað gervigreind reiknirit sem kallast afkóðari. Afkóðarinn skoðar kóðuðu (þjappaðar) myndirnar og endursmíðar þær út frá eiginleikum upprunalegu myndanna. Tveir afkóðarar eru notaðir, annar á andlit upprunalega myndefnisins og hinn á andliti markmannsins. Til þess að hægt sé að gera skiptin er afkóðaranum sem er þjálfaður á myndum af manneskju X gefið myndum af manneskju Y. Niðurstaðan er sú að andlit manneskju Y er endurgerð yfir svipbrigði og stefnu manneskju X.

Eins og er tekur það enn töluverðan tíma að gera djúpfalsun. Höfundur falsans þarf að eyða löngum tíma í að stilla færibreytur líkansins handvirkt, þar sem óhagkvæmar breytur munu leiða til áberandi ófullkomleika og myndgalla sem gefa frá sér hið sanna eðli falsans.

Þó að oft sé gert ráð fyrir að flestar djúpfalsanir séu gerðar með tegund taugakerfis sem kallast a Generative Adversarial Network (GAN), margir (kannski flestir) djúpfalsanir sem eru búnar til þessa dagana treysta ekki á GAN. Þó að GAN hafi gegnt áberandi hlutverki við gerð snemma djúpfalsa, eru flest djúpfölsuð myndbönd búin til með öðrum aðferðum, samkvæmt Siwei Lyu frá SUNY Buffalo.

Það tekur óhóflega mikið magn af þjálfunargögnum til að þjálfa GAN, og GAN tekur oft miklu lengri tíma að skila mynd samanborið við aðra myndvinnslutækni. GAN eru líka betri til að búa til kyrrstæðar myndir en myndband, þar sem GAN eiga í erfiðleikum með að viðhalda samræmi frá ramma til ramma. Það er mun algengara að nota kóðara og marga afkóðara til að búa til djúpfalsa.

Til hvers eru Deepfakes notaðir?

Margar af djúpfalsunum sem finnast á netinu eru klámfengnar í eðli sínu. Samkvæmt rannsókn sem gerð var af Deeptrace, gervigreindarfyrirtæki, af um það bil 15,000 djúpfölsuðum myndböndum sem tekin voru í september 2019, voru um það bil 95% þeirra klámmynda í eðli sínu. Áhyggjuefni þessarar staðreyndar er að eftir því sem tæknin verður auðveldari í notkun gætu tilvik um falsað hefndarklám fjölgað.

Hins vegar eru ekki allar djúpar falsanir klámfengnar í eðli sínu. Það eru lögmætari notkun fyrir djúpfalsa tækni. Hljóðdjúpfölsunartækni gæti hjálpað fólki að útvarpa venjulegum röddum sínum eftir að það skemmist eða týnist vegna veikinda eða meiðsla. Einnig er hægt að nota djúpfalsa til að fela andlit fólks sem er í viðkvæmum, hugsanlega hættulegum aðstæðum, en leyfa samt að lesa varir þess og svipbrigði. Hugsanlega er hægt að nota djúpfalsa tækni til að bæta talsetningu á kvikmyndum á erlendum tungumálum, aðstoða við viðgerðir á gömlum og skemmdum miðlum og jafnvel búa til nýjan listastíl.

Non-Video Deepfakes

Þó að flestir hugsi um fölsuð myndbönd þegar þeir heyra hugtakið „djúpfölsun“, eru fölsuð myndbönd alls ekki eina tegund falsmiðla sem framleidd eru með djúpfalsatækni. Deepfake tækni er notuð til að búa til mynd- og hljóðfalsanir líka. Eins og áður hefur komið fram eru GAN oft notuð til að búa til falsaðar myndir. Talið er að það hafi verið mörg tilfelli af fölsuðum LinkedIn og Facebook prófílum sem hafa prófílmyndir búnar til með djúpfalsa reikniritum.

Það er líka hægt að búa til hljóðdeepfakes. Djúp taugakerfi eru þjálfuð til að framleiða raddklón/raddskinn af mismunandi fólki, þar á meðal frægt fólk og stjórnmálamenn. Eitt frægt dæmi um hljóð Deepfake er þegar gervigreindarfyrirtækið Dessa notað gervigreind líkan, studd af reikniritum sem ekki eru gervigreind, til að endurskapa rödd hlaðvarpsstjórans Joe Rogan.

Hvernig á að koma auga á Deepfakes

Eftir því sem djúpfalsarnir verða flóknari og flóknari verður sífellt erfiðara að greina þá frá ósviknum fjölmiðlum. Eins og er eru til nokkur merki fólk getur leitað til að ganga úr skugga um hvort myndband sé hugsanlega djúpt falsað, eins og léleg varasamstilling, óeðlilegar hreyfingar, flökt um brún andlitsins og skekkju á fínum smáatriðum eins og hári, tönnum eða endurskin. Önnur hugsanleg merki um djúpfalsun eru lélegri hluti af sama myndbandi og óreglulegt blikk í augum.

Þó að þessi merki geti hjálpað manni að koma auga á djúpfalsun í augnablikinu, þar sem djúpfalstækni bætir, gæti eini kosturinn fyrir áreiðanlega djúpfölsunargreiningu verið aðrar gerðir gervigreindar sem eru þjálfaðar til að greina falsanir frá raunverulegum fjölmiðlum.

Gervigreindarfyrirtæki, þar á meðal mörg stóru tæknifyrirtækjanna, eru að rannsaka aðferðir til að greina djúpfalsa. Í desember síðastliðnum var hafin áskorun um deepfake uppgötvun, studd af þremur tæknirisum: Amazon, Facebook og Microsoft. Rannsóknarteymi víðsvegar að úr heiminum unnu að aðferðum til að greina djúpfalsa og kepptust við að þróa bestu greiningaraðferðirnar. Aðrir hópar vísindamanna, eins og hópur sameinaðra vísindamanna frá Google og Jigsaw, eru að vinna að tegund af „andlitsréttarfræði“ sem getur greint myndbönd sem hafa verið breytt, gera gagnasöfn sín opin uppspretta og hvetja aðra til að þróa djúpfalsar uppgötvunaraðferðir. Fyrrnefnd Dessa hefur unnið að því að betrumbæta djúpfölsunarskynjunartækni og reynt að tryggja að uppgötvunarlíkönin virki á djúpfölsuð myndbönd sem finnast í náttúrunni (úti á netinu) frekar en bara á fyrirfram samsettum þjálfunar- og prófunargagnasöfnum, eins og opnum gagnasöfnum. Google veitti.

Það eru einnig aðrar aðferðir sem verið er að rannsaka til að takast á við útbreiðslu djúpfalsa. Til dæmis er ein aðferðin að athuga hvort myndbönd séu í samræmi við aðrar heimildir. Hægt er að leita að myndbandi af atburðum sem hugsanlega eru teknir frá öðrum sjónarhornum, eða hægt er að athuga bakgrunnsupplýsingar myndbandsins (eins og veðurmynstur og staðsetningar) fyrir ósamræmi. Fyrir utan þetta, Blockchain netbókarkerfi gæti skráð myndbönd þegar þau eru upphaflega búin til, haldið upprunalegu hljóði og myndum þannig að alltaf sé hægt að athuga afleidd myndbönd fyrir meðferð.

Þegar öllu er á botninn hvolft er mikilvægt að áreiðanlegar aðferðir til að greina djúpfalsa séu búnar til og að þessar greiningaraðferðir fylgi nýjustu framförum í djúpfalstækni. Þó að það sé erfitt að vita nákvæmlega hver áhrif djúpfalsa verða, ef ekki eru til áreiðanlegar aðferðir til að greina djúpfölsun (og annars konar falsmiðla), gætu rangar upplýsingar hugsanlega rutt sér til rúms og dregið úr trausti fólks á samfélaginu og stofnunum.

Afleiðingar Deepfakes

Hverjar eru hætturnar af því að leyfa djúpum falsum að fjölga sér óheft?

Eitt stærsta vandamálið sem djúpfalsanir skapa um þessar mundir er klám án samþykkis, hannað með því að sameina andlit fólks við klámmyndbönd og myndir. Siðfræðingar gervigreindar hafa áhyggjur af því að djúpfalsanir muni sjá meira gagn við að búa til falsað hefndarklám. Fyrir utan þetta gætu djúpfalsanir verið notaðar til að leggja í einelti og skaða orðspor nánast hvers sem er, þar sem þeir gætu verið notaðir til að setja fólk í umdeildar og málamiðlanir.

Fyrirtæki og netöryggissérfræðingar hafa lýst yfir áhyggjum af notkun djúpfalsa til að auðvelda svindl, svik og fjárkúgun. Að sögn hefur djúpfalsað hljóð verið notað til að sannfæra starfsmenn fyrirtækis til að flytja peninga til svindlara

Það er mögulegt að djúpfalsanir gætu haft skaðleg áhrif jafnvel umfram þau sem talin eru upp hér að ofan. Djúpfalsar gætu hugsanlega rýrt traust fólks á fjölmiðlum almennt og gert fólki erfitt fyrir að greina á milli raunverulegra frétta og falsfrétta. Ef mörg myndbönd á vefnum eru fölsuð verður auðveldara fyrir stjórnvöld, fyrirtæki og aðra aðila að draga í efa lögmætar deilur og siðlausa vinnubrögð.

Þegar kemur að ríkisstjórnum geta djúpfalsanir jafnvel ógnað starfsemi lýðræðis. Lýðræði krefst þess að borgarar geti tekið upplýstar ákvarðanir um stjórnmálamenn byggðar á áreiðanlegum upplýsingum. Rangar upplýsingar grafa undan lýðræðislegum ferlum. Til dæmis birtist forseti Gabon, Ali Bongo, í myndbandi þar sem reynt var að fullvissa Gabon borgara. Gert var ráð fyrir að forsetinn væri illa haldinn í langan langan tíma og skyndilega birtist hann inn líklega falsað myndband hóf valdaránstilraun. Donald Trump forseti hélt því fram að hljóðupptaka af honum sé að monta sig af því að grípa konur í kynfærin var falsaðþrátt fyrir að hafa einnig lýst því sem „búningsklefaspjalli“. Andrew prins líka hélt því fram að mynd sem lögmaður Emily Maitilis gaf upp væri fölsuð, þó að lögmaðurinn hafi krafist áreiðanleika þess.

Að lokum, þó að það sé lögmæt notkun fyrir djúpfalsa tækni, þá eru margir hugsanlegir skaðar sem geta stafað af misnotkun á þeirri tækni. Af þeim sökum er afar mikilvægt að aðferðir til að ákvarða áreiðanleika fjölmiðla séu búnar til og viðhaldið.