Kyberturvallisuus
Deepfaked Ääni Mahdollisti 35 Miljoonan Dollarin Pankkiryöstön Vuonna 2020

Tutkinta, joka koski 35 miljoonan Yhdysvaltain dollarin petosta Yhdistyneiden Arabiemiraattien pankista tammikuussa 2020, on paljastanut, että deepfake-ääniTeknologiaa käytettiin jäljittelemään yhtiön johtajan ääntä, joka oli tuttu pankin konttorin johtajalle, joka sitten hyväksyi transaktiot.
Rikos tapahtui 15. tammikuuta viime vuonna, ja se on kuvattu pyynnössä (PDF) Yhdistyneiden Arabiemiraattien viranomaisilta Yhdysvaltain viranomaisille apua jäljittämään osaa siirtämistä varoista, jotka lähetettiin Yhdysvaltoihin.
Pyynnössä todetaan, että pankin konttorin johtaja Yhdistyneissä Arabiemiraateissa vastaanotti puhelun tutulta ääneltä, joka yhdessä asianajaja Martin Zelnerin lähettämien sähköpostien kanssa vakuutti johtajan siirtämään varat, jotka olivat ilmeisesti tarkoitettu yhtiön hankkimiseen.
Pyynnössä todetaan:
‘Yhdistyneiden Arabiemiraattien viranomaisten mukaan 15. tammikuuta 2020 uhriyhtiön konttorin johtaja vastaanotti puhelun, joka väitti olevan yhtiön pääkonttorista. Puhuja kuulosti yhtiön johtajalta, joten konttorin johtaja uskoi puhelun olevan legitiimi.
‘Konttorin johtaja vastaanotti myös useita sähköposteja, joita hän uskoi olevan yhtiön johtajalta, ja ne liittyivät puheluun. Puhuja kertoi konttorin johtajalle puhelimessa ja sähköpostitse, että uhriyhtiö oli hankkimassa toista yhtiötä, ja että asianajaja Martin Zelner (Zelner) oli valtuutettu koordinoimaan hankintamenettelyjä.’
Konttorin johtaja vastaanotti sitten sähköpostit Zelneriltä yhdessä (väitetyn) johtajan kirjeen kanssa, jonka ääni oli tuttu uhriksi joutuneelle.
Deepfake-Ääni-Petos Tunnistettu
Yhdistyneiden Arabiemiraattien tutkijat osoittivat sitten, että deepfake-ääni-kloonausteknologiaa oli käytetty jäljittelemään yhtiön johtajan ääntä:
‘Yhdistyneiden Arabiemiraattien tutkimus paljasti, että syytetyt olivat käyttäneet “deep voice” -tekniikkaa simuloimaan johtajan ääntä. Tammikuussa 2020 varoja siirrettiin uhriyhtiöstä useisiin pankkitileihin muissa maissa monimutkaisessa huijauksessa, johon osallistui vähintään 17 tunnettua ja tuntematonta syytettyä. Yhdistyneiden Arabiemiraattien viranomaiset jäljittivät rahaliikkeitä useiden tiliten kautta ja tunnistivat kaksi transaktiota Yhdysvaltoihin.
’22. tammikuuta 2020 kaksi siirtoa, 199 987,75 Yhdysvaltain dollaria ja 215 985,75 Yhdysvaltain dollaria, lähetettiin kahten syytetyistä Centennial Bankin tilinumeroihin xxxxx7682 ja xxxxx7885 Yhdysvalloissa.’
Lisätietoja rikoksesta ei ole saatavilla, ja se on toinen tunnettu tapaus äänipohjaisesta deepfake-taloudellisesta petoksesta. Ensimmäinen tapaus tapahtui yhdeksän kuukautta aikaisemmin, maaliskuussa 2020, kun Yhdistyneen kuningaskunnan energiayhtiön johtaja joutui puheluihin, joissa kuulosti hänen esimieheltään, joka vaati kiireellistä 220 000 euron ($243 000) siirtoa, jonka työntekijä sitten suoritti.
Äänen Kloonauksen Kehitys
Deepfake-ääni-kloonaus käsittää koneoppimismallin kouluttamisen sadoilla tai tuhansilla “kohde”-äänen (äänen, jota jäljitellään) näytteillä. Tarkin vastine saadaan kouluttamalla kohdeääntä suoraan henkilön ääntä vastaan, joka puhuu ehdotetussa tilanteessa, vaikka malli on “yliopittu” henkilölle, joka jäljittelee kohdeääntä.
Aktiivisin legitiimi verkkoyhteisö äänen kloonauksen kehittäjille on Audio Fakes Discord-palvelin, jossa on foorumit useille deepfake-ääni-kloonausalgoritmeille, kuten Google Tacotron-2, Talknet, ForwardTacotron, Coqui-ai-TTS ja Glow-TTS, muun muassa.
Reaaliaikaiset Deepfakes
Koska puhelinkeskustelu on välttämättä interaktiivinen, äänen kloonauspetosta ei voida järkevästi tehdä “valmiilla” laadukkailla ääniklippeillä, ja molemmissa äänen kloonauspetoksissa voidaan olettaa, että puhuja käyttää live-, reaaliaikaista deepfake-kehystä.
Reaaliaikaiset deepfakes ovat tulleet keskustelun aiheeksi viime aikoina DeepFaceLiven myötä, joka on reaaliaikainen toteutus suositusta deepfake-paketti DeepFaceLabista, joka voi asettaa julkkisten tai muiden identiteettejä live-webcam-kuvamateriaaliin. Vaikka Audio Fakes Discordissa ja DeepFaceLab Discordissa olevat käyttäjät ovat kiinnostuneita yhdistämään nämä kaksi teknologiaa yhteen video- ja ääni-live-deepfake-arkkitehtuuriin, ei sellaista tuotetta ole vielä julkaistu.










