Mesterséges Intelligencia

Mélyhamisított adatforrások azonosítása mesterséges intelligencia alapú címkézéssel

korszerűsített on December 9, 2022

A kínai, szingapúri és egyesült államokbeli kutatók együttműködése során olyan ellenálló rendszert hoztak létre az arcfotók „címkézésére”, amelyek olyan robusztusak, hogy az azonosító markerek nem semmisülnek meg deepfake képzési folyamat, megnyitva az utat a szellemi tulajdonjogok iránti követelések előtt, amelyek alááshatják a szintetikus képgeneráló rendszerek azon képességét, hogy „anonimizálják” az illegitim módon lekapart forrásadatokat.

A rendszer, cím FakeTagger, kódoló/dekódoló folyamatot használ, hogy vizuálisan észrevehetetlen azonosító információkat ágyazzon be a képekbe, elég alacsony szinten ahhoz, hogy a beadott információ alapvető arcjellemző adatként legyen értelmezve, és így átkerüljön. absztrakció sértetlen folyamatok, ugyanúgy, mint például a szem vagy a száj adatai.

A FakeTagger architektúra áttekintése. A forrásadatok egy „redundáns” arcjellemző létrehozására szolgálnak, figyelmen kívül hagyva a háttérelemeket, amelyeket egy tipikus mélyhamisítási munkafolyamat takar el. Az üzenet a folyamat másik végén visszaállítható, és egy megfelelő felismerési algoritmussal azonosítható. Forrás: http://xujuefei.com/felix_acmmm21_faketagger.pdf

A kutatás a vuhani Kibertudományi és Mérnöki Iskolától, a Kínai Oktatási Minisztérium Repülési Információbiztonsági és Megbízható Számítástechnikai Laboratóriumától, az amerikai Alibaba Grouptól, a bostoni Northeastern Egyetemtől és a szingapúri Nanyang Technológiai Egyetemtől származik.

A FakeTaggerrel végzett kísérleti eredmények akár csaknem 95%-os újraazonosítási arányt jeleznek a mélyhamisítási módszerek négy általános típusában: identitáscsere (pl. DeepFaceLab, arccsere); arc újrajátszása; attribútumok szerkesztése; és a teljes szintézis.

A mélyhamisítás észlelésének hiányosságai

Bár az elmúlt három év hozta a termés A mélyhamisítási módszertanok új megközelítései közül ezek a megközelítések kulcsfontosságúak a mélyhamisítási munkafolyamatok orvosolható hiányosságaiban, mint pl. szem-csillanás alulképzett modellekben, és pislogás hiánya a korábbi mélyhamisításokban nem megfelelően változatos arc-készletekkel. Amint új kulcsokat azonosítanak, az ingyenes és nyílt forráskódú szoftverek tárháza vagy szándékosan, vagy a mélyhamisítási technikák fejlesztésének melléktermékeként elkerülte őket.

Az új tanulmány megjegyzi, hogy a Facebook legutóbbi mélyhamisítás-észlelési versenyén (DFDC) kifejlesztett leghatékonyabb utólagos detektálási módszer 70%-os pontosságra korlátozódik a mélyhamisítások vadonban történő észlelése szempontjából. A kutatók ezt a reprezentatív kudarcot rossz általánosításnak tulajdonítják az új és újító GAN és kódoló/dekódoló mélyhamisítási rendszerek, valamint a mélyhamisítások gyakran leromlott minősége.

Utóbbi esetben ennek oka lehet a mélyhamisítók rossz minőségű munkája, vagy olyan tömörítési műtermékek, amikor a videókat olyan megosztó platformokra töltik fel, amelyek célja a sávszélesség korlátozása, és a videók újrakódolása a beküldötteknél drasztikusan alacsonyabb bitsebességgel. . Ironikus módon nem csak ez a képromlás nem zavarja a mélyhamisítás látszólagos hitelességét, de valójában fokozhatja az illúziót, mivel a mélyhamisított videó egy általános, gyenge minőségű vizuális idiómába kerül, amelyet hitelesnek tekintenek.

Túlélhető címkézés a modell inverziójának segédeszközeként

A gépi tanulási eredményekből származó forrásadatok azonosítása viszonylag új és egyre növekvő terület, amely lehetővé teszi az IP-alapú peres eljárások új korszakát, ahogyan a kormányok jelenlegi megengedő A képernyőkaparásra vonatkozó szabályozások (amelyek célja, hogy ne fojtsák el a nemzeti kutatás elsőbbségét a mesterséges intelligencia globális fegyverkezési versenyével szemben) szigorúbb jogszabályokká alakulnak, ahogy az ágazat kereskedelmi forgalomba kerül.

Modell inverzió a szintézis rendszerek által generált kimenetből származó forrásadatok feltérképezésével és azonosításával foglalkozik számos területen, beleértve a Natural Language Generation (NLG) és a képszintézist. A modell inverziója különösen hatékony olyan arcok újraazonosítására, amelyek elmosódottak, pixelesek voltak, vagy átjutottak egy generatív ellenséges hálózat vagy kódoló/dekódoló transzformációs rendszer, például a DeepFaceLab absztrakciós folyamatán.

A célzott címkézés hozzáadása az új vagy meglévő arcképekhez potenciálisan új segítséget jelenthet az inverziós technikák modellezéséhez. vízjellel egy kialakuló mező.

Post-Facto Tagging

A FakeTagger utófeldolgozási megközelítésnek készült. Például, amikor a felhasználó feltölt egy fényképet egy közösségi hálózatra (ami általában valamilyen optimalizálási folyamatot, és ritkán az eredeti kép közvetlen és hamisítatlan átvitelét is magában foglalja), az algoritmus a képet úgy dolgozza fel, hogy állítólag kitörölhetetlen tulajdonságokat alkalmazzon az arcra. .

Alternatív megoldásként az algoritmus a történelmi képgyűjtemények között is alkalmazható, ahogy az az elmúlt húsz év során többször is megtörtént, ahogyan a nagy stock fotó- és kereskedelmi képgyűjtő oldalak igyekeztek. mód az engedély nélkül újrafelhasznált tartalom azonosítására.

A FakeTagger a különböző mélyhamisítási folyamatokból helyreállítható azonosító jellemzőket igyekszik beágyazni.

Fejlesztés és tesztelés

A kutatók a FakeTaggert számos mélyhamis szoftveralkalmazással tesztelték a fent említett négy megközelítésben, beleértve a legszélesebb körben használt adattárat, a DeepFaceLabot; Stanfordé Face2face., amely képes átvinni az arckifejezéseket képek és identitások között; és STGAN, amely képes szerkeszteni az arc tulajdonságait.

A tesztelés megtörtént CelebA-HQ, egy népszerű kapart nyilvános adattár, amely hírességek 30,000 1024 arcképét tartalmazza különböző felbontásban, akár 1024 x XNUMX képpontig.

Kiindulópontként a kutatók kezdetben hagyományos képi vízjelezési technikákat teszteltek, hogy megnézzék, vajon a kiszabott címkék túlélik-e a mélyhamisítási munkafolyamatok betanítási folyamatait, de a módszerek mind a négy megközelítésben kudarcot vallottak.

A FakeTagger beágyazott adatait a kódoló szakaszban injektálták az arcképekbe a U-Net Konvolúciós hálózat az orvosbiológiai képszegmentációhoz, 2015-ben jelent meg. Ezt követően a keretrendszer dekóder szakaszát betanítják a beágyazott információk megtalálására.

A folyamatot egy GAN szimulátorban próbáltuk ki, amely a fent említett FOSS-alkalmazásokat/algoritmusokat használta, fekete dobozban, anélkül, hogy az egyes rendszerek munkafolyamataihoz diszkrét vagy speciális hozzáférést lehetett volna elérni. Véletlenszerű jeleket csatoltak a hírességek képeihez, és minden egyes képhez kapcsolódó adatként naplózták.

Fekete dobozban a FakeTagger 88.95%-ot meghaladó pontosságot tudott elérni a négy alkalmazás megközelítése során. Egy párhuzamos fehér doboz forgatókönyv esetén a pontosság közel 100%-ra nőtt. Mivel azonban ez a FakeTaggert közvetlenül magában foglaló mélyhamis szoftver jövőbeli iterációira utal, ez a közeljövőben valószínűtlen forgatókönyv.

A költség számlálása

A kutatók megjegyzik, hogy a FakeTagger legnagyobb kihívást jelentő forgatókönyve a teljes képszintézis, például a CLIP-alapú absztrakt generálás, mivel ilyen esetben a bemeneti képzési adatok a legmélyebb absztrakciónak vannak kitéve. Ez azonban nem vonatkozik a mélyhamisított munkafolyamatokra, amelyek az elmúlt néhány évben uralták a címlapokat, mivel ezek az azonosítót meghatározó arcvonások hű reprodukciójától függenek.

A lap azt is megjegyzi, hogy az ellenséges támadók elképzelhető, hogy megkísérelnek perturbációkat, például mesterséges zajt és szemcséket hozzáadni egy ilyen címkézési rendszer meghiúsítása érdekében, bár ez valószínűleg káros hatással lenne a mélyhamisítási kimenet hitelességére.

Továbbá megjegyzik, hogy a FakeTaggernek redundáns adatokat kell hozzáadnia a képekhez, hogy biztosítsa az általa beágyazott címkék fennmaradását, és ennek jelentős számítási költsége lehet nagy léptékben.

A szerzők azzal zárják, hogy a FakeTagger potenciálisan más területeken is képes származáskövetésre, mint pl. ellenséges esőtámadások és más típusú képalapú támadások, mint pl ellenséges kitettség, köd, elhomályosít, színátmenet előállítás és a színrezgés.

Up Next

A Deep Learning System jobban tanul, ha elterelődik

Ne hagyd ki

Az algoritmus lehetővé teszi, hogy az autonóm drónok gyorsabban repüljenek, mint az ember által irányított

Martin Anderson

Író a gépi tanulásról, a mesterséges intelligenciáról és a big data-ról.
Személyes oldal: Martinanderson.ai
Kapcsolat [e-mail védett]
Twitter: @manders_ai

Egyesül.AI

Mélyhamisított adatforrások azonosítása mesterséges intelligencia alapú címkézéssel

Mesterséges Intelligencia

Mélyhamisított adatforrások azonosítása mesterséges intelligencia alapú címkézéssel

Tartalomjegyzék

A mélyhamisítás észlelésének hiányosságai