Connect with us

Andersonův úhel

Metoda forenzních dat pro novou generaci deepfakeů

mm
Variation on ' a 1792x1024 image of a lab technician examining a Guy Fawkes mask with forensic equipment.' - Adobe Firefly

Ačkoli deepfaking soukromých osob se stal rostoucím veřejným problémem a je stále více zakázán v různých regionech, prokázat, že uživatelsky vytvořený model – jako je například ten, který umožňuje pomstu prostřednictvím pornografie – byl speciálně vyškolen na konkrétních obrazech某 osoby, zůstává extrémně náročné.

Chcete-li problém uvést do kontextu: klíčovým prvkem deepfake útoku je falešné tvrzení, že obraz nebo video zobrazuje konkrétní osobu. Pouhá skutečnost, že někdo ve videu je identita #A, a notně podobný, je dostatečná k vyvolání újmy, a není zapotřebí žádný umělý inteligence v tomto scénáři.

Nicméně, pokud útočník generuje AI obrázky nebo videa pomocí modelů vyškolených na datech skutečných osob, sociální média a vyhledávače obličeje automaticky propojí falešný obsah s obětí – bez nutnosti jmen v příspěvcích nebo metadatech. AI-generované vizuály samy o sobě zajišťují asociaci.

Čím více je osobnost zřetelná, tím více je to nevyhnutelné, dokud se fabricovaný obsah neobjeví v obrazových vyhledávačích a nakonec dosáhne oběti.

Face to Face

Nejběžnější prostředek šíření modelů zaměřených na identitu je目前 prostřednictvím Low-Rank Adaptation (LoRA),其中 uživatel trénuje malé množství obrazů po dobu několika hodin proti váhám mnohem většího základního modelu, jako je Stable Diffusion (pro statické obrázky, většinou) nebo Hunyuan Video, pro video deepfakes.

Nejběžnější cíle LoRAs, včetně nové generace video-založených LoRAs, jsou ženské celebrity, jejichž sláva je vystavuje tomuto druhu zacházení s menším veřejným kritikou než v případě ‘neznámých’ obětí, kvůli předpokladu, že takové odvozené díla jsou pokryty pod ‘fair use’ (alespoň v USA a Evropě).

Ženské celebrity dominují seznamy LoRA a Dreambooth na portálu civit.ai. Nejpopulárnější LoRA目前 má více než 66 000 stažení, což je značné, vezmeme-li v úvahu, že toto použití AI zůstává považováno za 'okrajovou' činnost.

Ženské celebrity dominují seznamy LoRA a Dreambooth na portálu civit.ai. Nejpopulárnější LoRA目前 má více než 66 000 stažení, což je značné, vezmeme-li v úvahu, že toto použití AI zůstává považováno za ‘okrajovou’ činnost.

Neexistuje žádný veřejný fórum pro necelebrity oběti deepfakingu, které se objevují v médiích pouze tehdy, když vznikají případy stíhání, nebo když oběti hovoří v populárních médiích.

Nicméně, v obou scénářích, modely použité k falšování cílových identit ‘destilovaly’ svá trénovací data tak dokonale do latentního prostoru modelu, že je obtížné identifikovat zdrojové obrázky, které byly použity.

Pokud by bylo možné to provést v rámci přijatelné marže chyby, toto by umožnilo stíhání těch, kteří sdílejí LoRAs, neboť nejen prokazuje úmysl deepfaking konkrétní identitu (tj. té konkrétní ‘neznámé’ osoby, i když malefactor nikdy nezmiňuje jejich jméno během procesu pomsty), ale také vystavuje uploadera obvinění z porušení autorských práv, kde je to relevantní.

Poslední by bylo užitečné v jurisdikcích, kde právní regulace deepfaking technologií chybí nebo zaostává.

Over-Exposed

Cílem trénování základního modelu, jako je multi-gigabajtový základ modelu, který uživatel může stáhnout z Hugging Face, je, aby se model stal dobře-generalizován a ohebný. To zahrnuje trénování na dostatečném počtu rozmanitých obrazů a s vhodnými nastaveními, a ukončení trénování předtím, než se model ‘přepřáhne’ k datům.

Spisovatel o strojovém učení, doménový specialista na syntézu lidského obrazu. Bývalý vedoucí výzkumného obsahu ve společnosti Metaphysic.ai.
Osobní stránky: martinanderson.ai