Штучний інтелект
Детектори Deepfake Переслідують Нові Території: Латентні Дифузійні Моделі та GAN

Опінія
Останнім часом, спільнота дослідників, яка займається виявленням deepfake, яка з кінця 2017 року майже виключно займалася автоенкодер-базованою рамкою, яка вперше була представлена в той час і викликала публічну подив та розчарування, почала проявляти інтерес до менш застійних архітектур, включаючи латентні дифузійні моделі, такі як DALL-E 2 та Stable Diffusion, а також вихідні дані Генеративних Адверсарних Мереж (GAN). Наприклад, у червні, Університет Каліфорнії в Берклі опублікував результати своїх досліджень щодо розробки детектора для вихідних даних DALL-E 2.
Рухомі Зображення
У будь-якому випадку, галванізуючий фактор здається перспективою подальшого розвитку відео-синтезу. Початок жовтня – і 2022 року великої конференційної сезону – був характеризований аваланшем раптових і несподіваних рішень щодо різних довгострокових проблем відео-синтезу: як тільки Facebook опублікував зразки своєї власної платформи текст-відео, Google Research швидко затопив цю первинну славу, оголосивши про свою нову архітектуру Imagen-to-Video T2V, здатну виводити високої роздільної здатності відео (хоча тільки через 7-шарову мережу апскейлерів).
Блейд Раннер
Остання робота, яка розглядає латентні дифузійні моделі та GAN-детектори deepfake, називається DE-FAKE: Виявлення та Атрибуція Фальшивих Зображень, Генерованих Текст-Зображенням Дифузійними Моделями, спільна робота між CISPA Helmholtz Центром Інформаційної Безпеки та Salesforce; та BLADERUNNER: Швидкий Контрзахід для Синтетичних (AI-Генерованих) StyleGAN-Голів, від Адама Доріана Вонга з Лінкольнської Лабораторії MIT.
DE-FAKE
Архітектура DE-FAKE спрямована не тільки на досягнення “універсального виявлення” для зображень, згенерованих текст-зображенням дифузійними моделями, але також на забезпечення методу для визначення якої латентної дифузійної (LD) моделі було створено зображення.












