Погляд Anderson
Використання «Ймовірності» як Метрики Виявлення Deepfake

Якщо відео та аудіо, створені штучним інтелектом, стають достатньо реалістичними, детектори deepfake, засновані на візуальних артефактах або інших традиційних сигналах, вже не будуть працювати. Але враховуючи, як рідко люди відхиляються від передбачуваної поведінки, можливо, «ймовірність» могла б бути прийнята як сигнал того, чи відео чи новина є правдоподібною.
Опінія На початку 1990-х років поважний колишній британський футболіст і телекоментатор Девід Айк невимушено заявив на ток-шоу, що він є «сином Бога» – дивна і несподівана заява, яка розвинеться у тривалу і розгорнуту теорію змови про секретну і потужну глобальну кабалу «ящіркових людей».
З прийняттям інтернету ще попереду, а появи соціальних мереж – ще далі в майбутньому, сам вияв дисонансу між славою Айка і новими відкриттями мав глибокий вплив на британську громадськість – не останнє через повну відсутність контексту або будь-якого типу підготовки до цього масового повороту від відомої і добре встановленої спортивної особистості.
Більше ніж через двадцять років подібний і набагато темніший вияв цього соціального шоку стався, коли улюблений благодійник і ведучий дитячих телепрограм Джиммі Севіл був посмертно визнаний серійним і розбещеним злочинцем, який використовував свій доброзичливий публічний образ для скоєння злочинів.
Пізніше поліцейське розслідування Операція Йютрі викрило багатьох інших британських знаменитостей з тривалою історією сексуальних злочинів; пізніше суд над Гарві Вайнштейном призвів до подібного відкриття сексуальних злочинців серед знаменитостей у США, що розвинулося у рух #metoo і стало частиною американської культури, наприклад, у шоу Ранковий шоу. «Шокові» новини, здавалося, розвивали новий і раптовий шаблон – той, який згодом буде прийнятий і фейкові атакувальники.
Кінець «Традиційного» Виявлення Deepfake?
Навіть якщо б соціальні медіа та штучний інтелект були присутні на початку 1990-х років, жодна прогностична система у світі не могла б передбачити заяви Айка на ток-шоу, які (як я добре пам’ятаю) не мали жодних ознак у роки, що передували цій події.
Але тоді, якби штучний інтелект був присутній, йому, можливо, знадобилися б деякі час, щоб переконати широку аудиторію, що заяви Айка не були продуктом Google Veo 3 або іншої нової генерації гіперреалістичних аудіо/відео фреймворків deepfake.
Тільки за останні 6-12 місяців методи deepfake штучного інтелекту стали достатньо ефективними, щоб виконати роки медійних пророцтв про втручання deepfake у вибори, і стали здатними генерувати той же швидкий удар по репутації, який є неправдивим, але важко усунути у все більш наївній культурі.
На даний момент виходи відео штучного інтелекту зазвичай не досягають справжньої реалістичності, обмежені технічними бар’єрами і все більш поляризовані через розрив між обмеженими західними моделями і некенсорованими відкритими релізами Китаю**.
Тим не менш, я помічаю все частіше в дослідницькій літературі поступове визнання цієї «холодної війни», наприклад, у новій статті Деградація продуктивності у виявленні deepfake†:
‘[Ми] припускаємо, що відео deepfake будуть продовжувати містити ознаки, які можна вивчити за допомогою машинного навчання, які надійно відрізняють їх від справжніх відео. Коли можливості генеративного штучного інтелекту продовжують швидко розвиватися, це припущення може зруйнуватися.
‘У такому сценарії водяні знаки та інші методи відстеження походження будуть єдиною можливістю для підтримання довіри до цифрових медіа.’
Однак, сама стаття визнає, що рішення, засновані на походженні, такі як ініціатива аутентичності контенту Adobe, і численні менші дослідницькі пропозиції останніх 7-8 років, вимагають настільки широкого прийняття, що це нереально; і стаття закінчується загальною ноткою відступу, якщо не поразки.
Якщо методи виявлення аудіо-відео deepfake будуть перевершені генеративним штучним інтелектом, а глобальне прийняття інвазивної системи водяних знаків або походження зазнає поразки через різноманітні логістичні бар’єри, який спільний центральний елемент міг би замінити їх як індикатори потенційно підроблених виходів? Чи мусимо ми примиритися з тим, що весь медіа-контент сумнівний, і Дивіденд брехуна панує?
Графи Знань
Здається, час більш глибоко використовувати ймовірність і плавність «звітних подій» як сигнальну характеристику у виявленні deepfake. Крім того, оскільки відео- і аудіо-системи генеративного штучного інтелекту все частіше збігаються, можливо, також час для окремих дослідницьких напрямків «фейкових новин» (як текстової розповіді) і фейкових зображень/відео збігатися.
Метрика ймовірності deepfake не є тим же, що RAG-підтримане верифікація фактів, де модель штучного інтелекту може надати поточні веб-результати, щоб отримати знання про події, які відбуваються після її власної дати обрізання, і/або щоб підтвердити свої заяви.
Натомість вона буде виконувати передбачення на основі загальних статистичних тенденцій, отриманих з історичних моделей, які відповідають поточному запитові.
У цьому сенсі метод ймовірності ближче до статистичного аналізу, ніж сучасні підходи в області машинного навчання.
Хоча раніше вони були затінені сучаснішими підходами епохи Трансформерів, графи знань роблять певний повернення у сфері підприємства, і здаються придатними для потенційного розгортання «ймовірності»-метрик у виявленні deepfake.

Упрощений граф знань, який показує, як люди, місця, твори мистецтва та події можуть бути пов’язані через позначені відносини, що дозволяє машинам міркувати над реальними сутностями та їх зв’язками. Джерело
Граф знань – це спосіб організації інформації шляхом відображення реальних сутностей, таких як люди, компанії, події чи ідеї, у мережу пов’язаних фактів.
Кожна підсутність є вузлом, а зв’язки між ними (ребра) описують, як вони пов’язані. Наприклад, «Microsoft» (вузол) може бути пов’язаний з «OpenAI» (іншим вузлом) ребром, яке говорить «є клієнтом». Ці зв’язки часто зберігаються у графічних базах даних і слідують структурі суб’єкт-предикат-об’єкт, наприклад «Microsoft є клієнтом OpenAI».
Тривале Пам’ять
Одне китайське дослідження з вересня цього року запропонувало метод без навчання, який використовує графічний висновок для виявлення тонких несумісностей у багатозначних deepfake.
Натомість генерації раціоналів або тонкої настройки великих моделей, система витягує пари зображень і тексту, будує граф подібності і оцінює зв’язки, щоб витягнути найбільш актуальні приклади, і ці приклади керують судженням моделі без потреби у новому навчанні:

Огляд фреймворку GASP-ICL, який покращує виявлення deepfake шляхом поєднання графічного вибору з навчанням у контексті, що дозволяє замороженій моделі мови-зору класифікувати пари зображень/тексту як справжні або фейкові, без навчання або тонкої настройки. Джерело
Це, ймовірно, найближча робота, яка перетинається з моїм шляхом, до «інформованого» і історично-інформованого підходу до оцінки та верифікації нових медіа-виводів. Більша частина підходів комп’ютерного зору продовжує аналізувати зображення (включно з кадрами відео і часовими аномаліями, що охоплюють кілька кадрів), тоді як фреймворки виявлення «фейкових новин» продовжують підкреслювати текстові дані, навіть у багатозначних проектах.
Функціональна Крива
Виклик такого прогностичного системи полягає в масштабі спостереження, який може бути необхідним для того, щоб зробити підхід повністю функціональним – принаймні за межами аналізу знаменитостей і громадських діячів, для яких вже існує вільно доступна інформація.
Ймовірно, найбільш подібний поточний напрямок у дослідженні – це галузь перед-кримінального аналізу, який позначає різноманітні багатозначні сигнали інтелекту як «підозрілі», і представляє себе як стійкий штучний інтелект-строк в таких виходах, як Особа інтересу (2011-2016) і Меншість звіт (2002).
Хоча система Особа інтересу-стильного всепоглинаючого спостереження дала б оптимальні результати, малоймовірно, що західна культура могла б санкціонувати рівень особистої інвазивності, який китайські внутрішні мережі накладають на своїх громадян.
Тому, щодо потенційних фейкових новин про не-знаменитостей, тільки урядові агентства, такі як поліція (а також реєстри народження та смерті і податкові служби), мали б достатньо відповідної історичної інформації, щоб інформувати ймовірності у графічному робочому процесі; і навіть вони потребували б волі, можливостей, законодавства та ресурсів у стилі КККП, щоб включити звичайних громадян у свій охват і аналіз (тобто, за межами банальних, але обов’язкових даних, таких як номери паспорта і реєстрації автомобілів).
Оцінка Ймовірності
Здається, що потенційна ефективність системи такого типу буде обмежена найбільш очевидними (поточними) випадками використання контенту deepfake: дестабілізація (deepfake, підтримувані державою); знаменитості і «невідомі» порно deepfake (які можуть бути обидва вважані зловмисними, хоча останній випадок傾яє до більшої медійної уваги); підстава (включно з аудіо/відео deepfake, призначеними для виконання ‘імперсонаторських пограбувань’); і політичне вбивство характеру.
Система, заснована на знаннях, потребувала б шкалу ймовірностей для різноманітних можливих подій. На одному кінці спектра – звичайні людські помилки, такі як сумнівна фінансового управління, невірність, залежність, безрозсудство тощо; на іншому кінці… виявлення того, що ви є сином Бога у прямому ефірі телешоу (або події подібного масштабу і впливу).
Даже у останньому випадку особисті історичні чинники для будь-якої окремої особи будуть вагомими для результату ймовірності: відомий політичний діяч, який публічно двозначно висловлювався у суперечливих питаннях (наприклад, щодо достовірності висадки на Місяць у 1960-1970-х роках), щоб здобути капітал у все більш «інакше інформованому» електораті, міг би отримати додатковий джокер-статус у процедурах верифікації порівняно зі своїми більш стриманими колегами.
У випадку знаменитостей-порно є достатній реальний контекст (тобто, витік фотографій знаменитостей у 2012 році, серед інших – досить рідкісних – інцидентів), щоб згенерувати помірний Дивіденд брехуна у певних контекстах; але оскільки ці інциденти-відхилення tendують до роботи як винятки, які підтверджують правило, більшість поточних відео знаменитостей-порно будуть вважатися非常ньо «імовірними» (хоча це не розв’язує питання викрадення особистості для таких цілей).
У разі національної дестабілізації існує значний статистичний дані, який може допомогти у оцінці ймовірностей «катастрофічних» звітів. Навіть у давній історії, здавалося б, «з ніоткуда» події, такі як виверження невідомого вулкану Везувій у 79 році н.е., були попереджені, якщо ви звернули достатньо уваги; і окрім наявності численних урядових і НУО-підтримуваних джерел, здатність штучного інтелекту видобувати структуру з сирої інформації може надати додатковий історичний контекст для оцінки ймовірності.
Висновок
Навіть добре реалізована прогностична система такого типу не могла б передбачити випадкові події, акти Бога, несподівані випадки або зловмисні дії, створені поза будь-яким наглядом.
Крім того, сам обсяг і глибина даних, необхідних для забезпечення охоплення не тільки знаменитостей, будуть політичною перешкодою – принаймні, на даний момент.
Однак, вибір, здається, звужується; аналіз, заснований на зорових даних, готується зазнати поразки перед поліпшеним генеративним штучним інтелектом, тоді як схеми верифікації та походження несуть у собі навантаження технічного боргу і тертя проти прийняття. Це робить рішення, такі як ініціатива аутентичності контенту, і нездійснена система реєстрації обличчя Metaphysic.ai Metaphysic Pro, складними для популяризації.
У своєму широкому використанні RAG-підтримані системи можуть тільки визначити, чи джерело авторитету підтверджує неверифіковане твердження; і оскільки багато великих (правдивих) новинних історій з’являються без попереднього контексту, відсутність підтвердження з боку джерел авторитету не є обов’язково суттєвою.
Їхня цінність може бути більшою, якщо вони можуть утворити частину більшої екосистеми даних, пов’язаної з тим, що більшість сучасних форм штучного інтелекту знаходить складним – історичним контекстом.
* Не плутайте з ранніми автокодувальниками, які дебютували у 2017 році і згодом були замінені кращими підходами.
† https://arxiv.org/abs/2511.07009
** Який зазвичай може вільно працювати на більш потужних домашніх ПК, а не тільки бути доступним через API, такі як ChatGPT і серія Veo.
††† Виключаючи легітимне використання у розважальних цілях, таких як професійні візуальні ефекти у кіно- і телевізійних виробництвах.
Перша публікація четверга, 13 листопада 2025 року












