Інтерв’ю
Vaishnav Anand, автор Tech Demystified: Cybersecurity – Інтерв’ю Серія

Сімнадцятирічний студент школи Athenian, Vaishnav Anand, розробив першу систему штучного інтелекту, здатну виявляти «геопросторові діпфейки» — маніпульовані штучним інтелектом супутникові зображення, які можуть приховувати військові об’єкти, фабрикувати родовища ресурсів або спотворювати дані про катастрофи, створюючи ризики для національної безпеки та глобальної стабільності. Оскільки немає公開них наборів даних для цього типу виявлення, Ананд створив自己的 синтетичні зображення за допомогою генеративних суперницьких мереж, навчав моделі з нуля та зараз застосовує методи дифузії для поліпшення точності. Його дослідження вже були представлені на міжнародній конференції Esri та в Кембриджському університеті, отримавши визнання президента Esri Джека Денджермонда.
Паралельно зі своєю роботою в галузі безпеки штучного інтелекту Ананд написав дві книги з кібербезпеки, прийняті приватними школами, а його остання книга, Tech Demystified: Cybersecurity: Core Principles of Modern Cyber Defense, отримала рейтинг 5,0 зірок. Книга розбиває складні теми, такі як фішинг, шкідливе програмне забезпечення, брандмауери та шифрування, на ясні, практичні уроки для студентів, педагогів та всіх, хто цікавиться цифровою безпекою. Роблячи кібербезпеку доступною та цікавою, Ананд встановлює себе не тільки як інноватора в галузі штучного інтелекту, але й як майбутній голос у сфері освіти та технологій.
Ви ще навчаєтеся в середній школі, але вже робите вплив у сфері штучного інтелекту та кібербезпеки. Що спочатку привернуло вас до цієї галузі, і як ви почали розробляти такі просунуті проекти в такому молодому віці?
То, що спонукало мене до цієї галузі, було побачення подвійної природи штучного інтелекту. Він має неймовірний потенціал, але також може завдавати шкоди. У мене був прямий досвід технології діпфейків, який змінив мою точку зору. Дивлячись, як синтетичні медіа можуть серйозно нашкодити молодим людям, я зрозумів, що це не просто технічна цікавість; це критична суспільна проблема, яка потребує більшого розуміння.
Мій вступ у дослідження не виник із великого плану, а з глибокої цікавості. Кожне питання, яке я досліджував, привело мене до наступного, створюючи цикл відкриттів. Я знайшов себе зацікавленим у дедалі складніших проблемах. Я не шукав визнання; я був справжнім у своєму інтересі до питань.
Я перейшов від індивідуального дослідження до значимих досліджень через мережування та наполегливість. Я почав звертатися до встановлених дослідників, чию роботу я шанував, в основному через платформи типу LinkedIn. Хоча багато з них не відповіли, мені пощастило зв’язатися з двома дослідниками PhD, які зосереджувалися на безпеці штучного інтелекту та виявленні діпфейків. Вони почали мене з малих завдань у рамках своїх більших дослідницьких проектів. Коли я довів свою надійність та свої ідеї, ці завдання стали більш суттєвими.
Ця наставництво було життєво важливим. Мати досвідчених дослідників, які спрямовували моє формування, допомогло мені перетворити мою цікавість у суворе дослідження. Моя внутрішня мотивація, їхнє структуроване керівництво та постійна праця поступово перетворили мою випадкову цікавість у суттєві внески у дослідження. Це підкріпило мою віру в те, що справжній прогрес часто настане не від драматичних проривів, а від безперервної участі у важливих проблемах.
Більшість людей думають про діпфейки в термінах облич чи голосів. Що спонукало вас досліджувати геопросторові діпфейки конкретно, і чому ви вважали це такою критичною сліпою плямою?
Коли більшість людей чують слово «діпфейк», вони думають про фальшиві відеоролики знаменитостей або змінені голоси. Я також так думав спочатку. Але коли я дізнався більше, я почав задумуватися, де ще ця технологія могла бути використана способами, про які ми не думаємо. Тоді я зрозумів, що супутникові зображення часто вважаються абсолютно надійними. Уряди, компанії та навіть команди з ліквідації наслідків катастроф приймають важливі рішення на основі цих даних.
Це здавалося сліпою плямою. Якщо фальшиве відео може нашкодити репутації, фальшиві карти або змінені супутникові зображення можуть порушити ланцюги постачання, ввести в оману рятувальні зусилля або навіть привести до поганих рішень у національній безпеці. Коли оборона та війна стають все більш залежними від систем штучного інтелекту, дронів та автоматизованих процесів прийняття рішень, ризики зростають. Зманіований супутниковий сигнал може обманути не тільки людей, а й машини.
То, що ще більше вразило мене, було те, що геопросторові діпфейки отримують значно менше уваги, ніж діпфейки облич чи голосів. Є дуже мало публічних наборів даних або стандартних інструментів для їх виявлення. Крім того, виявлення фальшивок у супутникових зображеннях значно складніше. Ви не тільки шукаєте проблеми, такі як помилки синхронізації губ або розмиті краї, а й шукаєте статистичні «підписи» справжніх супутникових даних. Це включає в себе те, як текстури поводяться в міських районах порівняно з природними ландшафтами, і як шаблони інтенсивності пікселів течуть через різні регіони.
Можете розказати нам про свій процес відкриття — як ви зрозуміли, що маніпульовані супутникові зображення можуть становити ризики для національної безпеки, економіки та реагування на катастрофи?
Мій переломний момент настав після того, як я зустрів діпфейк, який похитнув мою віру в те, що я бачу. Ця мить сумніву показала щось важливе: люди природно налаштовані довіряти візуальним доказам, і коли ця довіра порушується, це змінює те, як ми бачимо все. Цей досвід змусив мене зіткнутися з тим, наскільки ми всі вразливі до хитрого обману.
Спочатку, як і більшість людей, я зосередився на очевидних застосуваннях — діпфейках відео та облич. Мої ранні проекти виявлення дали мені важливі знання про те, як працюють ці технології, але вони також показали мені ширші наслідки, про які я не думав.
Справжній відкриття настав, коли я служив асоціативним директором Національної 4-Х GIS лідерської команди. Працюючи з геопросторовими даними та супутниковими зображеннями, я побачив, як цією здається об’єктивною джерелами даних керуються важливі рішення. Я спостерігав, як карти спрямовували реагування на катастрофи, формували екологічну політику та впливали на проекти планування громад на мільйони доларів. Що мене найбільш здивувало, була сліпа довіра до цих даних — їх вважали абсолютною правдою.
Тоді все стало зрозумілим. Якщо фальшиве відео може викликати емоційний дискомфорт і соціальні заворушення, маніпульовані супутникові зображення можуть привести до катастрофічних реальних наслідків. Підумайте про те, як надзвичайні ресурси направляються до фальшивих зон катастроф, уряди приймають рішення на основі неправильних екологічних даних, або фінансові ринки впливають на змінені сільськогосподарські звіти. Потенціал шкоди був приголомшливим.
Це поєднання моїх досліджень діпфейків та досвіду GIS показало пробіл у нашій колективній свідомості. Хоча світ обговорює заміну облич чи синтетичні медіа, значно більша загроза геопросторових діпфейків залишається в основному непоміченою. Це розуміння стало рушійною силою моїх досліджень — вирішення серйозної вразливості, яка могла б змінити те, як ми розуміємо правду у нашому даних-орієнтованому світі.
Ваше дослідження використовує Генеративні Суперницькі Мережі (GAN) для виявлення фальшивих супутникових зображень. Як працює ваша система, і що робить її відмінною від загальних детекторів діпфейків?
Більшість детекторів сьогодні розроблені для ідентифікації облич чи голосів. Вони шукають ознаки, такі як несинхронізовані рухи губ чи проблеми з аудіо. Супутникові зображення зовсім інші. Вони складаються з тонких текстур та спектральних шаблонів по ландшафтах, сільськогосподарських угіддях, океанах та містах. Ці шаблони важче помітити та потребують іншого підходу.
У моєму початковому проекті я навчав рамку GAN, використовуючи набір даних SpaceNet-7 справжніх супутникових зображень. Генератор створює синтетичні зображення, а дискримінатор вчиться розрізняти справжнє та фальшиве. Зосередившись на дискримінаторі, я навчав модель, яка розуміє статистичний «підпис» справжніх геопросторових даних. Це включає в себе те, як текстури поводяться в міських районах порівняно з природними ландшафтами, і як шаблони інтенсивності пікселів течуть через різні регіони.
Через цей процес навчання система досягла високого рівня точності у виявленні фальшивок. Основна відмінність від загальних детекторів полягає в тому, що ця система розроблена конкретно для геопросторових даних. Замість того, щоб шукати очевидні візуальні помилки, вона вчиться субтильних спектральних та текстурних несумісностей, які розкривають синтетичні супутникові зображення.
Моє поточне дослідження перейшло до дослідження моделей дифузії як генераторів. Ці моделі представляють значне покращення над GAN у якості зображення. Моделі дифузії, такі як DDPM і DDIM, створюють дуже реалістичні супутникові зображення, вивчаючи, як навчитися перевертати процес додавання шуму. Синтетичні зображення, які вони створюють, часто чіткіші та детальніші, ніж ті, що генеруються GAN. Це представляє як можливість, так і виклик. Хоча ці моделі можуть забезпечити кращі навчальні дані для систем виявлення, вони також створюють більш просунуті фальшивки, які важче виявити.
Я зараз порівнюю різні методи виявлення, щоб знайти ті, які є найбільш ефективними проти різних технік генерації. Це включає в себе традиційні класифікатори на основі CNN, архітектури на основі трансформерів, які можуть захоплювати довгострокові просторові відносини в супутникових зображеннях, та гібридні методи, які поєднують спектральний аналіз з глибоким навчанням. Кожен метод має свої сильні сторони: CNN добре виявляють місцеві текстурні проблеми, трансформери можуть помітити більші структурні проблеми по всій області зображення, а спектральний аналіз може ідентифікувати тонкі частотні сигнатури, яких нейронні мережі можуть не помітити.
Цікавим аспектом є те, як різні генератори залишають унікальні судові відбитки. Зображення, згенеровані GAN, часто мають конкретні артефакти у високочастотних деталях та краях, тоді як зображення, згенеровані моделями дифузії, зазвичай демонструють більш тонкі несумісності в загальній узгодженості та спектральних ознаках. Навчаючи моделі виявлення на зображеннях, згенерованих GAN і моделями дифузії, я набуваю глибше розуміння сигнатури синтетичних супутникових зображень. Це допомагає будувати системи виявлення, які можуть коригуватися, коли технологія генерації розвивається.
Цей багатомодальний підхід до виявлення є суттєвим. Коли генеративні моделі стають більш просунутими, нам потрібні системи виявлення, які не залежать від помилок будь-якого одного методу генерації. Метою є ідентифікація базових статистичних ознак, які відрізняють справжні супутникові знімки від будь-якої форми синтезу, незалежно від основної технології, використаної для їх створення.
У вашій роботі MIT URTC ви згадуєте досягнення близько 88 відсотків точності у розрізненні справжніх супутникових зображень та фальшивок. Які були ключові прориви, які дозволили досягти цієї продуктивності?
Ключовим проривом було розуміння того, що не існувало існуючих наборів даних для цього типу виявлення. Це спонукало мене до подвійного підходу, працюючи одночасно над генерацією та виявленням. Я створив свій власний синтетичний набір даних, використовуючи GAN, і навчав дискримінатори цими даними. Це дозволило мені побудувати систему, яка справді розуміє статистичні шаблони справжніх геопросторових зображень.
Іншим важливим відкриттям було визнання того, що супутникові зображення мають зовсім інші проблеми порівняно з діпфейками облич. Хоча обличчя загалом мають стабільні анатомічні структури, супутникові зображення охоплюють широкий спектр типів місцевості — усе, від сільськогосподарських узорів до міських дизайнів та природних ландшафтів. Мені потрібно було створити систему виявлення, яка могла б ідентифікувати справжні ознаки по всіх цих різних середовищах.
Цей спеціалізований метод, замість того, щоб покладатися на загальні детектори, дозволив моделі виявити тонкі спектральні та текстурні несумісності, які розкривають синтетичні супутникові зображення. Однак моє поточне дослідження з моделями дифузії показує значно кращі результати, досягнувши вищої точності та бути більш стійкими до просунутих методів генерації.
Як ви пішли про створення свого власного синтетичного зображення для навчання, враховуючи відсутність публічних наборів даних для виявлення геопросторових діпфейків?
Створення синтетичного набору даних включало побудову складної архітектури GAN, навченої на наборі даних SpaceNet-7 справжніх супутникових зображень. Генератор навчався перетворювати випадковий шум у більш реалістичні супутникові зображення. Він захопив складні шаблони, знайдені в справжніх геопросторових даних.
Процес нагадує змагання між майстром-фальсифікатором та навченим перевірником. Генератор продовжує покращувати свої синтетичні зображення, тоді як дискримінатор стає краще в ідентифікації тонких ознак фальшивки. Це змагання створює цикл, в якому обидві частини підштовхують одну одну до досягнення кращої продуктивності.
Контролюючи як генерацію, так і виявлення, я отримав важливі знання про те, як створюються синтетичні супутникові зображення. Ця подвійна точка зору була суттєвою для розробки сильних методів виявлення, які розпізнають, як виглядають справжні зображення, а синтетичні відрізняються від цих шаблонів.
Які види аномалій — спектральних, текстурних чи інших — ваша система виявляє при розрізненні справжніх та маніпульованих зображень?
На відміну від діпфейків облич, де проблеми, такі як ненатуральне моргання чи несинхронізовані рухи губ, зазвичай легко помітити, супутникові зображення мають зовсім інші проблеми. Моя система виявляє спектральні несумісності, де шаблони взаємодії між різними електромагнітними смугами не відповідають справжнім даних спостереження Землі. Вона також виявляє текстурні неправильності, такі як сільськогосподарська земля, яка виглядає надто однорідною, поверхні океану, які відсутні природні хвильові узори, або міські текстури з штучною повторюваністю.
Контекстні аномалії додають ще один шар виявлення. Це включають дорожні мережі, які не слідують природним ландформам, сільськогосподарські плани, які ігнорують справжні обмеження сільського господарства, або міські розвитокові моделі, які не відповідають типовому міському зростанню. Ці питання можуть уникнути випадкової перевірки людини, але створюють чіткі статистичні сигнатури, які модель може розпізнати.
Система має обмеження з комплексними зображеннями. Густонаселені міські території з перекриваються структурами або супутникові зображення, які суттєво спотворені атмосферними спотвореннями, можуть зменшити точність виявлення. Ці крайні випадки вказують на області, які потребують подальших досліджень та покращення моделі.
Оглядаючи майбутнє, ваш плакат згадує майбутню роботу, таку як розширення браузера для реального геопросторового автентифікації та багатомодельні рамки. Що ви бачите як наступний великий крок у цьому напрямку досліджень?
Хоча моє дослідження на основі GAN показало, що ми можемо точно виявляти фальшиві супутникові зображення, я зрозумів, що хороші результати лабораторних досліджень не гарантують успіху у реальному світі. Синтетичні зображення часто не відповідають шаблонам, на яких були навчені моделі виявлення, а генеративні технології швидко змінюються.
Наступна фаза зосереджується на побудові сильних, адаптивних систем, які працюють добре під різними умовами. Це означає, що нам потрібно створити кращі методи оцінки, які імітують непередбачувану природу використання синтетичних зображень у реальному світі. Нам також потрібно розробити практичні інструменти, такі як легкі розширення браузера, реальні API та інтеграційні рамки, щоб допомогти у важливих процесах прийняття рішень.
Мій поточний напрямок дослідження підкреслює адаптивність та практичне використання. Я не просто намагаюся покращити точність моделі у контрольованих середовищах. Я націлений на розробку систем виявлення, які можуть залишатися надійними, коли генеративні техніки змінюються. Я хочу забезпечити доступні інструменти для урядів, компаній та громад, які покладаються на довірчі геопросторові дані.
Поза геопросторовими даними ваше ширше дослідження охоплює також відео діпфейки, реальне голосове автентифікацію та упередженість штучного інтелекту у кредитуванні. Як ви вибираєте, які етичні виклики вирішувати далі?
Мій напрямок дослідження не формується популярними темами; він зосереджується на пошуку критичних уразливостей у системах, де люди покладають фундаментальну довіру. Кожний проект починається з ідентифікації конкретних точок, де довіру можна підірвати, що призводить до серйозних наслідків.
Дослідження діпфейків почалося з особистого досвіду, який показав, як синтетичні медіа можуть нашкодити людині у візуальних доказах. Робота з Національною 4-Х GIS лідерською командою підкреслила, наскільки люди покладаються на супутникові зображення для реагування на катастрофи та прийняття політичних рішень. Ця зв’язок привела до досліджень геопросторових діпфейків, де ставки потенційно дуже високі.
Цей шаблон також застосовується до автентифікації голосу. Я розглянув, як синтетичні виклики надзвичайних ситуацій могли б завантажити системи 911. Є також питання про упередженість штучного інтелекту у кредитуванні, де алгоритмічна дискримінація може відмовити можливостям цілих спільнот. Кожна з цих областей відображає критичну довірчу відносину між людьми та технологіями, яку потрібно захистити.
Я досліджую, де технологія зустрічається із соціальною уразливістю, зосереджуючись на дослідженнях, які можуть зупинити розрив довіри, перш ніж вони переростуть у широкомасштабні кризи.
Ви також опублікували Tech Demystified: Cybersecurity, яке було прийнято в школах. Що мотивувало вас написати цю книгу, і як ви робите такий технічний матеріал доступним для студентів та педагогів?
Книга виникла безпосередньо з мого досвіду дослідження діпфейків. Це показало мені, наскільки важлива цифрова грамотність для молодих людей, які стикаються з більш складним технологічним світом. Кібербезпека здавалася правильним початком, оскільки вона впливає на кожного, незалежно від його технічних навичок чи кар’єрних цілей.
Я спрямував свою писання на студентів, які були лише на кілька років молодші за мене. Що б допомогло мені зрозуміти кіберзагрози, коли я вперше почав вчитися. Я організував зміст, використовуючи історії, порівняння та візуальні матеріали, а також інтерактивні діяльності та питання для роздумів. Ці інструменти роблять складні ідеї легше зрозумілими.
Було особливо значущим побачити, як програми середніх шкіл, шкільні бібліотеки та неприбуткові організації, які обслуговують учнів з недостатньо забезпечених верств, прийняли книгу. Я хотів створити ресурс, який би відкрив двері для учнів, які інакше могли б відчувати себе поза межами розмов про кібербезпеку.
Зосередження уваги на кібербезпеці поклало основу для цифрової безпеки до того, як моя наступна книга буде займатися штучним інтелектом та діпфейками, які є моєю основною сферою досліджень. Студентам потрібно вивчити основні принципи безпеки, перш ніж вони зануряться у складні етичні питання, пов’язані з штучним інтелектом.
У книзі ви розглядаєте загрози від фішингу до шкідливого програмного забезпечення. Що, на вашу думку, є найбільш важливим принципом кібербезпеки, який молоді люди повинні зрозуміти сьогодні?
Найважливішим принципом є «довіряй, але перевіряй». Важливо розвинути звичку сумніватися у цифрових доказах, перш ніж приймати дії. Більшість успішних кібератак використовують людську довіру, а не складні технічні помилки. Чи це клікання на підозрілі посилання, завантаження невідомих файлів чи відповідь на повідомлення, які здаються знайомими, пауза для перевірки може зупинити багато атак.
Для молодих людей, які проводять багато часу в Інтернеті та швидко переміщаються між платформами, ця перевірочна позиція особливо важлива. Формування звички сумніватися перед кліком будує захисний підхід, який охороняє від різних загроз.
Цей принцип виходить за межі кібербезпеки та переходить у ширшу цифрову грамотність. Ті самі критичні навички мислення, які захищають від шкідливого програмного забезпечення, також допомагають виявити дезінформацію, діпфейки та інші види цифрового обману.
Між вашими академічними дослідженнями, ініціативами STEM-освіти та опублікованими роботами ви явно пристрастні до технологій та етики. Як ви сподіваєтеся сформувати майбутнє безпеки штучного інтелекту та відповідальної інновації?
Все, що я роблю, зосереджується на побудові та підтримці довіри до технологій. Штучний інтелект може досягти свого потенціалу лише тоді, коли люди вірять, що ці системи безпечні, справедливі та прозорі. Без цієї довіри навіть революційні технології будуть боротися за прийняття та використання.
Через дослідження я націлений на пошук критичних уразливостей до того, як вони стають широкомасштабними проблемами. Я працюю над такими областями, як геопросторові діпфейки та автентифікація голосу, де ризики не завжди очевидні, але можуть мати серйозні наслідки. Через освіту та писання я хочу допомогти студентам зрозуміти ці системи, а не бачити технологію як загадковий чорний ящик, зарезервований для експертів.
Моя візія відповідальної інновації включає безпеку та справедливість з самих початкових стадій розробки, а не як післяthoughts. Це означає оцінку моделей не тільки за їхніми можливостями, а й за можливими точками відмов, ідентифікацію тих, хто може бути пошкоджений, та створення стратегій для мінімізації цих ризиків.
У довгостроковій перспективі я хочу допомогти створити культуру, в якій кожний крок штучного інтелекту отримує рівну увагу до безпеки та відповідальності. Моя робота включає дослідження, освіту та комунікацію, оскільки пошук ризиків є корисним лише тоді, коли ми також можемо допомогти іншим зрозуміти та вирішити їх.
Якщо я можу допомогти виявити критичні уразливості, а також збільшити технологічну грамотність, я вважаю, що я зіграю роль у формуванні майбутнього штучного інтелекту, якому люди можуть真正но довіряти та користуватися.
Дякую за велике інтерв’ю, читачам рекомендується прочитати Tech Demystified: Cybersecurity: Core Principles of Modern Cyber Defense.












