Взгляд Anderson

Глубокие подделки голоса облегчили кражу 35 миллионов долларов в банке в 2020 году

mm

Расследование хищения 35 миллионов долларов США из банка в Объединенных Арабских Эмиратах в январе 2020 года показало, что технология глубоких подделок голоса была использована для имитации голоса директора компании, знакомого менеджеру банка, который затем авторизовал транзакции.

Преступление было совершено 15 января прошлого года и описано в запросе (PDF) властей ОАЭ к американским властям с просьбой о помощи в поиске части похищенных средств, которые были переведены в США.

В запросе говорится, что менеджер филиала банка в ОАЭ получил телефонный звонок от знакомого голоса, который, вместе с сопровождающими электронными письмами от юриста Мартина Зельнера, убедил менеджера в необходимости перевести средства, которые, по-видимому, были предназначены для покупки компании.

В запросе говорится:

‘По данным эмиратских властей, 15 января 2020 года менеджер филиала компании-потерпевшего получил телефонный звонок, который якобы был от штаб-квартиры компании. Говоривший звучал как директор компании, поэтому менеджер филиала считал, что звонок был законным.

‘Менеджер филиала также получил несколько электронных писем, которые, по его мнению, были от директора и были связаны с телефонным звонком. Говоривший сказал менеджеру филиала по телефону и электронной почте, что компания-потерпевшая собирается купить другую компанию, и что юрист по имени Мартин Зельнер (Зельнер) был уполномочен координировать процедуры покупки.’

Менеджер филиала затем получил электронные письма от Зельнера, вместе с письмом с разрешением от (якобы) директора, чей голос был знаком менеджеру жертвы.

Обнаружение мошенничества с глубокими подделками голоса

Эмиратские следователи затем установили, что технология глубоких подделок голоса была использована для имитации голоса директора компании:

‘Эмиратское расследование показало, что обвиняемые использовали технологию “глубокого голоса”, чтобы симулировать голос директора. В январе 2020 года средства были переведены из компании-потерпевшего на несколько банковских счетов в других странах в сложной схеме, в которой участвовало не менее 17 известных и неизвестных обвиняемых. Эмиратские власти отслеживали движение денег через множество счетов и определили два перевода в США.

’22 января 2020 года два перевода на сумму 199 987,75 долларов США и 215 985,75 долларов США были отправлены от двух обвиняемых на счета банка Centennial Bank с номерами xxxxx7682 и xxxxx7885 соответственно, расположенные в США.’

Нет дальнейшей информации о преступлении, которое является только вторым известным случаем финансового мошенничества с использованием глубоких подделок голоса. Первый случай произошел девять месяцев ранее, в марте 2020 года, когда исполнительный директор британской энергетической компании был обманут по телефону кем-то, кто звучал как его начальник,要求уя срочного перевода 220 000 евро (243 000 долларов США), который сотрудник тогда осуществил.

Разработка технологии клонирования голоса

Глубокие подделки голоса включают обучение модели машинного обучения на сотнях или тысячах образцов “целевого” голоса (голоса, который будет имитироваться). Наиболее точное совпадение можно получить, обучая целевой голос直接 против голоса человека, который будет говорить в предложенном сценарии, хотя модель будет “переобучена” на человека, который будет имитировать целевой голос.

Самое активное легитимное онлайн-сообщество разработчиков технологии клонирования голоса – сервер Discord Audio Fakes, который включает форумы для многих алгоритмов глубоких подделок голоса, таких как Google’s Tacotron-2, Talknet, ForwardTacotron, Coqui-ai-TTS и Glow-TTS, среди других.

Глубокие подделки в реальном времени

Поскольку телефонный разговор по своей сути интерактивен, мошенничество с клонированием голоса не может быть разумно осуществлено с помощью “запечатленных” высококачественных аудиоклипов, и в обоих случаях мошенничества с клонированием голоса мы можем разумно предположить, что говорящий использует живую, реальную технологию глубоких подделок.

Глубокие подделки в реальном времени привлекли внимание в последнее время благодаря появлению DeepFaceLive, реальной реализации популярного пакета глубоких подделок DeepFaceLab, который может наложить знаменитости или другие идентичности на прямую видеозапись веб-камеры. Хотя пользователи на серверах Discord Audio Fakes и DeepFaceLab Discord интенсивно интересуются объединением этих двух технологий в единую архитектуру видео+голоса в реальном времени, пока не появился ни один такой продукт.

Писатель о машинном обучении, специалист в области синтеза человеческих изображений. Бывший руководитель исследовательского контента в Metaphysic.ai.