Интервью
Яшар Бехзади, генеральный директор Synthesis AI – Интервью

Яшар Бехзади, доктор философии, является генеральным директором и основателем Synthesis AI. Он является опытным предпринимателем, который создал трансформирующие бизнесы в области ИИ, медицинской технологии и рынков Интернета вещей. Он провел последние 14 лет в Кремниевой долине, строя и масштабируя компании технологий, ориентированных на данные. Яшар имеет более 30 патентов и патентов, находящихся на рассмотрении, и докторскую степень от UCSD с фокусом на пространственно-временном моделировании функционального мозгового изображения.
Synthesis AI – это стартап на пересечении глубокого обучения и CGI, создающий новый парадигму для разработки моделей компьютерного зрения. Они позволяют клиентам разрабатывать лучшие модели за долю времени и стоимости традиционных подходов, основанных на ручной аннотации.
Как вы первоначально стали вовлечены в компьютерные науки и ИИ?
Я получил докторскую степень от UCSD в 2006 году, сосредоточившись на компьютерном зрении и пространственно-временном моделировании данных функционального мозгового изображения. Затем я работал в Кремниевой долине на пересечении датчиков, данных и машинного обучения в различных отраслях в течение следующих 16 лет. Я чувствую себя очень удачливым, что имел возможность работать над некоторыми замечательными технологиями, и у меня есть более 30 патентов, выданных или поданных, сосредоточенных на обработке сигналов, машинном обучении и науке о данных.
Можете ли вы рассказать историю создания Synthesis AI?
До основания Synthesis AI в 2019 году я возглавлял глобальную компанию ИИ-сервисов, ориентированную на разработку моделей компьютерного зрения для ведущих технологических предприятий. Независимо от размера компании, я обнаружил, что мы были крайне ограничены качеством и количеством помеченных обучающих данных. По мере расширения компаний географически, роста их клиентской базы или разработки новых моделей и нового оборудования требовались новые обучающие данные, чтобы обеспечить адекватную производительность моделей. Также стало ясно, что будущее компьютерного зрения не будет успешным с помощью сегодняшней парадигмы ручной аннотации. Новые приложения компьютерного зрения в автономности, робототехнике и приложениях AR/VR/metaverse требуют богатого набора 3D-меченых данных, информации о глубине, свойств материала, детальной сегментации и т. д., которые люди не могут пометить. Был необходим новый парадигма, чтобы обеспечить необходимый богатый набор меток для обучения этих новых моделей. Кроме технических факторов, мы увидели растущий контроль со стороны потребителей и регулирующих органов по поводу этических вопросов, связанных с предвзятостью моделей и конфиденциальностью потребителей.
Я основал Synthesis AI с целью трансформации парадигмы компьютерного зрения. Платформа синтетического генерации данных компании позволяет генерировать на заказ фотографически реалистичные изображения данных с расширенным набором 3D-пиксельных меток. Наша миссия – стать пионером в синтетических данных технологий, чтобы позволить этичному развитию более способных моделей.
Для читателей, которые не знакомы с этим термином, можете ли вы определить, что такое синтетические данные?
Синтетические данные – это компьютерные данные, которые служат альтернативой реальным данным. Синтетические данные создаются в симулированных цифровых мирах, а не собираются из или измеряются в реальном мире. Объединив инструменты из мира визуальных эффектов и CGI с генеративными моделями ИИ, Synthesis AI позволяет компаниям создавать огромные объемы фотографически реалистичных, разнообразных данных на заказ для обучения моделей компьютерного зрения. Платформа генерации данных компании уменьшила стоимость и скорость получения высококачественных изображений данных на несколько порядков, сохраняя при этом конфиденциальность.
Можете ли вы обсудить, как генерируются синтетические данные?
Набор синтетических данных создается искусственно, а не через реальные данные. Технологии из индустрии визуальных эффектов сочетаются с генеративными нейронными сетями для создания огромных, разнообразных и фотографически реалистичных помеченных изображений данных. Синтетические данные позволяют создавать обучающие данные за долю стоимости и времени по сравнению с текущими подходами.
Как использование синтетических данных создает конкурентное преимущество?
В настоящее время большинство систем ИИ используют “наблюдаемое обучение”, где люди помечают ключевые атрибуты в изображениях, а затем обучают алгоритмы ИИ интерпретировать изображения. Это ресурсо- и времяемкий процесс и ограничен тем, что люди могут точно пометить. Кроме того, проблемы с предвзятостью демографических данных ИИ и конфиденциальностью потребителей усилились, что делает все более сложным получение представительных человеческих данных.
Наш подход заключается в создании фотографически реалистичных цифровых миров, которые синтезируют сложные изображения данных. Поскольку мы генерируем данные, мы знаем все о сценах, включая ранее недоступную информацию о 3D-расположении объектов и их сложных взаимодействиях друг с другом и окружающей средой. Получение и пометка такого объема данных с помощью текущих подходов заняли бы месяцы, если не годы. Этот новый парадигма позволит улучшить эффективность и стоимость в 100 раз и будет стимулировать появление нового класса более способных моделей.
Поскольку синтетические данные генерируются искусственно, это устраняет многие предвзятости и проблемы конфиденциальности, связанные с традиционным сбором наборов данных из реального мира.
Как генерация данных на заказ позволяет ускорить масштабирование?
Сбор и подготовка реальных данных для обучения моделей – это длительный и утомительный процесс. Развертывание необходимого оборудования может быть чрезвычайно дорогим для сложных систем компьютерного зрения, таких как автономные транспортные средства, робототехника или спутниковые изображения. Как только данные собраны, люди помечают и аннотируют важные функции. Этот процесс подвержен ошибкам, и люди ограничены в своей способности помечать ключевую информацию, такую как 3D-позиция, необходимая для многих приложений.
Синтетические данные на несколько порядков быстрее и дешевле, чем традиционные подходы, основанные на ручной аннотации реальных данных, и будут ускорять развертывание новых и более способных моделей в различных отраслях.
Как синтетические данные позволяют уменьшить или предотвратить предвзятость ИИ?
Системы ИИ повсеместно распространены, но могут содержать врожденные предвзятости, которые могут повлиять на группы людей. Наборы данных могут быть несбалансированными с определенным классом данных и либо пере- или недопредставленными группами людей. Создание человеко-ориентированных систем может часто привести к предвзятости по гендеру, этнической принадлежности и возрасту. Напротив, дизайн-генерируемые обучающие данные правильно сбалансированы и лишены человеческих предвзятостей.
Синтетические данные могут стать надежным решением проблемы предвзятости ИИ. Синтетические данные генерируются частично или полностью искусственно, а не измеряются или извлекаются из реальных событий или явлений. Если набор данных не достаточно разнообразен или велик, ИИ-генерируемые данные могут заполнить пробелы и сформировать беспристрастный набор данных. Лучшее? Ручное создание этих наборов данных может занять командам несколько месяцев или лет. Когда они спроектированы с синтетическими данными, это можно сделать за одну ночь.
Помимо компьютерного зрения, какие еще потенциальные случаи использования синтетических данных?
Помимо многочисленных случаев использования компьютерного зрения, связанных с потребительскими продуктами, автономностью, робототехникой, AR/VR/metaverse и многим другим, синтетические данные также повлияют на другие модальности данных. Мы уже видим, как компании используют подходы синтетических данных для структурированных табличных данных, голоса и обработки естественного языка. Основные технологии и генерационные конвейеры различаются для каждой модальности, и в ближайшем будущем мы ожидаем увидеть много-модальные системы (например, видео + голос).
Есть ли что-то еще, что вы хотели бы поделиться о Synthesis AI?
В конце прошлого года мы выпустили HumanAPI, значительное расширение возможностей синтетических данных Synthesis AI, позволяющее программно генерировать миллионы уникальных, высококачественных 3D-цифровых людей. Это объявление было сделано через несколько месяцев после запуска продукта FaceAPI синтетических данных в качестве сервиса, который доставил более 10 миллионов помеченных изображений лица для ведущих компаний смартфонов, телеконференций, автомобилей и технологий. HumanAPI – это следующий шаг в пути компании к поддержке передовых приложений ИИ компьютерного зрения.
HumanAPI также позволяет нашим клиентам использовать множество новых возможностей, включая умных помощников ИИ, виртуальных тренеров по фитнесу и, конечно же, мир метаверса.
Создавая цифровой двойник реального мира, метаверс позволит новые приложения, начиная от переосмысленных социальных сетей, развлечений, телеконференций, игр и многого другого. Компьютерное зрение ИИ будет фундаментальным для того, как реальный мир будет захвачен и воссоздан с высоким качеством в цифровой сфере. Фотографически реалистичные, выразительные и поведенчески точные люди будут важнейшим компонентом будущего приложений компьютерного зрения. HumanAPI – это первый продукт, который позволяет компаниям создавать огромные объемы идеально помеченных целых данных на заказ для построения более способных моделей ИИ, включая оценку позы, распознавание эмоций, характеристику деятельности и поведения, реконструкцию лица и многое другое.
Спасибо за отличное интервью, читателям, которые хотят узнать больше, следует посетить Synthesis AI.












