Connect with us

Яшар Бехзаді, генеральний директор Synthesis AI – Серія інтерв’ю

Інтерв’ю

Яшар Бехзаді, генеральний директор Synthesis AI – Серія інтерв’ю

mm

Яшар Бехзаді PhD є генеральним директором і засновником Synthesis AI. Він є досвідченим підприємцем, який створив трансформаційні бізнеси в галузі штучного інтелекту, медичної техніки та ринків IoT. Він провів останні 14 років у Долині Кремнієвої, будуючи та розширюючи компанії технологій, орієнтованих на дані. Яшар має понад 30 патентів і патентів, що розглядаються, та докторський ступінь з UCSD з фокусом на просторово-часовому моделюванні функціональної візуалізації мозку.

Synthesis AI – це стартап на перетині глибокого навчання та CGI, який створює новий парадигму для розробки моделей комп’ютерного зору. Вони дозволяють клієнтам розробляти кращі моделі за частку часу та вартості традиційних підходів, заснованих на анотації людьми.

Як ви спочатку стали залучені до комп’ютерних наук та штучного інтелекту?

Я здобув докторський ступінь у UCSD у 2006 році, зосередившись на комп’ютерному зорі та просторово-часовому моделюванні даних візуалізації мозку. Потім я працював у Долині Кремнієвій на перетині датчиків, даних та машинного навчання у різних галузях протягом наступних 16 років. Я відчуваю себе дуже щасливим, що мав можливість працювати над деякими видатними технологіями, і я маю понад 30 патентів, виданих або поданих, зосереджених на обробці сигналів, машинному навчанні та науці про дані.

Чи можете ви поділитися історією походження Synthesis AI?

Перед тим, як заснувати Synthesis AI у 2019 році, я очолював глобальну компанію з послуг штучного інтелекту, орієнтовану на розробку моделей комп’ютерного зору для провідних технологічних підприємств. Незалежно від розміру компанії, я виявив, що ми були вкрай обмежені якістю та кількістю маркованих навчальних даних. Коли компанії розширювалися географічно, збільшували свою клієнтську базу або розробляли нові моделі та нове обладнання, потрібні були нові навчальні дані, щоб забезпечити адекватну роботу моделей. Також стало ясно, що майбутнє комп’ютерного зору не буде успішним з сучасною парадигмою анотації людьми. Нові застосування комп’ютерного зору в автономії, робототехніці та AR/VR/metaverse вимагають багатого набору 3D-міток, інформації про глибину, властивостей матеріалів, детальної сегментації тощо, які люди не можуть маркувати. Потрібна була нова парадигма, щоб забезпечити необхідний багатий набір міток для навчання цих нових моделей. Крім технічних драйверів, ми бачили зростаючу увагу споживачів та нормативних органів щодо етичних питань, пов’язаних з упередженням моделей та конфіденційністю споживачів.

Я заснував Synthesis AI з метою трансформувати парадигму комп’ютерного зору. Платформа компанії з генерації синтетичних даних дозволяє генерувати на вимогу фотореалістичні дані зображень з розширеним набором 3D-піксельних міток. Наша місія – піонерство у сфері синтетичних даних, щоб дозволити етичну розробку більш здатних моделей.

Для читачів, які незнайомі з цим терміном, чи можете ви визначити, що таке синтетичні дані?

Синтетичні дані – це комп’ютерні дані, які служать альтернативою реальним даним. Синтетичні дані створюються у симульованих цифрових світах, а не збираються з реального світу. Об’єднуючи інструменти з світу візуальних ефектів та CGI з генеративними моделями штучного інтелекту, Synthesis AI дозволяє компаніям створювати величезну кількість фотореалістичної, різноманітної даних для навчання моделей комп’ютерного зору. Платформа генерації даних компанії зменшила вартість та швидкість отримання високоякісних даних зображень на кілька порядків, зберігаючи приватність.

Чи можете ви обговорити, як генеруються синтетичні дані?

Набір синтетичних даних створюється штучно, а не через реальні дані. Технології з галузі візуальних ефектів поєднуються з генеративними нейронними мережами для створення великої кількості фотореалістичної та різноманітної маркованих даних зображень. Синтетичні дані дозволяють створювати навчальні дані за частку часу та вартості поточних підходів.

Як використання синтетичних даних створює конкурентну перевагу?

Наразі більшість систем штучного інтелекту використовують “наглядане навчання”, де люди маркують ключові атрибути в зображеннях, а потім тренують алгоритми штучного інтелекту для інтерпретації зображень. Це ресурсо- та часоємкий процес, який обмежений тим, що люди можуть точно маркувати. Крім того, питання щодо упередженості штучного інтелекту та конфіденційності споживачів посилилися, що робить все складніше отримувати репрезентативні дані людьми.

Наш підхід полягає у створенні фотореалістичного цифрового світу, який синтезує складні дані зображень. Оскільки ми генеруємо дані, ми знаємо все про сцени, включаючи раніше недоступну інформацію про 3D-розташування об’єктів та їх складну взаємодію один з одним та з середовищем. Отримання та маркування цього обсяг даних за допомогою поточних підходів зайняло б місяці, якщо не роки. Ця нова парадигма дозволить вдосконалити ефективність та вартість у 100 разів і сприятиме створенню нового класу більш здатних моделей.

Оскільки синтетичні дані генеруються штучно, це усуває багато упереджень та проблем конфіденційності, пов’язаних з традиційним збором даних з реального світу.

Як генерація даних на вимогу дозволяє прискорити масштабування?

Збір та підготовка реальних даних для тренування моделей – це довгий та трудомісткий процес. Розгортання необхідного обладнання може бути надто дорогим для складних систем комп’ютерного зору, таких як автономні транспортні засоби, робототехніка або супутникова зйомка. Як тільки дані зібрані, люди маркують та анотують важливі функції. Цей процес схильний до помилок, а люди обмежені у своїй здатності маркувати ключову інформацію, таку як 3D-позицію, необхідну для багатьох застосунків.

Синтетичні дані на кілька порядків швидші та дешевші, ніж традиційні підходи, засновані на анотації людьми, та прискорять розгортання нових та більш здатних моделей у різних галузях.

Як синтетичні дані дозволяють зменшити або запобігти упередженості штучного інтелекту?

Системи штучного інтелекту повсюдні, але можуть містити вбудовані упередження, які можуть вплинути на групи людей. Набори даних можуть бути несбалансированими з певними класами даних та над- або недопредставленими групами людей. Будування людських систем часто може привести до упереджень щодо статі, етнічної приналежності та віку. Натомість дизайн-генеровані навчальні дані правильно збалансовані та не містять людських упереджень.

Синтетичні дані можуть стати потужним рішенням для вирішення проблеми упередженості штучного інтелекту. Синтетичні дані генеруються частково або повністю штучно, а не вимірюються або витягуються з реальних подій або явищ. Якщо набір даних не достатньо різноманітний або великий, дані, згенеровані штучним інтелектом, можуть заповнити пробіли та сформувати необізнаний набір даних. Найкраще? Ручне створення цих наборів даних може зайняти команди кілька місяців або років. Коли розроблені з синтетичних даних, це можна зробити за одну ніч.

Поза комп’ютерним зором, які інші потенційні застосування синтетичних даних?

Крім безлічі застосунків комп’ютерного зору, пов’язаних із споживчими продуктами, автономією, робототехнікою, AR/VR/metaverse та іншим, синтетичні дані також вплинуть на інші модальності даних. Ми вже бачимо, як компанії використовують підходи синтетичних даних для структурованих табличних даних, голосу та обробки природної мови. Підлежні технології та трубопроводи генерації відрізняються для кожної модальності, і в найближчому майбутньому ми очікуємо побачити багатомодальні системи (наприклад, відео + голос).

Чи є щось інше, що ви хотіли б поділитися про Synthesis AI?

У кінці минулого року ми випустили HumanAPI, суттєве розширення можливостей синтетичних даних Synthesis AI, яке дозволяє програмно генерувати мільйони унікальних, високоякісних 3D-цифрових людей. Це оголошення відбулося за кілька місяців після запуску продукту FaceAPI синтетичних даних як послуги, який доставив понад 10 мільйонів маркованих зображень обличчя для провідних компаній смартфонів, телеконференцій, автомобілів та технологій. HumanAPI – це наступний крок у подорожі компанії до підтримки просунутих застосунків штучного інтелекту комп’ютерного зору.

HumanAPI також дозволяє безліч нових можливостей для наших клієнтів, включаючи розумні штучні помічники, віртуальні тренери з фітнесу та, звичайно, світ метаверсу.

Створюючи цифровий двійник реального світу, метаверс дозволить нові застосування, починаючи від переосмислених соціальних мереж, розважальних досвідів, телеконференцій, ігор та іншим. Комп’ютерний зір штучного інтелекту буде фундаментальним для того, як реальний світ буде захоплений та відтворений з високою точністю у цифровій сфері. Фотореалістичні, виразні та поведінково точні люди будуть важливим компонентом майбутнього застосунків комп’ютерного зору. HumanAPI – це перший продукт, який дозволяє компаніям створювати величезну кількість ідеально маркованих даних всього тіла на вимогу для будівництва більш здатних моделей штучного інтелекту, включаючи оцінку пози, розпізнавання емоцій, характеристику діяльності та поведінки, реконструкцію обличчя та іншим.

Дякуємо за велике інтерв’ю. Читачам, які бажають дізнатися більше, слід відвідати Synthesis AI.

Антуан є видним лідером і засновником Unite.AI, який рухає невпинною пристрастю до формування та просування майбутнього штучного інтелекту та робототехніки. Як серійний підприємець, він вважає, що штучний інтелект буде таким же революційним для суспільства, як і електрика, і часто захоплюється потенціалом деструктивних технологій та AGI.

Як футуролог, він присвячений дослідженню того, як ці інновації сформують наш світ. Крім того, він є засновником Securities.io, платформи, орієнтованої на інвестування в передові технології, які переінакшують майбутнє та змінюють цілі сектори.