заглушки Яшар Бехзаді, генеральний директор Synthesis AI - Серія інтерв'ю - Unite.AI
Зв'язатися з нами

інтерв'ю

Яшар Бехзаді, генеральний директор Synthesis AI – серія інтерв’ю

mm

опублікований

 on

Доктор філософії Яшар Бехзаді є генеральним директором і засновником Синтез ШІ. Він досвідчений підприємець, який побудував трансформаційний бізнес на ринках штучного інтелекту, медичних технологій та Інтернету речей. Останні 14 років він провів у Кремнієвій долині, будуючи та масштабуючи технологічні компанії, орієнтовані на дані. Яшар має понад 30 патентів і заявок на розгляд, а також ступінь доктора філософії. від UCSD з фокусом на просторово-часовому моделюванні функціональної візуалізації мозку.

Синтез ШІ це стартап на перетині глибокого навчання та CGI, що створює нову парадигму для розробки моделі комп’ютерного бачення. Вони дозволяють замовникам розробляти кращі моделі за частку часу та кошти, ніж традиційні підходи на основі людських анотацій.

Як ви спочатку залучилися до інформатики та ШІ?

Я отримав ступінь доктора філософії. з UCSD у 2006 році зосереджувався на комп’ютерному зорі та просторово-часовому моделюванні даних зображень мозку. Потім я працював у Кремнієвій долині на перетині датчиків, даних і машинного навчання в різних галузях промисловості протягом наступних 16 років. Мені дуже пощастило, що я маю можливість працювати над чудовими технологіями, і я маю понад 30 виданих або поданих патентів, зосереджених на обробці сигналів, машинному навчанні та науці про дані.

Не могли б ви поділитися історією виникнення Synthesis AI?

Перш ніж заснувати Synthesis AI у 2019 році, я очолював глобальну компанію з надання послуг штучного інтелекту, яка займалася розробкою моделей комп’ютерного зору для провідних технологічних підприємств. Незалежно від розміру компанії, я виявив, що ми дуже обмежені якістю та кількістю позначених навчальних даних. Оскільки компанії розширювалися географічно, збільшували свою клієнтську базу або розробляли нові моделі та нове апаратне забезпечення, потрібні були нові навчальні дані, щоб забезпечити належну роботу моделей. Також стало зрозуміло, що майбутнє комп’ютерного зору не буде успішним із сьогоднішньою парадигмою анотації «людина в циклі». Нові додатки комп’ютерного зору в автономності, робототехніці та додатках AR/VR/metaverse вимагають багатого набору 3D-міток, інформації про глибину, властивостей матеріалів, детальної сегментації тощо, які люди не можуть позначити. Потрібна була нова парадигма, щоб забезпечити необхідний багатий набір міток для навчання цих нових моделей. Окрім технічних чинників, ми спостерігали посилення споживчого та регуляторного контролю щодо етичних питань, пов’язаних із упередженістю моделі та конфіденційністю споживачів.

Я створив Synthesis AI, щоб змінити парадигму комп’ютерного зору. Платформа генерації синтетичних даних компанії дозволяє генерувати дані фотореалістичного зображення на вимогу з розширеним набором 3D-піксельних міток. Наша місія полягає в тому, щоб піонерувати технології синтетичних даних, щоб дозволити етичну розробку ефективніших моделей.

Для читачів, які не знайомі з цим терміном, чи могли б ви визначити, що таке синтетичні дані?

Синтетичні дані — це дані, створені комп’ютером, які служать альтернативою реальним даним. Синтетичні дані створюються в змодельованих цифрових світах, а не збираються або вимірюються в реальному світі. Поєднуючи інструменти зі світу візуальних ефектів і CGI з генеративними моделями штучного інтелекту, Synthesis AI дозволяє компаніям створювати величезну кількість фотореалістичних різноманітних даних на вимогу для навчання моделей комп’ютерного зору. Платформа генерації даних компанії зменшила вартість і швидкість для отримання високоякісних даних зображення на порядки, зберігаючи конфіденційність.

Чи могли б ви обговорити, як генеруються синтетичні дані?

Синтетичний набір даних створюється штучно, а не на основі реальних даних. Технології індустрії візуальних ефектів поєднуються з генеративними нейронними мережами для створення величезних, різноманітних і фотореалістичних даних зображень із мітками. Синтетичні дані дозволяють створювати навчальні дані за незначну частину вартості та часу, ніж поточні підходи.

Як використання синтетичних даних створює конкурентну перевагу?

Наразі більшість систем штучного інтелекту використовують «контрольоване навчання», коли люди позначають ключові атрибути зображень, а потім навчають алгоритми штучного інтелекту інтерпретувати зображення. Це процес, який потребує ресурсів і часу, і обмежений тим, що люди можуть точно позначити. Крім того, занепокоєння щодо демографічної упередженості ШІ та конфіденційності споживачів посилилося, що ускладнює отримання репрезентативних даних про людей.

Наш підхід полягає у створенні фотореалістичних цифрових світів, які синтезують складні дані зображення. Оскільки ми генеруємо дані, ми знаємо все про сцени, включаючи ніколи раніше доступну інформацію про 3D-розташування об’єктів та їх складну взаємодію один з одним і навколишнім середовищем. Отримання та маркування такої кількості даних за допомогою сучасних підходів займе місяці, якщо не роки. Ця нова парадигма дозволить у 100 разів підвищити ефективність і вартість, а також дасть початок новому класу більш потужних моделей.

Оскільки синтетичні дані генеруються штучно, це усуває багато упереджень і проблем із конфіденційністю традиційного збору наборів даних із реального світу.

Як генерація даних на вимогу забезпечує прискорене масштабування?

Збір і підготовка даних реального світу для навчання моделі є тривалим і виснажливим процесом. Розгортання необхідного апаратного забезпечення може бути надзвичайно дорогим для складних систем комп’ютерного зору, таких як автономні транспортні засоби, робототехніка або супутникові зображення. Після збору даних люди позначають і коментують основні функції. Цей процес схильний до помилок, і люди обмежені у своїй здатності позначати ключову інформацію, як-от 3D-положення, необхідне для багатьох програм.

Синтетичні дані на порядки швидші та дешевші, ніж традиційні підходи до реальних даних, анотованих людиною, і прискорять розгортання нових і ефективніших моделей у різних галузях.

Як синтетичні дані дозволяють зменшити або запобігти зміщенням ШІ?

Системи штучного інтелекту всюдисущі, але можуть містити притаманні упередження, які можуть впливати на групи людей. Набори даних можуть бути незбалансованими з певними класами даних і надмірно або недостатньо представленими групами людей. Побудова систем, орієнтованих на людину, часто може призвести до гендерних, етнічних і вікових упереджень. Навпаки, створені за проектом навчальні дані належним чином збалансовані та позбавлені людських упереджень.

Синтетичні дані можуть стати надійним рішенням у вирішенні проблеми упередженості ШІ. Синтетичні дані генеруються частково або повністю штучно, а не вимірюються чи витягуються з подій чи явищ реального світу. Якщо набір даних недостатньо різноманітний або великий, дані, створені штучним інтелектом, можуть заповнити прогалини та сформувати неупереджений набір даних. Найкраща частина? Створення цих наборів даних вручну може зайняти кілька місяців або років. При проектуванні з використанням синтетичних даних це можна зробити за одну ніч.

За межами комп’ютерного зору, які інші потенційні випадки використання синтетичних даних у майбутньому?

Окрім безлічі випадків використання комп’ютерного зору, пов’язаних зі споживчими товарами, автономією, робототехнікою, AR/VR/метавсесвітом тощо, синтетичні дані також впливатимуть на інші модальності даних. Ми вже бачимо, як компанії використовують підходи до синтетичних даних для обробки структурованих табличних даних, голосу та природної мови. Основні технології та конвеєри генерації відрізняються для кожного способу, і в найближчому майбутньому ми очікуємо побачити мультимодальні системи (наприклад, відео + голос).

Чи є ще щось, чим ви хотіли б поділитися про Synthesis AI?

Наприкінці минулого року ми випустили HumanAPI, значне розширення можливостей синтетичних даних Synthesis AI, що дозволяє програмно генерувати мільйони унікальних високоякісних 3D цифрових людей. Це оголошення з’явилося через кілька місяців після запуску продукту FaceAPI синтетичних даних як послуги, який надав понад 10 мільйонів мічених зображень обличчя для провідних компаній, що займаються смартфонами, телеконференціями, автомобілями та технологічними компаніями. HumanAPI є наступним кроком на шляху компанії до підтримки передових додатків штучного інтелекту комп’ютерного зору (AI).

HumanAPI також надає безліч нових можливостей для наших клієнтів, включаючи розумних помічників штучного інтелекту, віртуальних фітнес-тренерів і, звичайно, світ додатків метавсесвіту.

Створюючи цифровий двійник реального світу, метавсесвіт забезпечить нові програми, починаючи від переосмислених соціальних мереж, розваг, телеконференцій, ігор тощо. Комп’ютерне бачення AI буде фундаментальним для того, як реальний світ буде захоплено та відтворено з високою точністю в цифровій сфері. Фотореалістичні, виразні та поведінково точні люди стануть важливим компонентом програм комп’ютерного зору майбутнього. HumanAPI — це перший продукт, який дозволяє компаніям створювати величезні обсяги ідеально позначених даних про все тіло на вимогу для створення ефективніших моделей ШІ, включаючи оцінку пози, розпізнавання емоцій, характеристику активності та поведінки, реконструкцію обличчя тощо.

Дякую за чудове інтерв’ю, читачі, які хочуть дізнатися більше, повинні відвідати Синтез ШІ.

Партнер-засновник unite.AI і член Технологічна рада Forbes, Антуан - це а футурист який захоплений майбутнім ШІ та робототехніки.

Він також є засновником Securities.io, веб-сайт, який зосереджується на інвестиціях у революційні технології.