Connect with us

Ліор Хакім, співзасновник та технічний директор Hour One – Серія інтерв’ю

Інтерв’ю

Ліор Хакім, співзасновник та технічний директор Hour One – Серія інтерв’ю

mm

Ліор Хакім, співзасновник і технічний директор Hour One, лідера галузі у створенні віртуальних людей для професійного відеоспівобміну. Живі віртуальні персонажі, створені виключно за зразком реальних людей, передають людську виразність через текст, дозволяючи підприємствам підвищувати свої повідомлення з незрівнянною легкістю та масштабованістю.

Чи можете ви поділитися історією походження Hour One?

Походження Hour One можна простежити до моєї участі в криптодоміні. Після цього підприємства я почав розмірковувати, що буде наступною великою річчю, яку масовий хмарний обчислювальний ресурс може використати, і коли машинне навчання набуло популярності в рекомендаціях і прогнозній аналітиці, я працював над кількома проектами, пов’язаними з інфраструктурою МО. Через цю роботу я познайомився з ранніми генеративними роботами і був особливо зацікавлений у GAN на той час. Я використовував весь обчислювальний ресурс, який міг дістати, щоб протестувати ті нові технології. Коли я показував свої результати друзеві, який мав компанію в цій галузі, він сказав мені, що мені потрібно зустрітися з Ореном. Коли я запитав, чому, він сказав мені, що, можливо, ми обоє перестанемо марнувати його час і будемо марнувати час один одного. Орен, мій співзасновник і генеральний директор Hour One, був раннім інвестором у штучний інтелект на той час, і хоча ми стояли в різних місцях, ми обоє рухались в одному напрямку, і заснування Hour One як дому Віртуальної Людини було неминучим шляхом.

Які з машинних алгоритмів використовуються, і яка частина процесу є Генеративним ІІ?

У сфері створення відео машинні алгоритми грають важливу роль на кожному етапі. На етапі написання сценарію великі мовні моделі (LLM) пропонують невід’ємну підтримку, створюючи або вдосконалюючи вміст, щоб забезпечити переконливі розповіді. Коли ми переходимо до аудіо, алгоритми тексту-в-мову (TTS) перетворюють текст на органічний, виразний голос. Переходячи до візуального представлення, наш пропрієтарний багатомодальний фундаментальний модель віртуальної людини займає центральне місце. Ця модель, покращена Генеративними суперницькими мережами (GAN) і варіаційними автоенкодерами (VAE), здатна передавати контекстні емоції, артикуляцію та виразну, захоплюючу та автентичну подачу. Такі генеративні техніки перетворюють текстові та аудіо сигнали на життєві візуальні зображення віртуальних людей, що призводить до гіперреалістичних відеових виходів. Оркестрування LLM, TTS, GAN, VAE та нашої багатомодальної моделі робить Генеративний ІІ не просто частиною, а хребтом сучасної відеовиробництва.

Як Hour One відрізняється від інших відеогенераторів?

У Hour One наше відрізнення від інших відеогенераторів не полягає в занадто великому заносі на конкуренцію, а радше у глибоко вкоріненій філософії, яка керує нашим підходом до якості, дизайну продукту та ринку. Наш керівний принцип полягає в тому, щоб завжди ставити людський елемент на перше місце, забезпечуючи, щоб наші творіння резонували з автентичністю та емоціями. Ми пишаємося тим, що пропонуємо найкращу якість у галузі без компромісів. Використовуючи передові 3D відео-рендеринги, ми забезпечуємо нашим користувачам справжній кінематографічний досвід. Крім того, наша стратегія унікально обґрунтована; ми починаємо з полішеного продукту, а потім швидко ітеруємо до досконалості. Цей підхід забезпечує, що наші пропозиції завжди на крок вперед, встановлюючи нові стандарти у відеогенерації.

З вашим обширним досвідом у сфері GPU, чи можете ви поділитися з нами деякими інсайтами щодо вашої точки зору на NVIDIA Next-Generation GH200 Grace Hopper Superchip Platform?

Архітектура Grace Hopper є справжнім проривом. Якщо GPU може ефективно працювати з оперативної пам’яті хоста без повного блокування розрахунку, це розблокує зараз неможливі співвідношення моделі/прискорювача під час тренування, і в результаті, бажану гнучкість у розмірах тренувальних завдань. Припускаючи, що весь запас GH200 не буде поглинений тренуванням LLM, ми сподіваємося використовувати його для значного зниження витрат на прототипування наших багатомодальних архітектур в майбутньому.

Чи є інші чіпи, які зараз на вашому радарі?

Наша основна мета полягає в тому, щоб забезпечити користувача відеоконтентом, який є конкурентоспроможним за ціною. Ураховуючи попит на великі пам’яті GPU зараз, ми постійно оптимізуємо та випробовуємо будь-які пропозиції GPU-хмари на провідних хмарних постачальниках послуг. Крім того, ми прагнемо бути принаймні частково незалежними від платформи для деяких наших робочих завантажень. Тому ми звертаємо увагу на TPUs та інші ASIC, а також уважно стежимо за AMD. Врешті-решт будь-який апаратно-орієнтований шлях оптимізації, який може привести до кращого співвідношення FLOPs/долар, буде досліджений.

Яка ваша бачення майбутніх досягнень у генерації відео?

Через 24 місяці ми не зможемо відрізнити згенеровану людину від захопленої. Це змінить багато речей, і ми стоїмо на передовому краї цих досягнень.

На даний момент більшість згенерованих відео призначені для комп’ютерів і мобільних пристроїв, що потрібно змінити, щоб ми мали фотореалістичні згенеровані аватари та світи для доповненої реальності та віртуальної реальності?

На даний момент ми володіємо можливістю генерувати фотореалістичні аватари та світи для доповненої реальності (AR) та віртуальної реальності (VR). Основною перешкодою є затримка. Хоча доставка високоякісної, реальної графіки до пристроїв краю, таких як шоломи AR і VR, є важливою, досягнення цього безперебійно залежить від кількох факторів. По-перше, ми залежимо від досягнень у виробництві чіпів, щоб забезпечити швидше та ефективніше оброблення. Разом із цим оптимізація споживання енергії є важливою для забезпечення тривалого використання без компромісу досвіду. Останнє, але не менш важливе, ми очікуємо програмних проривів, які можуть ефективно зв’язати розрив між генерацією та реальною візуалізацією. Коли ці елементи зібрані разом, ми побачимо зростання використання фотореалістичних аватарів та середовищ у сфері AR та VR.

Що ви очікуєте бути наступним великим проривом у штучному інтелекті?

Коли мова йде про наступний значний прорив у штучному інтелекті, завжди є атмосфера збудження та очікування. Хоча я згадував про деякі досягнення раніше, те, що я можу поділитися, полягає в тому, що ми активно працюємо над кількома революційними інноваціями в цей момент. Я б хотів зануритися у деталі, але поки що я закликаю всіх слідкувати за нашими майбутніми випусками. Майбутнє штучного інтелекту обіцяє величезний потенціал, і ми раді бути на передовому краї цих піонерських зусиль. Залишайтеся на зв’язку!

Чи є щось ще, що ви хотіли б поділитися про Hour One?

Ви повинні обов’язково відвідати наш канал Discord та API, нові доповнення до нашої платформи на Hour One.

Антуан є видним лідером і засновником Unite.AI, який рухає невпинною пристрастю до формування та просування майбутнього штучного інтелекту та робототехніки. Як серійний підприємець, він вважає, що штучний інтелект буде таким же революційним для суспільства, як і електрика, і часто захоплюється потенціалом деструктивних технологій та AGI.

Як футуролог, він присвячений дослідженню того, як ці інновації сформують наш світ. Крім того, він є засновником Securities.io, платформи, орієнтованої на інвестування в передові технології, які переінакшують майбутнє та змінюють цілі сектори.