заглушки Лиор Хаким, соучредитель и технический директор Hour One — Серия интервью — Unite.AI
Свяжитесь с нами:

Интервью

Лиор Хаким, соучредитель и технический директор Hour One – серия интервью

mm

опубликованный

 on

Лиор Хаким, соучредитель и технический директор компании Час первый, лидера отрасли в создании виртуальных людей для профессиональной видеосвязи. Реалистичные виртуальные персонажи, созданные исключительно по образцу реальных людей, передают человеческую выразительность посредством текста, позволяя компаниям совершенствовать свои сообщения с непревзойденной легкостью и масштабируемостью.

Не могли бы вы рассказать историю создания Hour One?

Происхождение Hour One можно отнести к моему участию в сфере криптовалют. После этого проекта я начал размышлять над тем, что будет следующим большим достижением, к которому смогут подключиться массовые облачные вычисления, и поскольку машинное обучение набирало популярность в рекомендациях и прогнозной аналитике, я работал над несколькими проектами, связанными с инфраструктурой машинного обучения. Благодаря этой работе я познакомился с ранними генеративными работами и в то время особенно интересовался GAN. Я использовал все компьютерные возможности, которые были в моих руках, чтобы протестировать эти новые на тот момент технологии. Показывая мои результаты другу, у которого была компания в этой области, он сказал мне, что мне нужно встретиться с Ореном. Когда я спросил почему, он сказал мне, что, возможно, мы оба перестанем тратить его время и тратить время друг друга. Орен, мой соучредитель и генеральный директор Hour One, в то время был одним из первых инвесторов в искусственный интеллект. и хотя мы стояли в разных местах, мы оба двигались в одном направлении, и создание «Часа первого», ставшего домом виртуального человека, было неизбежным путешествием.

Какие алгоритмы машинного обучения используются и какую часть процесса представляет собой генеративный ИИ?

В сфере создания видео алгоритмы машинного обучения играют важную роль на каждом этапе. На этапе написания сценария модели большого языка (LLM) предлагают неоценимую поддержку, создавая или совершенствуя контент для обеспечения убедительного повествования. Когда мы переходим к аудио, алгоритмы преобразования текста в речь (TTS) преобразуют текст в органичные, эмоциональные голоса. При переходе к визуальному представлению центральное место занимает наша запатентованная мультимодальная базовая модель виртуального человека. Эта модель, дополненная генеративно-состязательными сетями (GAN) и вариационными автоэнкодерами (VAE), способна передавать контекстуальные эмоции, высказывание, а также четко сформулированную, увлекательную и аутентичную доставку. Такие генеративные методы превращают текстовые и аудиосигналы в реалистичные изображения виртуальных людей, что приводит к гиперреалистичным видеоматериалам. Согласование LLM, TTS, GAN, VAE и нашей мультимодальной модели делает генеративный ИИ не просто частью, а основой современного видеопроизводства.

Чем Hour One отличается от конкурирующих видеогенераторов?

Наше отличие от других производителей видео в Hour One связано не с озабоченностью конкуренцией, а, скорее, с глубоко укоренившейся философией, определяющей наш подход к качеству, дизайну продуктов и рыночной стратегии. Наш руководящий принцип — всегда отдавать приоритет человеческому фактору, гарантируя, что наши творения будут резонировать с подлинностью и эмоциями. Мы гордимся тем, что предоставляем лучшее качество в отрасли без компромиссов. Используя передовой рендеринг 3D-видео, мы предоставляем нашим пользователям настоящие кинематографические впечатления. Более того, наша стратегия уникальна; мы начинаем с отточенного продукта, а затем быстро приближаемся к совершенству. Такой подход гарантирует, что наши предложения всегда будут на шаг впереди, устанавливая новые стандарты в создании видео.

Имея обширный опыт работы с графическими процессорами, не могли бы вы поделиться с нами своими взглядами на Суперчиповая платформа NVIDIA следующего поколения GH200 Grace Hopper?

Архитектура Grace Hopper действительно меняет правила игры. Если графический процессор может эффективно работать с оперативной памятью своего хоста, не создавая при этом полностью узких мест в вычислениях, он открывает невозможные на данный момент соотношения модель/ускоритель при обучении и, как следствие, столь желанную гибкость в размерах заданий обучения. Предполагая, что весь запас GH200 не будет поглощен обучением LLM, мы надеемся использовать его для значительного снижения затрат на прототипирование наших мультимодальных архитектур в будущем.

Есть ли еще какие-нибудь чипы, которые в настоящее время находятся на вашем радаре?

Наша главная цель — предоставить пользователю видеоконтент по конкурентоспособной цене. Учитывая текущий спрос на графические процессоры с большой памятью, мы постоянно оптимизируем и тестируем любые облачные предложения графических процессоров от ведущих поставщиков облачных услуг. Более того, мы стремимся быть хотя бы частично независимыми от платформы в некоторых наших рабочих нагрузках. Поэтому мы присматриваемся к TPU и другим ASIC, а также уделяем пристальное внимание AMD. В конечном итоге будет изучен любой путь аппаратной оптимизации, который может привести к лучшему соотношению FLOP/$.

Каково ваше видение будущих достижений в области создания видео?

Через 24 месяца мы не сможем отличить созданного человека от пойманного. Это многое изменит, и мы находимся в авангарде этих достижений.

В настоящее время большинство видеороликов создается для компьютеров и мобильных устройств. Что нужно изменить, прежде чем у нас появятся фотореалистичные аватары и миры как для дополненной, так и для виртуальной реальности?

На данный момент у нас есть возможность создавать фотореалистичные аватары и миры как для дополненной реальности (AR), так и для виртуальной реальности (VR). Основное препятствие — задержка. Хотя доставка высококачественной графики в реальном времени на периферийные устройства, такие как гарнитуры AR и VR, жизненно важна, достижение этой цели зависит от нескольких факторов. Прежде всего, мы полагаемся на достижения в области производства чипов, чтобы обеспечить более быструю и эффективную обработку. Наряду с этим, оптимизация энергопотребления имеет решающее значение для обеспечения более длительного использования без ущерба для впечатлений. И последнее, но не менее важное: мы ожидаем прорывов в программном обеспечении, которые смогут эффективно преодолеть разрыв между генерацией и рендерингом в реальном времени. Когда эти элементы объединятся, мы увидим всплеск использования фотореалистичных аватаров и сред на платформах AR и VR.

Что, по вашему мнению, станет следующим большим прорывом в области искусственного интеллекта?

Когда дело доходит до следующего значительного прорыва в области искусственного интеллекта, всегда царит атмосфера волнения и ожидания. Хотя я уже упоминал о некоторых достижениях ранее, могу поделиться тем, что в данный момент мы активно работаем над несколькими революционными инновациями. Мне бы хотелось углубиться в подробности, но сейчас я призываю всех следить за нашими предстоящими релизами. Будущее искусственного интеллекта имеет огромные перспективы, и мы очень рады быть в авангарде этих новаторских усилий. Следите за обновлениями!

Есть ли что-нибудь еще, чем бы вы хотели поделиться о Hour One?

Вам обязательно стоит ознакомиться с нашим каналом Discord и API, новыми дополнениями к предложениям нашей платформы по адресу Час первый.

Партнер-основатель unite.AI и член Технологический совет Форбс, Антуан - это футурист который увлечен будущим искусственного интеллекта и робототехники.

Он также является основателем Ценные бумаги.io, веб-сайт, посвященный инвестициям в прорывные технологии.