никулец Лиор Хаким, ко-основач и CTO на Hour One - серија на интервјуа - Unite.AI
Поврзете се со нас

Интервјуа

Лиор Хаким, ко-основач и директор на директори на Hour One – серија на интервјуа

mm

Објавено

 on

Лиор Хаким, ко-основач и главен технички директор на Еден час, лидер во индустријата во изработка на виртуелни луѓе за професионални видео комуникации. Животните виртуелни ликови, моделирани исклучиво по вистински луѓе, пренесуваат човечка експресивност преку текст, давајќи им можност на бизнисите да ги подигнат своите пораки со неспоредлива леснотија и приспособливост.

Можете ли да ја споделите приказната за генезата зад Hour One?

Потеклото на Hour One може да се проследи наназад до мојата вклученост во крипто доменот. По тој потфат, почнав да размислувам што ќе биде следното големо нешто што може да го искористи масовното пресметување во облак и бидејќи машинското учење се здобива со популарност во препораките и предвидувачката аналитика, работев на неколку проекти поврзани со ML инфраструктурата. Преку оваа работа се запознав со раните генеративни дела и особено бев заинтересиран за GAN во тоа време. Ги користев сите пресметки што можев да ги дофатам за да ги тестирам тие тогашни нови технологии. Кога ги покажував моите резултати на пријател кој имаше компанија на терен, тој ми рече дека мора да го запознаам Орен. Кога прашав зошто, тој ми рече дека можеби и двајцата ќе престанеме да му го губиме времето и да си го губиме времето. Орен, мојот ко-основач и извршен директор на Hour One беше ран инвеститор во вештачката интелигенција во тоа време. и додека стоевме на различни места, двајцата се движевме во иста насока, а основањето на Hour One да биде дом на виртуелниот човек беше неизбежно патување.

Кои се некои од алгоритмите за машинско учење што се користат и кој дел од процесот е Generative AI?

Во областа на создавање видео, алгоритмите за машинско учење се инструментални во секоја фаза. Во фазата на скриптирање, моделите на големи јазици (LLMs) нудат непроценлива поддршка, изработка или рафинирање на содржината за да се обезбедат привлечни наративи. Како што преминуваме кон аудио, алгоритмите Текст во говор (TTS) го претвораат текстот во органски, емотивни гласови. Премин кон визуелното претставување, нашиот сопствен Мултимодален основен модел на виртуелниот човек зазема централно место. Овој модел, подобрен со генеративни противнички мрежи (GAN) и варијациони автоенкодери (VAE), е вешт во пренесување на контекстуални емоции, изговарање и артикулирана, волшебна и автентична испорака. Ваквите генеративни техники ги претвораат текстуалните и аудио знаците во реални визуелни слики на виртуелни луѓе, што доведува до хиперреалистични видео излези. Оркестрацијата на LLM, TTS, GAN, VAE и нашиот мултимодален модел ја прави Generative AI не само дел, туку и столб на модерната видео продукција.

Како Hour One се разликува од конкурентните видео генератори?

На Hour One, нашата разлика од другите генератори на видео не произлегува од преокупираноста со конкуренцијата, туку од длабоко вкоренетата филозофија што го регулира нашиот пристап кон квалитетот, дизајнот на производите и стратегијата на пазарот. Нашиот водечки принцип е секогаш да се даде приоритет на човечкиот елемент, осигурувајќи дека нашите креации резонираат со автентичност и емоции. Се гордееме што даваме најдобар квалитет во индустријата без компромиси. Со користење на напредно 3D видео рендерирање, на нашите корисници им овозможуваме вистинско кино искуство. Понатаму, нашата стратегија е уникатно оценета; започнуваме со полиран производ, а потоа брзо се повторуваме кон совршенство. Овој пристап гарантира дека нашите понуди се секогаш чекор понапред, поставувајќи нови одредници во генерирањето видео.

Со вашата богата позадина во графичките процесори, можете ли да споделите со нас некои сознанија за вашите ставови за Платформа за суперчип на следна генерација на NVIDIA GH200 Grace Hopper?

Архитектурата на Грејс Хопер навистина ја менува играта. Ако графичкиот процесор може ефективно да работи од RAM-от на неговиот домаќин без целосно да ја препречи пресметката, тој ги отклучува моментално невозможните соодноси на модел/забрзувач при обуката и како резултат на тоа, многу посакуваната флексибилност во големината на работните места за обука. Претпоставувајќи дека целата залиха на GH200 нема да биде проголтана од обуката за LLM, се надеваме дека ќе ја искористиме за значително да ги намалиме трошоците за прототипови за нашите мулти-модални архитектури надолу.

Дали има други чипови што моментално се наоѓаат на вашиот радар?

Нашата главна цел е да му обезбедиме на корисникот видео содржина што е конкурентна во цената. Со оглед на побарувачката за големи мемориски графички процесори во моментот, ние постојано ја оптимизираме и испробуваме секоја понуда на облак на графичкиот процесор на врвните даватели на облак услуги. Покрај тоа, ние се стремиме да бидеме барем делумно независни од платформата на некои од нашите оптоварувања. Така, ние се обѕираме на TPU и други ASIC, а исто така посветуваме големо внимание на AMD. На крајот ќе се истражи секоја рута на оптимизација предводена од хардвер што може да резултира со подобар сооднос FLOP/$.

Која е вашата визија за идниот напредок во генерирањето видео?

За 24 месеци нема да можеме да разликуваме генериран човек од заробен. Тоа ќе промени многу работи, а ние сме тука во првите редови на тие напредувања.

Во моментот, повеќето генерирани видеа се за компјутери и мобилни уреди, што треба да се промени пред да имаме фотореалистични генерирани аватари и светови и за зголемена реалност и за виртуелна реалност?

Од сега, ние ја поседуваме способноста да генерираме фотореалистични аватари и светови и за зголемена реалност (AR) и за виртуелна реалност (VR). Примарната пречка е латентноста. Иако испораката на висококвалитетна графика во реално време на рабните уреди како што се слушалките AR и VR е од витално значење, беспрекорното постигнување на ова зависи од неколку фактори. Пред сè, ние се потпираме на напредокот во производството на чипови за да обезбедиме побрза и поефикасна обработка. Покрај ова, оптимизирањето на потрошувачката на енергија е од клучно значење за да се обезбеди подолго користење без да се загрози искуството. Последно, но не и најмалку важно, предвидуваме софтверски откритија кои можат ефикасно да го премостат јазот помеѓу генерирањето и прикажувањето во реално време. Како што се спојуваат овие елементи, ќе видиме пораст во користењето на фотореалистични аватари и околини и на AR и на VR платформи.

Што очекувате да биде следниот голем пробив во вештачката интелигенција?

Кога станува збор за следниот значаен пробив во вештачката интелигенција, секогаш има воздух на возбуда и исчекување. Иако претходно алудирав на некои достигнувања, она што можам да го споделам е дека активно работиме на неколку револуционерни иновации токму во овој момент. Би сакал да истражувам во спецификите, но засега ги охрабрувам сите да внимаваат на нашите претстојни изданија. Иднината на вештачката интелигенција ветува огромно, и ние сме воодушевени што сме во првите редови на овие пионерски напори. Останете со нас!

Дали има нешто друго што би сакале да го споделите за Hour One?

Дефинитивно треба да го проверите нашиот канал за несогласување и API, нови додатоци во понудата на нашата платформа Еден час.

Основачки партнер на unite.AI и член на Технолошкиот совет на Форбс, Антоан е а футуристички кој е страстен за иднината на вештачката интелигенција и роботиката.

Тој е и основач на Хартии од вредност.io, веб-страница која се фокусира на инвестирање во непушачка технологија.