Connect with us

Lior Hakim, spoluzakladatel a technický ředitel Hour One – rozhovorová série

Rozhovory

Lior Hakim, spoluzakladatel a technický ředitel Hour One – rozhovorová série

mm

Lior Hakim, spoluzakladatel a Chief Technical Officer Hour One, průkopníka v oblasti vytváření virtuálních lidí pro profesionální video komunikaci. Tyto velmi realistické virtuální postavy, vytvořené výhradně podle skutečných lidí, vyjadřují lidskou expresivitu prostřednictvím textu, což umožňuje podnikům zvyšovat své sdělení s nevídanou lehkostí a škálovatelností.

Můžete sdílet příběh o vzniku Hour One?

Původ Hour One lze vysledovat zpět k mé účasti v oblasti kryptoměn. Po tomto projektu jsem začal uvažovat, co by mohlo být další velkou věcí, na kterou by mohly cloudové výpočty mít dopad, a jelikož se strojové učení stalo populárním v oblasti doporučení a prediktivní analýzy, pracoval jsem na několika projektech souvisejících s infrastrukturou ML. Díky této práci jsem se seznámil s ranými generativními pracemi a byl jsem zvláště interessován o GANs v té době. Používal jsem veškerý výpočetní výkon, který jsem mohl získat, aby otestoval tyto tehdy nové technologie. Když jsem ukázal své výsledky kamarádovi, který měl společnost v tomto oboru, řekl mi, že musím potkat Orena. Když jsem se zeptal proč, řekl mi, že možná oba přestaneme plýtvat jeho časem a budeme plýtvat časem jeden druhému. Oren, můj spoluzakladatel a CEO Hour One, byl raný investor do AI v té době a zatímco jsme stáli na různých místech, oba jsme se pohybovali stejným směrem, a založení Hour One jako Domova virtuálního člověka byla nevyhnutelná cesta.

Jaké jsou některé z algoritmů strojového učení, které se používají, a jakou roli hraje Generative AI?

V oblasti tvorby videa jsou algoritmy strojového učení nezbytné ve všech fázích. Ve fázi scriptování nabízejí Large Language Models (LLMs) neocenitelnou podporu, vytvářejí nebo upravují obsah, aby zajistily přesvědčivé vyprávění. Když přecházíme k audio, Text-to-Speech (TTS) algoritmy přeměňují text na organické, emotivní hlasy. Přechodem k vizuální reprezentaci se naše proprietární Multimodal základní model virtuálního člověka stává středem pozornosti. Tento model, vylepšený o Generative Adversarial Networks (GANs) a Variational Autoencoders (VAEs), je schopen vyjadřovat kontextové emoce, artikulaci a jasnou, přesvědčivou a autentickou prezentaci. Tyto generativní techniky přeměňují text a audio signály na velmi realistické vizuální prezentace virtuálních lidí, vedoucí k hyper-realistickým video výstupům. Orchestrace LLMs, TTS, GANs, VAEs a našeho Multimodal modelu činí Generative AI nejen součástí, ale páteřní součástí moderní video produkce.

Jak se Hour One liší od ostatních generátorů videa?

V Hour One naše odlišení od ostatních generátorů videa neplyne z obsese soutěžením, ale spíše z hluboce zakořeněné filozofie, která řídí náš přístup k kvalitě, designu produktu a marketové strategii. Naším řídícím principem je vždy dávat přednost lidskému prvku, zajišťujícím, aby naše tvorby rezonovaly s autenticitou a emocí. Chlubíme se tím, že dodáváme nejlepší kvalitu v oboru bez kompromisů. Používáním pokročilého 3D video renderování poskytujeme našim uživatelům opravdový filmový zážitek. Naše strategie je také jedinečně názorová; začínáme s vyleštěným produktem a poté rychle iterujeme směrem k dokonalosti. Tento přístup zajišťuje, že naše nabídky jsou vždy o krok napřed, stanovují nové standardy ve video generaci.

S vaším rozsáhlým pozadím v oblasti GPU, můžete sdílet s námi některé názory na NVIDIA Next-Generation GH200 Grace Hopper Superchip Platform?

Architektura Grace Hopper je skutečně zlomová. Pokud může GPU efektivní pracovat z RAM hostitele bez úplného zablokování výpočtu, odemyká současné nemožné modely/akcelerátorové poměry při trénování, a jako výsledek, mnohem požadovanou flexibilitu ve velikosti tréninkových úloh. Předpokládáme, že celý sklad GH200 nebude pohlcen trénováním LLM, doufáme, že ho budeme moci využít k výraznému snížení nákladů na prototypování našich multimodálních architektur.

Jsou nějaké další čipy, které jsou v současné době na vašem radaru?

Naším hlavním cílem je poskytnout uživateli video obsah, který je cenově konkurenceschopný. Vzhledem k poptávce po velkých paměťových GPU v současné době neustále optimalizujeme a zkoušíme každou cloudovou nabídku GPU na předních cloudových poskytovatelích služeb. Kromě toho usilujeme o to, aby byla alespoň část naší zátěže nezávislá na platformě. Proto sledujeme TPUs a další ASICs a také úzce sledujeme AMD. Nakonec každá hardwarová optimalizační cesta, která může vést k lepšímu poměru FLOPs/$, bude prozkoumána.

Jaký je váš výhled na budoucí pokroky ve video generaci?

Za 24 měsíců nebudeme moci rozeznat vygenerovaného člověka od zachyceného. To změní mnoho věcí, a my jsme tady na předním místě těchto pokroků.

V současné době jsou většina vygenerovaných videí pro počítače a mobilní zařízení, co se musí změnit, než budeme mít fotorealistické vygenerované avatary a světy pro rozšířenou realitu a virtuální realitu?

V současné době disponujeme schopností generovat fotorealistické avatary a světy pro obě rozšířenou realitu (AR) a virtuální realitu (VR). Hlavní překážkou je latence. Zatímco dodání vysoce kvalitních, reálných grafik na hraniční zařízení, jako jsou AR a VR brýle, je důležité, dosažení tohoto bezproblémového procesu závisí na několika faktorech. Především jsme závislí na pokrocích ve výrobě čipů, aby zajistily rychlejší a efektivnější zpracování. Vedle toho je optimální spotřeba energie zásadní pro zajištění delšího použití bez kompromisů. Nakonec očekáváme softwarové průlomy, které mohou efektivně mostem propojit generování a reálné vykreslování. Jakmile se tyto prvky spojí, uvidíme nárůst využití fotorealistických avatarů a prostředí napříč oběma AR a VR platformami.

Co očekáváte, že bude další velký průlom v AI?

Když se jedná o další významný průlom v AI, je vždy kolem něj určitá atmosféra vzrušení a očekávání. Zatímco jsem naznačil některé pokroky dříve, co mohu sdílet, je, že aktivně pracujeme na několika průlomových inovacích právě teď. Rád bych se ponořil do detailů, ale prozatím vás všechny vyzývám, abyste sledovali naše nadcházející vydání. Budoucnost AI skrývá obrovský slib, a my jsme rádi, že jsme na předním místě těchto průkopnických úsilí. Zůstaňte naladění!

Je něco jiného, co byste rádi sdíleli o Hour One?

Určitě byste měli zkontrolovat náš discord kanál a API, nové doplňky naší platformy na Hour One.

Antoine je vizionářský líder a zakládající partner Unite.AI, poháněný neotřesitelnou vášní pro formování a propagaci budoucnosti AI a robotiky. Jako sériový podnikatel věří, že AI bude mít na společnost stejně disruptivní vliv jako elektřina, a často je chycen při tom, jak hovoří o potenciálu disruptivních technologií a AGI. Jako futurist, je zasvěcen prozkoumání toho, jak tyto inovace budou formovat náš svět. Kromě toho je zakladatelem Securities.io, platformy zaměřené na investice do špičkových technologií, které předefinovávají budoucnost a mění celé sektory.