stub Lior Hakim, medgrundare och CTO för Hour One - Interview Series - Unite.AI
Anslut dig till vårt nätverk!

Intervjuer

Lior Hakim, medgrundare och CTO för Hour One – Interview Series

mm

publicerade

 on

Lior Hakim, medgrundare och teknisk chef för timme ett, en branschledare inom att skapa virtuella människor för professionell videokommunikation. De verklighetstrogna virtuella karaktärerna, uteslutande modellerade efter riktiga människor, förmedlar mänskligt uttrycksfullhet genom text, vilket ger företag möjlighet att lyfta sina meddelanden med oöverträffad enkelhet och skalbarhet.

Skulle du kunna dela med dig av historien bakom Hour One?

Ursprunget till Hour One kan spåras tillbaka till mitt engagemang i kryptodomänen. Efter det försöket började jag fundera på vad som skulle bli nästa stora grej som massmolnberäkning kan utnyttja och eftersom maskininlärning blev populärt i rekommendationer och prediktiv analys arbetade jag med några ML-infrastrukturrelaterade projekt. Genom detta arbete blev jag bekant med tidiga generativa verk och var speciellt intresserad av GANs vid den tiden. Jag använde all dator jag kunde få tag på för att testa den då nya tekniken. När han visade mina resultat för en vän som hade ett företag på fältet sa han till mig att jag måste träffa Oren. När jag frågade varför sa han till mig att vi kanske båda kommer att sluta slösa bort hans tid och slösa bort varandras tid. Oren, min medgrundare och VD för Hour One var en tidig investerare i AI vid den tiden. och medan vi stod på olika platser rörde vi oss båda i samma riktning, och grundandet av Hour One för att vara den virtuella människans hem var en oundviklig resa.

Vilka är några av maskininlärningsalgoritmerna som används, och vilken del av processen är Generativ AI?

När det gäller videoskapande är maskininlärningsalgoritmer avgörande i varje steg. I skriptfasen erbjuder stora språkmodeller (LLM) ovärderligt stöd, skapande eller förfina innehåll för att säkerställa övertygande berättelser. När vi går över till ljud omvandlar text-till-tal-algoritmer (TTS) text till organiska, känslomässiga röster. Genom att övergå till den visuella representationen, tar vår egenutvecklade multimodala grundmodell av den virtuella människan i centrum. Denna modell, förstärkt med Generative Adversarial Networks (GAN) och Variational Autoencoders (VAEs), är skicklig på att förmedla kontextuella känslor, uttalande och en artikulerad, fängslande och autentisk leverans. Sådana generativa tekniker förvandlar text- och ljudsignaler till verklighetstrogna bilder av virtuella människor, vilket leder till hyperrealistiska videoutgångar. Orkestreringen av LLM, TTS, GAN, VAE och vår multimodala modell gör Generative AI inte bara till en del utan till ryggraden i modern videoproduktion.

Hur skiljer sig Hour One från konkurrerande videogeneratorer?

På Hour One härrör vår distinktion från andra videogeneratorer inte från en upptagenhet av konkurrens, utan snarare från en djupt rotad filosofi som styr vår inställning till kvalitet, produktdesign och marknadsstrategi. Vår ledstjärna är att alltid prioritera det mänskliga elementet, se till att våra skapelser resonerar med autenticitet och känslor. Vi är stolta över att leverera den bästa kvaliteten i branschen utan att kompromissa. Genom att använda avancerad 3D-videorendering ger vi våra användare en genuin filmupplevelse. Dessutom är vår strategi unikt opinionsbildad; vi börjar med en polerad produkt och upprepar sedan snabbt mot perfektion. Detta tillvägagångssätt säkerställer att våra erbjudanden alltid ligger ett steg före och sätter nya riktmärken för videogenerering.

Med din omfattande bakgrund inom GPU:er kan du dela med dig av några insikter om dina åsikter om NVIDIA nästa generations GH200 Grace Hopper Superchip-plattform?

Grace Hopper-arkitekturen är verkligen en game changer. Om GPU effektivt kan arbeta från sin värds RAM-minne utan att helt flaskhalsa beräkningen, låser den upp för närvarande omöjliga modell/accelerator-förhållanden i träning, och som ett resultat, mycket önskvärd flexibilitet i utbildningsjobbstorlekar. Förutsatt att hela beståndet av GH200 inte kommer att slukas av LLM-utbildning, hoppas vi kunna använda det för att kraftigt minska prototypkostnaderna för våra multimodala arkitekturer längre fram.

Finns det några andra marker som för närvarande finns på din radar?

Vårt huvudsakliga mål är att förse användaren med videoinnehåll som är priskonkurrenskraftigt. Med tanke på efterfrågan på stora minnes-GPU:er just nu, optimerar vi ständigt och provar alla GPU-molnerbjudanden hos de främsta molntjänstleverantörerna. Dessutom strävar vi efter att vara åtminstone delvis plattformsoberoende på vissa av våra arbetsbelastningar. Därför tittar vi på TPU:er och andra ASIC:er, och ägnar också stor uppmärksamhet åt AMD. Så småningom kommer alla hårdvaruledda optimeringsvägar som kan resultera i bättre FLOPs/$-förhållande att utforskas.

Vad är din vision för framtida framsteg inom videogenerering?

Om 24 månader kommer vi inte att kunna skilja en skapad människa från en tillfångatagen. Det kommer att förändra många saker, och vi är här i framkanten av dessa framsteg.

För närvarande är de flesta genererade videor för datorer och mobila enheter, vad behöver förändras innan vi har fotorealistiskt genererade avatarer och världar för både förstärkt verklighet och virtuell verklighet?

Från och med nu har vi förmågan att generera fotorealistiska avatarer och världar för både augmented reality (AR) och virtuell verklighet (VR). Det primära hindret är latens. Även om leverans av högkvalitativ, realtidsgrafik till avancerade enheter som AR- och VR-headset är avgörande, är det beroende av flera faktorer att uppnå detta sömlöst. Framför allt är vi beroende av framsteg inom chiptillverkning för att säkerställa snabbare och effektivare bearbetning. Utöver detta är optimering av strömförbrukningen avgörande för att säkerställa längre användning utan att kompromissa med upplevelsen. Sist men inte minst förutser vi mjukvarugenombrott som effektivt kan överbrygga gapet mellan generering och realtidsrendering. När dessa element möts kommer vi att se en ökning av användningen av fotorealistiska avatarer och miljöer över både AR- och VR-plattformar.

Vad förväntar du dig att bli nästa stora genombrott inom AI?

När det kommer till nästa betydande genombrott inom AI finns det alltid en känsla av spänning och förväntan. Även om jag har hänvisat till några framsteg tidigare, vad jag kan dela är att vi aktivt arbetar med flera banbrytande innovationer just nu. Jag skulle älska att fördjupa mig i detaljerna, men för nu uppmuntrar jag alla att hålla ett öga på våra kommande releaser. Framtiden för AI har ett enormt löfte, och vi är glada över att vara i framkant av dessa banbrytande ansträngningar. Håll ögonen öppna!

Finns det något mer du skulle vilja dela med dig av om Hour One?

Du bör definitivt kolla in vår discord-kanal och API, nya tillägg till vårt plattformserbjudande på timme ett.

En av grundarna av unite.AI och en medlem av Forbes Technology Council, Antoine är en futurist som brinner för framtiden för AI och robotik.

Han är också grundare av Securities.io, en webbplats som fokuserar på att investera i disruptiv teknik.