stub Lior Hakim, medgründer og CTO for Hour One - Intervjuserien - Unite.AI
Kontakt med oss

intervjuer

Lior Hakim, medgründer og CTO for Hour One – Interview Series

mm

Publisert

 on

Lior Hakim, medgründer og Chief Technical Officer i Time én, en industrileder i å lage virtuelle mennesker for profesjonell videokommunikasjon. De naturtro virtuelle karakterene, utelukkende modellert etter ekte mennesker, formidler menneskelignende uttrykksevne gjennom tekst, og gir bedrifter mulighet til å heve budskapene sine med uovertruffen letthet og skalerbarhet.

Kan du dele opprinnelseshistorien bak Hour One?

Opprinnelsen til Hour One kan spores tilbake til mitt engasjement i kryptodomenet. Etter dette forsøket begynte jeg å tenke på hva som ville være den neste store tingen som masseskyberegning kan benytte seg av, og ettersom maskinlæring ble stadig mer populær i anbefalinger og prediktiv analyse, jobbet jeg med noen få ML-infrastrukturrelaterte prosjekter. Gjennom dette arbeidet ble jeg kjent med tidlige generative verk og var spesielt interessert i GAN-er på den tiden. Jeg brukte all data jeg kunne få tak i for å teste de da nye teknologiene. Da han viste resultatene mine til en venn som hadde et firma i feltet, fortalte han meg at jeg måtte møte Oren. Da jeg spurte hvorfor, fortalte han meg at vi kanskje begge vil slutte å kaste bort tiden hans og kaste bort hverandres tid. Oren, min medgründer og administrerende direktør i Hour One var en tidlig investor i AI på den tiden. og mens vi sto på forskjellige steder beveget vi oss begge i samme retning, og grunnleggelsen av Hour One for å være hjemmet til det virtuelle mennesket var en uunngåelig reise.

Hva er noen av maskinlæringsalgoritmene som brukes, og hvilken del av prosessen er Generativ AI?

Når det gjelder videoskaping, er maskinlæringsalgoritmer viktige på alle trinn. I skriptfasen tilbyr Large Language Models (LLM) uvurderlig støtte, utforming eller raffinering av innhold for å sikre overbevisende fortellinger. Når vi går over til lyd, omformer tekst-til-tale-algoritmer (TTS) tekst til organiske, emosjonelle stemmer. Overgangen til den visuelle representasjonen, står vår proprietære multimodale grunnmodell av det virtuelle mennesket i sentrum. Denne modellen, forbedret med Generative Adversarial Networks (GANs) og Variational Autoencoders (VAEs), er dyktig til å formidle kontekstuelle følelser, uttalelser og en artikulert, fengslende og autentisk levering. Slike generative teknikker gjør tekst- og lydsignaler til naturtro bilder av virtuelle mennesker, noe som fører til hyperrealistiske videoutganger. Orkestreringen av LLM, TTS, GAN, VAE og vår multimodale modell gjør Generative AI ikke bare til en del, men ryggraden i moderne videoproduksjon.

Hvordan skiller Hour One seg fra konkurrerende videogeneratorer?

Hos Hour One stammer ikke skillet vårt fra andre videogeneratorer fra en opptatthet av konkurranse, men snarere fra en dypt forankret filosofi som styrer vår tilnærming til kvalitet, produktdesign og markedsstrategi. Vårt ledende prinsipp er å alltid prioritere det menneskelige elementet, og sikre at kreasjonene våre gir gjenklang med autentisitet og følelser. Vi setter vår ære i å levere den beste kvaliteten i bransjen uten kompromisser. Ved å bruke avansert 3D-videogjengivelse gir vi brukerne våre en ekte kinoopplevelse. Videre er strategien vår unikt oppfattet; vi begynner med et polert produkt og går deretter raskt tilbake mot perfeksjon. Denne tilnærmingen sikrer at tilbudene våre alltid er et skritt foran, og setter nye standarder innen videogenerering.

Med din omfattende bakgrunn innen GPUer, kan du dele med oss ​​noen innsikter om dine synspunkter på NVIDIA neste generasjons GH200 Grace Hopper Superchip-plattform?

Grace Hopper-arkitekturen er virkelig en game changer. Hvis GPU effektivt kan arbeide fra vertens RAM uten å fullstendig flaskehalser for beregningen, låser den opp for øyeblikket umulige modell/akselerator-forhold i trening, og som et resultat, mye ønsket fleksibilitet i treningsjobbstørrelser. Forutsatt at hele beholdningen av GH200 ikke vil bli slukt av LLM-trening, håper vi å bruke den til å redusere prototypekostnadene for våre multimodale arkitekturer i stor grad.

Er det noen andre brikker på radaren din for øyeblikket?

Vårt hovedmål er å gi brukeren videoinnhold som er priskonkurransedyktig. Gitt etterspørselen etter store minne-GPUer for øyeblikket, optimaliserer og prøver vi hele tiden ut alle GPU-skytilbud hos de beste skytjenesteleverandørene. Dessuten streber vi etter å være i det minste delvis plattformuavhengig av noen av arbeidsbelastningene våre. Derfor ser vi på TPU-er og andre ASIC-er, og følger også nøye med på AMD. Etter hvert vil enhver maskinvareledet optimaliseringsrute som kan resultere i bedre FLOPs/$-forhold bli utforsket.

Hva er din visjon for fremtidige fremskritt innen videogenerering?

Om 24 måneder vil vi ikke kunne skille et generert menneske fra et fanget. Det vil endre mange ting, og vi er her i forkant av disse fremskritt.

For øyeblikket er de fleste genererte videoer for datamaskiner og mobile enheter, hva må endres før vi har fotorealistiske genererte avatarer og verdener for både utvidet virkelighet og virtuell virkelighet?

Per nå har vi muligheten til å generere fotorealistiske avatarer og verdener for både utvidet virkelighet (AR) og virtuell virkelighet (VR). Den primære hindringen er latens. Selv om levering av høykvalitets, sanntidsgrafikk til avanserte enheter som AR- og VR-headset er avgjørende, er å oppnå dette sømløst avhengig av flere faktorer. Først og fremst er vi avhengige av fremskritt innen brikkeproduksjon for å sikre raskere og mer effektiv behandling. Ved siden av dette er optimalisering av strømforbruket avgjørende for å sikre lengre bruk uten at det går på bekostning av opplevelsen. Sist, men ikke minst, forventer vi programvaregjennombrudd som effektivt kan bygge bro over gapet mellom generering og sanntidsgjengivelse. Når disse elementene kommer sammen, vil vi se en økning i bruken av fotorealistiske avatarer og miljøer på tvers av både AR- og VR-plattformer.

Hva forventer du blir det neste store gjennombruddet innen AI?

Når det kommer til det neste betydningsfulle gjennombruddet innen AI, er det alltid en atmosfære av spenning og forventning. Selv om jeg har referert til noen fremskritt tidligere, er det jeg kan dele at vi jobber aktivt med flere banebrytende innovasjoner akkurat nå. Jeg vil gjerne fordype meg i detaljer, men foreløpig oppfordrer jeg alle til å følge med på de kommende utgivelsene våre. Fremtiden til kunstig intelligens har et enormt løfte, og vi er begeistret over å være i forkant av denne banebrytende innsatsen. Følg med!

Er det noe annet du vil dele om time én?

Du bør definitivt sjekke ut vår discord-kanal og API, nye tillegg til plattformtilbudet vårt på Time én.

En grunnlegger av unite.AI og et medlem av Forbes teknologiråd, Antoine er en futurist som brenner for fremtiden til AI og robotikk.

Han er også grunnleggeren av Securities.io, et nettsted som fokuserer på å investere i forstyrrende teknologi.