Connect with us

Lior Hakim, Co-founder & CTO of Hour One – Haastattelusarja

Haastattelut

Lior Hakim, Co-founder & CTO of Hour One – Haastattelusarja

mm

Lior Hakim, Hour One -yhtiön co-founder ja Chief Technical Officer, joka on alan johtaja virtuaalisten ihmisten luomisessa ammattimaisiin videoviestintään. Näiden elävänoloisten virtuaalihahmojen, jotka on mallinnettu yksinomaan oikeiden ihmisten mukaan, kautta voidaan välittää inhimillistä ilmaisukykyä tekstin kautta, mikä mahdollistaa yritysten viestinnän tehostamisen ja skaalattavuuden ilman vertaansa.

Voitko kertoa Hour One -yhtiön syntytarinaa?

Hour One -yhtiön juuret juontavat siihen, kun olin mukana kryptovaluuttojen parissa. Sen jälkeen aloin pohtia, mikä olisi seuraava suuri asia, johon massapilviprosessointi voisi tarttua, ja kun koneoppiminen oli saamassa suosiota suosituksissa ja ennustavassa analytiikassa, työskentelin joillakin koneoppimisen infrastruktuuriin liittyvillä projekteilla. Tämän kautta tutustuin varhaisiin generatiivisiin töihin ja olin erityisen kiinnostunut GAN:eista tuolloin. Käytin kaikki prosessointikyky, jonka pystyin saamaan käsiini, testatakseen näitä silloin uusia teknologioita. Kun näytin tuloksiani ystävälleni, jolla oli yritys aihealueella, hän sanoi, että minun pitäisi tavata Oren. Kun kysyin, miksi, hän sanoi, että ehkä molemmat lopetamme ajan haaskauksen toisillemme. Oren, Hour One -yhtiön co-founder ja toimitusjohtaja, oli varhainen AI-sijoittaja tuolloin, ja vaikka seisoimme eri paikoissa, liikuimme molemmat samaan suuntaan, ja Hour One -yhtiön perustaminen virtuaalisten ihmisten kodiksi oli vääjäämätön matka.

Mitkä koneoppimisalgoritmit ovat käytössä, ja mikä osa prosessista on generatiivisen AI:n osuus?

Videoiden luomisessa koneoppimisalgoritmit ovat tärkeitä jokaisessa vaiheessa. Käsikirjoitusvaiheessa suuret kielimallit (LLM) tarjoavat arvokasta tukea luomalla tai viimeistelemällä sisältöä, jotta voidaan varmistaa viehättävät kertomukset. Siirryttäessä ääneen, teksti-ääneksi (TTS) -algoritmit muuttavat tekstin orgaaniseksi, emotionaalisesti ääneksi. Siirryttäessä visuaaliseen edustukseen, omistamme monimodaalisen perusmallin virtuaalihumallemme. Tämä malli, jota on parannettu generatiivisilla vastakkainasettelualgoritmeilla (GAN) ja variational autoencoder (VAE):illa, on taitava välittämään kontekstuaalista emotionaalisuutta, artikulaatiota ja ymmärrettävää, viehättävää ja aitoa toimintaa. Näin ollen generatiiviset tekniikat muuttavat tekstin ja äänimerkit elävänoloisiksi virtuaalisten ihmisten visuaalisiksi esityksiksi, joista seuraa hyperrealistisia videoita. LLM-, TTS-, GAN-, VAE- ja monimodaalisen mallimme orkestraatio tekee generatiivisesta AI:sta ei vain osan, vaan modernin videotuotannon selkärangan.

Miten Hour One erottuu kilpailevista videogeneraattoreista?

Hour One -yhtiössä eroamme muista videogeneraattoreista ei kilpailun vuoksi, vaan syvään juurtuneen filosofian kautta, joka ohjaa lähestymistapamme laatuun, tuotesuunnitteluun ja markkinointistrategiaan. Ohjaavaksi periaatteeksi on aina asetettu inhimillisen elementin priorisointi, varmistamalla, että luomuksemme vakuuttavat aitouslla ja emotionaalisuudella. Olemme ylpeitä siitä, että toimimme parhaan laadun mukaisesti alan parhaana ilman kompromisseja. Käyttämällä edistynyttä 3D-videokuvausta, tarjoamme käyttäjillemme aitoa elokuvallista kokemusta. Lisäksi strategiamme on ainutlaatuinen ja mielipiteitä jakava; aloitamme viimeistellyllä tuotteella ja iteroidaan nopeasti kohti täydellisyyttä. Tämä lähestymistapa varmistaa, että tarjoamme aina askelen edellä olevia ratkaisuja ja asetamme uudet mittapuut videoiden luomisessa.

Millaisia näkemyksiä sinulla on NVIDIA:n seuraavan sukupolven GH200 Grace Hopper Superchip -alustasta?

Grace Hopper -arkkitehtuuri on todella merkittävä muutos. Jos GPU pystyy tehokkaasti käyttämään isäntälaiteensa RAM-muistia ilman, että laskenta jää täysin pullonkaulaksi, se avaa ovet tällä hetkellä mahdottomille malli/kiihdyttimen suhdeluvuille koulutuksessa, ja tuloksena on toivottu joustavuus koulutustehtävien koissa. Olettaen, että koko GH200-varasto ei joudu kokonaan LLM-koulutukseen, toivomme pystyvämme käyttämään sitä suuresti vähentämään prototyyppien kustannuksia monimodaalisille arkkitehtuureillemme myöhemmin.

Onko muita prosessoreita, jotka ovat tällä hetkellä radarissasi?

Päämäärämme on tarjota käyttäjille video sisältöä, joka on hintakilpailukykyistä. Ottaen huomioon suuren muistin GPU:iden kysynnän tällä hetkellä, optimoidaan jatkuvasti ja kokeillaan kaikkia GPU-pilvi tarjoajia. Pyrimme myös olemaan vähintään osittain alusta-riippumattomia joissakin työkuormissamme. Tämän vuoksi seurataan TPUs:ia ja muita ASIC:ejä, ja myös kiinnitetään huomiota AMD:hen. Lopulta jokainen prosessorijohtainen optimointireitti, joka voi johtaa parempaan FLOPs/$ -suhteeseen, tullaan tutkimaan.

Mikä on visiosi tulevista edistysaskelista videoiden luomisessa?

24 kuukauden kuluttua emme pysty erottamaan luotua ihmistä tallennetusta. Se muuttaa monia asioita, ja olemme tämän edistysaskeleen eturintamassa.

Tällä hetkellä useimmat luodut videot ovat tietokoneille ja mobiililaitteille, mitä on muutettava, jotta voidaan saavuttaa valokuvan realistiset luodut avatarit ja maailmat sekä lisätyn todellisuuden (AR) että virtuaalitodellisuuden (VR) osalta?

Tällä hetkellä hallitsemme kyvyn luoda valokuvan realistisia avatarieita ja maailmoja sekä AR:lle että VR:lle. Pääasiallinen este on viive. Koska korkealaatuisten, reaaliaikaisen grafiikan toimittaminen reunalaiteille, kuten AR- ja VR-lasien, on tärkeää, saavuttaminen siitä vaivattomasti riippuu useista tekijöistä. Ennen kaikkea olemme riippuvaisia prosessorinvalmistuksen edistymisestä, jotta voidaan varmistaa nopeampi ja tehokkaampi prosessointi. Samalla virrankulutuksen optimointi on tärkeää, jotta voidaan varmistaa pidempi käyttöaika ilman, että kokemus heikkenee. Viimeiseksi odotamme ohjelmistokehitystä, joka voi tehokkaasti silittää välin generoimisen ja reaaliaikaisen renderöinnin välillä. Kun nämä tekijät yhdistyvät, näemme kasvavan hyödyntämisen valokuvan realistisia avatarieita ja ympäristöjä sekä AR- että VR-alustoilla.

Mitä odotat seuraavan suuren läpimurron olevan AI:ssa?

Kun on kyse seuraavasta merkittävästä läpimurrosta AI:ssa, on aina ilmassa jännitystä ja odotusta. Vaikka olen maininnut joitakin edistysaskelia aiemmin, sen, mitä voin jakaa, on, että työskentelemme aktiivisesti useilla merkittävillä innovaatioilla tällä hetkellä. Haluaisin perehtyä yksityiskohtiin, mutta toistaiseksi kannustan kaikkia seuraamaan tulevia julkaisujamme. AI:n tulevaisuus lupaa paljon, ja olemme innoissamme olla tämän edelläkävijäisen työn eturintamassa. Odottakaa!

Onko muita asioita, joita haluaisit jakaa Hour One -yhtiöstä?

Pitäisi ehdottomasti tarkastella Discord-kanavaamme ja API:amme, uusia lisäyksiä platform-ratkaisuumme Hour One:ssa.

Antoine on visionäärinen johtaja ja Unite.AI:n perustajakumppani, jota ohjaa horjumaton intohimo muokata ja edistää tulevaisuuden tekoälyä ja robottiikkaa. Sarjayrittäjänä hän uskoo, että tekoäly tulee olemaan yhtä mullistava yhteiskunnalle kuin sähkö, ja hänestä usein kuuluu ylistyksiä mullistavien teknologioiden ja AGI:n mahdollisuuksista.
Hänen ollessaan futuristi, hän on omistautunut tutkimiseen, miten nämä innovaatiot muokkaavat maailmaamme. Lisäksi hän on Securities.io:n perustaja, joka on alusta, joka keskittyy sijoittamiseen uraauurtaviin teknologioihin, jotka määrittelevät uudelleen tulevaisuuden ja muokkaavat koko sektoreita.