Connect with us

Intervjuer

Joshua Xu, medgrunnlegger og CEO i HeyGen – Intervju-serie

mm

Joshua Xu er medgrunnlegger og CEO i HeyGen, en plattform som gjør det mulig for brukerne å produsere studio-kvalitetsvideoer med AI-genererte avatarer og stemmer.

De grunnla HeyGen i 2020 med visjonen om å gjenskape visuell fortelling gjennom AI. Kan du dele hva som inspirerte deg til å starte HeyGen og din opprinnelige visjon for denne oppgaven?

Før jeg grunnla HeyGen, jobbet jeg på Snaps annonseteam, der jeg ledet integreringen av AI i Snapchat-plattformen. Senere skiftet jeg team for å jobbe på AI-forbedret kamera. Det var i 2018, og AI fikk ikke like mye oppmerksomhet da som nå, men vårt team jobbet hardt for å lage elementer for bilder og videoer med AI som ikke eksisterte da. Da realiserte jeg at datamaskinen kan lage høykvalitets- og realistiske videoer. Jeg ble begeistret for potensialet i denne teknologien og hvordan den kunne endre måten mennesker lager innhold på.

Nye innholdplattformer har revolusjonert introduksjonen av mobilkamera. Vi har sett Instagram, Snapchat, TikTok og andre innholdplattformer dukke opp og låse opp en ny måte for innholdsskapere å lage personlig, kvalitetsinnhold på. Men selv med hjelp av et mobilkamera, er det fortsatt barrierer for å lage førsteklasses innhold. Noen av barrierene jeg opplevde, inkluderte: ferdigheter på kamera, tiden og ressursene som trengs for å spille inn videoer, og høye produksjonskostnader.

Vår tro på HeyGen er at kameraet er erstattelig. Jeg bygde min karriere i mobilkamera-rommet, der jeg jobbet på programvare og teknologi for å gjøre det enklere for mennesker å lage innhold. Men denne publikumgruppen sliter fortsatt med å lage kvalitetsinnhold bare ved hjelp av mobilkameraer. Vårt team på HeyGen føler at hvis vi kan erstatte kameraet, betyr det at vi kan fjerne barrieren for visuell fortelling og innholdsskapning, noe som gir oss et skritt fremover.

Kan du diskutere utfordringene HeyGen møtte i sine tidlige faser og hvordan teamet overvant dem for å oppnå lønnsomhet og rask vekst?

Ettersom forbrukerne fortsatt er nye i den generative AI-industrien, har de mange spørsmål omkring HeyGens etiske politikk. Vi ønsker å gjenta at HeyGens politikker og produkter strengt forbinder skapning av uautorisert innhold, og vi tar misbruk av vår plattform ekstremt alvorlig.

Våre sikkerhetstiltak inkluderer avansert bruker-verifisering, inkludert live video-samtykke, dynamiske verbale passord og rask menneskelig gjennomgang av alle avatar-verifiseringer. Så langt vi vet, har det ikke skjedd noen misbruk siden vi implementerte disse protokollene. Tillit og sikkerhet er kritisk for vår forretning, og vi samarbeider aktivt på tvers av industrien for å fortsette å utvikle verktøyene og beste praksis nødvendig for å bekjempe desinformasjon og AI-misbruk.

Hvordan gjør HeyGens AI-teknologi det mulig for bedrifter å lage videoer 10 ganger raskere og med mindre overhead?

Da jeg startet HeyGen, lærte jeg at redigering av videoer ikke er dyrt, men å ansette et video-produksjonsteam er. Fordi vi lever i en video-først-verden, ønsker bedrifter å engasjere sine publikum med video-innhold, men er hindret av kostnaden og kompleksiteten ved video-produksjon. HeyGen hjelper bedrifter å generere profesjonelle videoer, komplette med tekst-til-tale AI-avatarer som forteller disse videoene fra scratch. Med HeyGens video-generering, trenger du ikke et studio, skuespillere eller spesialiserte ferdigheter for å lage videoer for din bedrift.

Når bedrifter ikke lenger behøver å ansette film-mannskap – kjøpe dyrt utstyr, håndtere vanskelige skuespillere, besværlige om-innspillinger og irriterende post-produksjons-redigering – lager HeyGen-brukerne videoer 10 ganger raskere. Det sparer teamer tid og penger og gjør det enklere å skalle opp innholdet som påvirker deres resultater.

Evnen til å lokalisere videoer til 175+ språk og dialekter er imponerende. Kan du forklare hvordan HeyGen oppnår dette og opprettholder naturlig leppesynk og stemmekvalitet?

Vårt team på HeyGen bruker tekst-til-tale-teknologi. Dette betyr at HeyGen konverterer tekstene du skriver til lydfiler. Vi fokuserte på å gjøre video-generering av video-kvalitet over vår terskel, og vi ønsker å hjelpe mennesker å erstatte det faktiske kameraet og skalle opp innholdproduksjonsprosessen.

Med over 40 000 betalende kunder, hvilke industrier eller typer bedrifter ser du mest adopsjon fra?

HeyGen hjelper våre over 40 000+ kunder med å gjøre tre ting: lage, lokalisere og personliggjøre videoer uten de ekstra kostnadene som involverer å ansette et produksjonsselskap. Vår programvare vinner popularitet blant markedsførings-team, der vi ser en økning i lokalisering.

McDonald’s og The Weather Channel er blant dine bemerkelsesverdige kunder. Kan du dele mer detaljer om disse samarbeidene og resultater de oppnådde ved å bruke HeyGen?

“Sweet Connections” McDonald’s-kampanjen var spennende for vårt team. Den viste HeyGens teknologi, særlig vår oversettelsesfunksjon. Barnebarn innspilte en melding på bestemors morsmål med vår Video Translate-teknologi. Den viste verden at AI er for alle, inkludert bestemødre og deres barnebarn.

Vi samarbeidet også med FNs utviklingsprogram (UNDP) på et globalt prosjekt for deres nye Weather Kids-kampanje, skapt i samarbeid med Verdens meteorologiske organisasjon (WMO) og The Weather Channel. Kampanjen var en del av UNDPs innsats for å øke bevisstheten om klimaendringens virkninger og mobilisere mennesker over hele verden til å iverksette meningsfulle klima-aksjoner for fremtidige generasjoner. Seerne kunne se 2050-utsikten levert av Weather Kids: en spesiell utsikt fra år 2050 ankret av barn-værmeldere drevet av HeyGen.

Hvilke fremtidige anvendelser eller fremgang i AI-video-teknologi forutser du, og hvordan stiller HeyGen seg til disse?

Hvis mennesker kan generere engasjerende video-innhold, vil de naturlig nok lage mer videoer, og hver bedrift ønsker å øke sin video-utgang i dagens video-først-verden. For HeyGen ser vi oss selv som skapere av personlige videoer for alle våre kunder med en full-kropps-avatar.

Hvordan ser du på rollen til AI i det bredere feltet for digital fortelling og innholdsskapning i de neste fem årene?

Det finnes mange muligheter der ute. Mennesker kan nå samle inn opptak og bruke AI-drevet redigering til å lage en polert video. Hvis vi fortsetter på en fremover-vendt vei med generativ AI, kan vi fremme teknologien og betydelig forbedre ytelsen. Dette kan til slutt føre til å oppleve resultater av generativ AI-skaping i strømmingsrommet.

Hvordan vil AI-video-generering til slutt forstyrre filmindustrien?

Selv om HeyGen spesialiserer seg på å tilpasse tilpassede videoer for bedrifter, tror vi at overbevisende, høykvalitets-innhold kan skapes selv uten et mobilkamera.

Når det gjelder de kreative kunstene, vil AI uten tvil forstyrre filmindustrien. Selv om dette ikke er HeyGens fokus, forestiller du deg en verden der mennesker lokalisere en video. Denne tilnærmingen kan innebære å bruke generativ AI i stedet for å pådra seg ekstra kostnader på om-innspillinger.

HeyGen har nylig samlet inn 60 millioner dollar i serie A-finansiering, hvordan vil dette påvirke selskapets fremtidige planer?

Ettersom vår forretning har vært lønnsom siden Q2 i 2023, var vår serie A-finansieringsrunde primært fokusert på å bringe inn verdensklasse-rådgivere og investorer for å hjelpe oss å skalle opp. Det vil også hjelpe oss å akselerere vår produkt-vei-kart og utvide veksten av markeds-team basert i LA, San Francisco, Palo Alto og Toronto.

Takk for det flotte intervjuet, lesere som ønsker å lære mer, bør besøke HeyGen.

Antoine er en visjonær leder og grunnleggende partner i Unite.AI, drevet av en urokkelig lidenskap for å forme og fremme fremtiden for AI og robotikk. En seriegründer, han tror at AI vil være like disruptiv for samfunnet som elektrisitet, og blir ofte tatt i å tale om potensialet for disruptiv teknologi og AGI.
Som en futurist, er han dedikert til å utforske hvordan disse innovasjonene vil forme vår verden. I tillegg er han grunnleggeren av Securities.io, en plattform som fokuserer på å investere i banebrytende teknologier som omdefinerer fremtiden og omformer hele sektorer.