Connect with us

Joshua Xu, spoluzakladatel a CEO ve společnosti HeyGen – Interview Series

Rozhovory

Joshua Xu, spoluzakladatel a CEO ve společnosti HeyGen – Interview Series

mm

Joshua Xu je spoluzakladatel a CEO ve společnosti HeyGen , platformě, která umožňuje uživatelům snadno vytvářet studiové kvalitní videa s pomocí AI generovaných avatarů a hlasů.

Vy jste spoluzakladatelem HeyGen v roce 2020 s vizí obnovit vizuální vyprávění prostřednictvím AI. Můžete sdílet, co vás inspirovalo k založení HeyGen a vaši počáteční vizi pro tuto misi?

Předtím, než jsem založil HeyGen, jsem pracoval v reklamním týmu Snap, kde jsem vedl integraci AI do platformy Snapchat. Později jsem přešel do týmu, který pracoval na AI rozšířené kamery. Bylo to v roce 2018 a AI henüz nebyla tak populární jako dnes, ale náš tým tvrdě pracoval na vytváření položek pro obrázky a videa pomocí AI, které tehdy neexistovaly. Bylo mi tehdy jasné, že počítač může vytvářet vysoce kvalitní a realistické videa. Stal jsem se nadšeným z potenciálu této technologie a z toho, jak by mohla zcela změnit způsob, jakým lidé vytvářejí obsah.

Nové platformy pro obsah změnily způsob, jakým jsou uváděny mobilní kamery. Viděli jsme, jak vznikly Instagram, Snapchat, TikTok a další platformy pro obsah, a jak odemknuly nový způsob, jakým tvůrci obsahu mohou vytvářet personalizovaný, kvalitní obsah. Ale i s pomocí mobilní kamery stále existují bariéry pro vytváření první třídy obsahu. Některé z bariér, se kterými jsem se setkal, zahrnovaly: dovednosti pro práci před kamerou, čas a zdroje potřebné pro nahrávání videí a vysoké produkční náklady.

Ve společnosti HeyGen věříme, že kamera je nahraditelná. Rozvíjel jsem svou kariéru v oblasti mobilních kamer, kde jsem pracoval na softwaru a technologiích, aby bylo pro lidi snazší vytvářet obsah. Ale tato publika stále bojují s vytvářením kvalitního obsahu pouze pomocí mobilních kamer. Náš tým ve společnosti HeyGen se domnívá, že pokud můžeme nahradit kameru, znamená to, že můžeme odstranit bariéru pro vizuální vyprávění a vytváření obsahu, což nás dostává o krok dále.

Můžete diskutovat o výzvách, kterým HeyGen čelil v počátečních fázích a jak tým překonal tyto výzvy, aby dosáhl ziskovosti a rychlého růstu?

Jelikož spotřebitelé jsou stále noví v oblasti generativní AI, mají mnoho otázek týkajících se etické politiky HeyGen. Chceme zopakovat, že politika a produkty HeyGen přísně zakazují vytváření neautorizovaného obsahu a že bereme zneužívání naší platformy velmi vážně.

Naše bezpečnostní opatření zahrnují pokročilou verifikaci uživatelů, včetně živé video konzence, dynamických verbálních hesel a rychlé lidské kontroly všech avatarů. Naší znalostí, žádný zneužívání se nevyskytlo od implementace těchto protokolů. Důvěra a bezpečnost jsou kritické pro náš podnikání a aktivně spolupracujeme napříč průmyslem, abychom dále rozvíjeli nástroje a nejlepší postupy nezbytné pro boj proti dezinformacím a zneužívání AI.

Jak technologie HeyGen umožňuje firmám vytvářet videa 10krát rychleji a s nižšími náklady?

Když jsem založil HeyGen, naučil jsem se, že editace videí není drahá, ale najímání týmu pro produkci videa ano. Protože žijeme ve světě, kde je video na prvním místě, firmy chtějí zapojit své publikum pomocí videí, ale jsou omezovány náklady a složitostí produkce videí. HeyGen pomáhá firmám vytvářet profesionální videa, kompletní s text-to-speech AI avatary, které vyprávějí tato videa od začátku. S generováním videí HeyGen nemusíte mít studio, herecký soubor nebo specializované dovednosti, aby jste vytvářeli videa pro váš podnik.

Když firmy zruší najímání filmových týmů – nákup drahého vybavení, řešení problémů s herci, daňové opětovné natáčení a otravné postprodukční editace – uživatelé HeyGen vytvářejí videa 10krát rychleji. Ušetřili tak čas a peníze a usnadnili škálování obsahu, který dopadá na jejich dolní řádky.

Schopnost lokalizovat videa do 175+ jazyků a dialektů je působivá. Můžete vysvětlit, jak HeyGen dosahuje tohoto a udržuje přirozenou synchronizaci rtů a kvalitu hlasu?

Náš tým ve společnosti HeyGen používá technologii text-to-speech. To znamená, že HeyGen převádí text, který píšete, do audio souborů. Soustředili jsme se na to, aby byla kvalita videa generovaného videem nad naší prahovou hodnotou, a chceme pomoci lidem nahradit skutečnou kameru a škálovat proces produkce obsahu.

S více než 40 000 platících zákazníků, které průmysly nebo typy firem vidíte nejvíce přijetí?

HeyGen pomáhá našim více než 40 000+ zákazníkům dělat tři věci: vytvářet, lokalizovat a personalizovat videa bez dodatečných nákladů, které zahrnují najímání produkční společnosti. Naše software získává popularitu mezi marketingovými týmy, kde jsme určitě vidíme vzestup v lokalizaci.

McDonald’s a The Weather Channel jsou mezi vašimi významnými klienty. Můžete sdílet více detailů o těchto spolupráci a výsledcích, kterých dosáhli pomocí HeyGen?

Kampaň “Sweet Connections” McDonald’s byla pro náš tým zajímavá. Ukázala technologii HeyGen, zejména naši funkci překladu. Vnučata nahrála zprávu v rodném jazyce své babičky pomocí naší technologie Video Translate. Ukázala světu, že AI je pro každého, včetně babiček a jejich vnoučat.

Spolupracovali jsme také s Programem rozvoje OSN (UNDP) na globálním projektu pro jejich novou kampaň Weather Kids, vytvořenou ve spolupráci s Světovou meteorologickou organizací (WMO) a The Weather Channel. Kampaň byla součástí úsilí UNDP o zvýšení povědomí o dopadech změny klimatu a mobilizaci lidí po celém světě, aby přijali smysluplné kroky pro budoucí generace. Diváci mohli sledovat předpověď počasí pro rok 2050, kterou připravili Weather Kids: speciální předpověď z roku 2050, kterou moderovali dětské meteorologové poháněné HeyGen.

Obor AI video generace se rychle vyvíjí. Jaké budoucí aplikace nebo pokroky v AI video technologii předpovídáte a jak se HeyGen připravuje na tyto?

Pokud lidé mohou vytvářet atraktivní video obsah, budou přirozeně vytvářet více videí a každé podnikání se snaží zvýšit svůj video výstup v dnešním světě, kde je video na prvním místě. Pro HeyGen vidíme, že budeme vytvářet personalizovaná videa pro všechny naše zákazníky pomocí plnohodnotného avatara.

Jak si představujete roli AI v širším poli digitálního vyprávění a vytváření obsahu v průběhu příštích pěti let?

Existuje mnoho možností. Lidé mohou nyní sestavit záběry a použít AI poháněné editace, aby vytvořili vysoce kvalitní video. Pokud budeme pokračovat na cestě vpřed s generativní AI, můžeme pokročit v technologii a výrazně zlepšit výkon. To by mohlo nakonec vést k tomu, že budeme zažívat výsledky generativní AI tvorby v prostoru streamování.

Jak bude AI video generace nakonec narušit filmový průmysl?

Ačkoli se HeyGen specializuje na vytváření přizpůsobených videí pro firmy, věříme, že přesvědčivý, vysoce kvalitní obsah může být vytvořen i bez mobilní kamery.

Když se jedná o kreativní umění, AI určitě naruší filmový průmysl. Představte si svět, kde lidé lokalizují video. Tento přístup by mohl zahrnovat využití generativní AI místo toho, aby se platily dodatečné náklady na opětovné natáčení.

HeyGen nedávno úspěšně vybral 60 milionů dolarů v rámci série A financování, jak to ovlivní budoucí plány společnosti?

Jelikož náš podnikání bylo ziskové od druhého čtvrtletí roku 2023, naše série A financování se zaměřila primárně na to, aby přinesla světově uznávané poradce a investory, kteří nám pomohou škálovat. Také nám to pomůže urychlit náš produktový roadmap a rozšířit růst trhu týmů se sídlem v LA, San Francisku, Palo Altu a Torontu.

Děkuji za skvělý rozhovor, čtenáři, kteří chtějí se dozvědět více, by měli navštívit HeyGen.

Antoine je vizionářský líder a zakládající partner Unite.AI, poháněný neotřesitelnou vášní pro formování a propagaci budoucnosti AI a robotiky. Jako sériový podnikatel věří, že AI bude mít na společnost stejně disruptivní vliv jako elektřina, a často je chycen při tom, jak hovoří o potenciálu disruptivních technologií a AGI. Jako futurist, je zasvěcen prozkoumání toho, jak tyto inovace budou formovat náš svět. Kromě toho je zakladatelem Securities.io, platformy zaměřené na investice do špičkových technologií, které předefinovávají budoucnost a mění celé sektory.