Wywiady
Joshua Xu, Współzałożyciel i CEO w HeyGen – Seria wywiadów

Joshua Xu jest Współzałożycielem i CEO w HeyGen platformie, która umożliwia użytkownikom łatwe tworzenie filmów o jakości studyjnej z wykorzystaniem awatarów i głosów generowanych przez sztuczną inteligencję.
Współzałożyłeś HeyGen w 2020 roku z wizją rewolucjonizacji opowieści wizualnych za pomocą sztucznej inteligencji. Czy możesz podzielić się tym, co zainspirowało Cię do założenia HeyGen i Twoją wizją tej misji?
Przed założeniem HeyGen pracowałem w zespole reklamowym Snap, gdzie kierowałem integracją sztucznej inteligencji z platformą Snapchat. Później przeszedłem do zespołu, który pracował nad kamerą wspomaganą przez sztuczną inteligencję. Był to 2018 rok, a sztuczna inteligencja nie wzbudzała jeszcze takiego zainteresowania, jak teraz, ale nasz zespół pracował ciężko, aby stworzyć elementy dla obrazów i filmów z wykorzystaniem sztucznej inteligencji, które nie istniały wcześniej. Wtedy zrozumiałem, że komputer może tworzyć filmy o wysokiej jakości i realistyczne. Zacząłem się ekscytować potencjałem tej technologii i tym, jak może całkowicie zmienić sposób tworzenia treści.
Nowe platformy treści rewolucjonizowały wprowadzenie kamery mobilnej. Zobaczyliśmy pojawienie się Instagrama, Snapchata, TikToka i innych platform treści, które odblokowały nowy sposób tworzenia personalizowanych, wysokiej jakości treści. Ale nawet z pomocą kamery mobilnej nadal istnieją bariery w tworzeniu treści pierwszej klasy. Niektóre z barier, które doświadczyłem, to: umiejętności przed kamerą, czas i zasoby potrzebne do nagrywania filmów oraz wysokie koszty produkcji.
W HeyGen wierzymy, że kamerę można zastąpić. Rozwinąłem swoją karierę w przestrzeni kamery mobilnej, gdzie pracowałem nad oprogramowaniem i technologią, aby ułatwić ludziom tworzenie treści. Ale ta publiczność nadal ma trudności z tworzeniem wysokiej jakości treści wyłącznie z wykorzystaniem kamery mobilnej. Nasz zespół w HeyGen uważa, że jeśli możemy zastąpić kamerę, oznacza to, że możemy usunąć barierę w tworzeniu opowieści wizualnych i treści, co daje nam przewagę.
Czy możesz omówić wyzwania, z którymi HeyGen zmagał się na początku i jak zespół pokonał je, aby osiągnąć rentowność i szybki wzrost?
Ponieważ konsumenci są nadal nowicjuszami w branży generatywnej sztucznej inteligencji, mają wiele pytań dotyczących polityki etycznej HeyGen. Chcemy powtórzyć, że polityka i produkty HeyGen surowo zabraniają tworzenia nieautoryzowanych treści, a my traktujemy nadużycie naszej platformy bardzo poważnie.
Nasze zabezpieczenia bezpieczeństwa obejmują zaawansowaną weryfikację użytkowników, w tym zgodę na nagranie wideo na żywo, dynamiczne hasła werbalne i szybką kontrolę ludzką wszystkich weryfikacji awatarów. Nasza wiedza nie wykazała żadnego przypadku nadużycia od wdrożenia tych protokołów. Zaufanie i bezpieczeństwo są kluczowe dla naszego biznesu, a my aktywnie współpracujemy z całym przemysłem, aby dalej rozwijać narzędzia i najlepsze praktyki niezbędne do walki z dezinformacją i nadużyciem sztucznej inteligencji.
Jak technologia HeyGen umożliwia firmom tworzenie filmów 10 razy szybciej i z mniejszymi nakładami?
Kiedy założyłem HeyGen, dowiedziałem się, że edycja filmów nie jest droga, ale zatrudnienie zespołu produkcyjnego jest. Ponieważ żyjemy w świecie, w którym filmy są na pierwszym miejscu, firmy chcą angażować swoją publiczność za pomocą treści wideo, ale są ograniczone przez koszt i złożoność produkcji wideo. HeyGen pomaga firmom generować profesjonalne filmy, w pełni z awatarami sztucznej inteligencji, które narrują te filmy od podstaw. Z generowaniem filmów HeyGen nie potrzebujesz studia, obsady, specjalistycznych umiejętności, aby tworzyć filmy dla swojej firmy.
Kiedy firmy rezygnują z zatrudniania ekip filmowych – kupowania drogiego sprzętu, radzenia sobie z kapryśnymi aktorami, ponoszenia kosztów ponownych ujęć i nudnych edycji postprodukcyjnych – użytkownicy HeyGen tworzą filmy 10 razy szybciej. To oszczędza czas i pieniądze zespołom i ułatwia skalowanie treści, które wpływają na ich wyniki finansowe.
Możliwość lokalizacji filmów w ponad 175 językach i dialektach jest imponująca. Czy możesz wyjaśnić, jak HeyGen to osiąga i utrzymuje naturalną synchronizację ust i jakość głosu?
Nasz zespół w HeyGen wykorzystuje technologię text-to-speech. Oznacza to, że HeyGen konwertuje tekst, który piszesz, na pliki audio. Skoncentrowaliśmy się na tym, aby zapewnić, że jakość generowanych filmów jest powyżej naszego progu, i chcemy pomóc ludziom zastąpić prawdziwą kamerę i skalować proces produkcji treści.
Z ponad 40 000 płacących klientów, jakie branże lub rodzaje firm widzisz największe przyjęcie?
HeyGen pomaga naszym ponad 40 000 klientom robić trzy rzeczy: tworzyć, lokalizować i personalizować filmy bez dodatkowych kosztów związanych z zatrudnieniem firmy produkcyjnej. Nasze oprogramowanie zyskuje popularność wśród zespołów marketingowych, gdzie zdecydowanie widzimy wzrost lokalizacji.
McDonald’s i The Weather Channel są wśród Twoich znaczących klientów. Czy możesz podzielić się więcej szczegółami na temat tych współprac i wyników, które osiągnęli z wykorzystaniem HeyGen?
Kampania “Sweet Connections” McDonald’s była ekscytująca dla naszego zespołu. Podkreśliła technologię HeyGen, szczególnie naszą funkcję tłumaczenia. Wnuki nagrali wiadomość w ojczystym języku babci z wykorzystaniem naszej technologii Video Translate. Pokazało to światu, że sztuczna inteligencja jest dla wszystkich, w tym dla babć i ich wnuków.
Współpracowaliśmy również z Programem Rozwoju Narodów Zjednoczonych (UNDP) w ramach globalnego projektu kampanii Weather Kids, stworzonej we współpracy z Światową Organizacją Meteorologiczną (WMO) i The Weather Channel. Kampania była częścią wysiłków UNDP, aby zwiększyć świadomość wpływu zmian klimatycznych i zmobilizować ludzi na całym świecie do podjęcia znaczących działań na rzecz klimatu dla przyszłych pokoleń. Widzowie mogli obejrzeć prognozę na 2050 rok przedstawioną przez Weather Kids: specjalną prognozę z 2050 roku prowadzoną przez młodych meteorologów zasilanych przez HeyGen.
Jakie przyszłe zastosowania lub postępy w technologii wideo sztucznej inteligencji przewidujesz, i jak HeyGen przygotowuje się do nich?
Jeśli ludzie mogą generować angażujące treści wideo, będą naturalnie tworzyć więcej filmów, a każda firma stara się zwiększyć swoją produkcję wideo w dzisiejszym świecie, w którym filmy są na pierwszym miejscu. Dla HeyGen widzimy siebie tworzących personalizowane filmy dla wszystkich naszych klientów z wykorzystaniem pełnego awatara.
Jak wyobrażasz sobie rolę sztucznej inteligencji w szerszym zakresie opowieści cyfrowych i tworzenia treści w ciągu najbliższych pięciu lat?
Istnieje wiele możliwości. Ludzie mogą teraz montować fragmenty i wykorzystywać edycję napędzaną przez sztuczną inteligencję, aby stworzyć wykończony film. Jeśli będziemy kontynuować ten ścieżkę z generatywną sztuczną inteligencją, możemy znacznie poprawić wydajność. To mogłoby ostatecznie doprowadzić do doświadczenia efektów tworzenia sztucznej inteligencji w przestrzeni streamingu.
Jak generowanie wideo sztucznej inteligencji ostatecznie zakłóci przemysł filmowy?
Chociaż HeyGen specjalizuje się w tworzeniu niestandardowych filmów dla firm, wierzymy, że angażujące, wysokiej jakości treści mogą być tworzone nawet bez kamery mobilnej.
Kiedy chodzi o sztuki twórcze, sztuczna inteligencja z pewnością zakłóci przemysł filmowy. Chociaż to nie jest naszym celem, wyobraź sobie świat, w którym ludzie lokalizują filmy. To mogłoby obejmować wykorzystanie generatywnej sztucznej inteligencji zamiast ponoszenia dodatkowych kosztów na ponowne ujęcia.
HeyGen niedawno pomyślnie zebrał 60 milionów dolarów w ramach serii A, jak to wpłynie na plany firmy?
Ponieważ nasz biznes jest rentowny od II kwartału 2023 roku, nasza runda finansowania serii A była głównie skupiona na sprowadzeniu światowej klasy doradców i inwestorów, aby nam pomóc w skalowaniu. Pomoże to również przyspieszyć naszą mapę drogową produktu i rozszerzyć wzrost zespołów rynkowych z siedzibami w LA, San Francisco, Palo Alto i Toronto.
Dziękujemy za wspaniały wywiad, czytelnicy, którzy chcą dowiedzieć się więcej, powinni odwiedzić HeyGen.












