Connect with us

Joshua Xu, Co-Founder & CEO at HeyGen – Interview Series

Interviews

Joshua Xu, Co-Founder & CEO at HeyGen – Interview Series

mm

Joshua Xu ist der Co-Founder und CEO bei HeyGen, einer Plattform, die es Benutzern ermöglicht, mühelos Studio-Qualitäts-Videos mit AI-generierten Avataren und Stimmen zu produzieren.

Sie haben HeyGen 2020 mit der Vision gegründet, visuelle Erzählungen durch KI neu zu erfinden. Können Sie uns erzählen, was Sie dazu inspiriert hat, HeyGen zu gründen, und Ihre anfängliche Vision für diese Mission?

Bevor ich HeyGen gründete, arbeitete ich im Werbeteam von Snap, wo ich die Integration von KI in die Snapchat-Plattform leitete. Später wechselte ich zum Team, um an der KI-erweiterten Kamera zu arbeiten. Es war 2018, und KI erregte damals nicht so viel Aufmerksamkeit wie heute, aber unser Team arbeitete hart daran, mit KI Dinge für Bilder und Videos zu erstellen, die es damals noch nicht gab. Ich erkannte, dass der Computer hochwertige und realistische Videos erstellen kann. Ich wurde aufgeregt über das Potenzial dieser Technologie und darüber, wie sie die Art und Weise, wie Menschen Inhalte erstellen, vollständig verändern könnte.

Neue Inhaltsplattformen haben die Einführung der Mobilkamera revolutioniert. Wir haben gesehen, wie Instagram, Snapchat, TikTok und andere Inhaltsplattformen entstanden sind und eine neue Möglichkeit für Inhalte-Ersteller geschaffen haben, personalisierte, qualitativ hochwertige Inhalte zu erstellen. Aber auch mit Hilfe der Mobilkamera gibt es noch Barrieren, um erstklassige Inhalte zu erstellen. Einige der Barrieren, die ich erlebt habe, waren: Fähigkeiten vor der Kamera, die Zeit und Ressourcen, die zum Aufnehmen von Videos benötigt werden, und hohe Produktionskosten.

Bei HeyGen glauben wir, dass die Kamera ersetzt werden kann. Ich habe meine Karriere im Mobilkamera-Bereich begonnen, wo ich an Software und Technologie gearbeitet habe, um es Menschen leichter zu machen, Inhalte zu erstellen. Aber diese Zielgruppe kämpft immer noch darum, qualitativ hochwertige Inhalte allein mit Mobilkameras zu erstellen. Unser Team bei HeyGen denkt, dass wir, wenn wir die Kamera ersetzen können, die Barrieren für visuelle Erzählungen und Inhalte-Erstellung beseitigen können, was uns einen Schritt voraus bringt.

Können Sie über die Herausforderungen sprechen, denen sich HeyGen in den Anfangsphasen gegenübersah, und wie das Team diese überwunden hat, um Profitabilität und schnelles Wachstum zu erzielen?

Da die Verbraucher noch neu in der generativen KI-Industrie sind, haben sie viele Fragen zu HeyGen’s ethischer Richtlinie. Wir möchten betonen, dass HeyGen’s Richtlinien und Produkte die Erstellung von nicht autorisierten Inhalten strengstens verbieten und dass wir den Missbrauch unserer Plattform sehr ernst nehmen.

Unsere Sicherheitsvorkehrungen umfassen eine erweiterte Benutzerüberprüfung, einschließlich Live-Video-Zustimmung, dynamische mündliche Passwörter und eine schnelle menschliche Überprüfung aller Avatar-Verifizierungen. Soweit wir wissen, ist seit der Implementierung dieser Protokolle kein Missbrauch aufgetreten. Vertrauen und Sicherheit sind für unser Geschäft von entscheidender Bedeutung, und wir arbeiten aktiv mit der gesamten Branche zusammen, um weiterhin die notwendigen Werkzeuge und Best Practices zu entwickeln, um Fehlinformationen und KI-Missbrauch zu bekämpfen.

Wie ermöglicht HeyGen’s KI-Technologie es Unternehmen, Videos 10-mal schneller und mit weniger Overhead zu erstellen?

Als ich HeyGen gründete, erkannte ich, dass das Bearbeiten von Videos nicht teuer ist, aber die Anstellung eines Video-Produktionsteams schon. Da wir in einer video-ersten Welt leben, möchten Unternehmen ihre Zielgruppe mit Video-Inhalten ansprechen, werden aber durch die Kosten und Komplexität der Video-Produktion behindert. HeyGen hilft Unternehmen, professionelle Videos zu erstellen, komplett mit Text-zu-Sprache-KI-Avatarn, die diese Videos von Grund auf erzählen. Mit HeyGen’s Video-Generierung benötigen Sie keine Studios, keine Schauspieler, keine speziellen Fähigkeiten, um Videos für Ihr Unternehmen zu erstellen.

Wenn Unternehmen auf die Anstellung von Filmcrews verzichten – teure Ausrüstung kaufen, mit schwierigen Schauspielern umgehen, teure Nachaufnahmen und lästige Nachbearbeitung – erstellen HeyGen-Benutzer Videos 10-mal schneller. Es spart Teams Zeit und Geld und macht es einfacher, den Inhalt zu skalieren, der ihre Unternehmensergebnisse beeinflusst.

Die Fähigkeit, Videos in 175+ Sprachen und Dialekte zu lokalisieren, ist beeindruckend. Können Sie erklären, wie HeyGen dies erreicht und eine natürliche Lippen-Synchronisation und Stimme-Qualität beibehält?

Unser Team bei HeyGen verwendet Text-zu-Sprache-Technologie. Das bedeutet, dass HeyGen den Text, den Sie schreiben, in Audio-Dateien umwandelt. Wir konzentrierten uns darauf, die Video-Generierung über unsere Schwelle zu heben, und wir möchten Menschen helfen, die tatsächliche Kamera zu ersetzen und den Inhalt-Produktionsprozess zu skalieren.

Mit über 40.000 zahlenden Kunden, welche Branchen oder Arten von Unternehmen sehen Sie die meisten Adaptionen von?

HeyGen hilft unseren mehr als 40.000+ Kunden, drei Dinge zu tun: Videos erstellen, lokalisieren und personalisieren, ohne die zusätzlichen Kosten, die mit der Anstellung einer Produktionsfirma verbunden sind. Unsere Software gewinnt bei Marketing-Teams an Popularität, wo wir sicherlich einen Anstieg bei der Lokalisierung sehen.

McDonald’s und The Weather Channel sind unter Ihren bemerkenswerten Kunden. Können Sie mehr Details über diese Zusammenarbeiten und die Ergebnisse, die sie mit HeyGen erzielt haben, teilen?

Die “Sweet Connections”-Kampagne von McDonald’s war für unser Team aufregend. Sie hob HeyGen’s Technologie hervor, insbesondere unsere Übersetzungs-Funktion. Enkelkinder nahmen eine Nachricht in der Muttersprache ihrer Großmutter mit unserer Video-Übersetz-Technologie auf. Es zeigte der Welt, dass KI für jeden da ist, einschließlich Großmüttern und ihren Enkelkindern.

Wir haben auch mit dem Entwicklungsprogramm der Vereinten Nationen (UNDP) an einem globalen Projekt für ihre neue Weather Kids-Kampagne zusammengearbeitet, die in Zusammenarbeit mit der Weltorganisation für Meteorologie (WMO) und The Weather Channel entstand. Die Kampagne war Teil der Bemühungen des UNDP, das Bewusstsein für die Auswirkungen des Klimawandels zu erhöhen und Menschen weltweit zu mobilisieren, um sinnvolle Klimaschutzmaßnahmen für zukünftige Generationen zu ergreifen. Zuschauer konnten die Wettervorhersage für 2050 sehen, die von Weather Kids präsentiert wurde: eine spezielle Vorhersage aus dem Jahr 2050, moderiert von Kindermeteorologen, die von HeyGen unterstützt wurden.

Das Feld der KI-Video-Generierung entwickelt sich rasch. Welche zukünftigen Anwendungen oder Fortschritte in der KI-Video-Technologie sehen Sie voraus, und wie positioniert sich HeyGen für diese?

Wenn Menschen ansprechende Video-Inhalte erstellen können, werden sie natürlich mehr Videos erstellen, und jedes Unternehmen zielt darauf ab, seine Video-Ausgabe in der heutigen video-ersten Welt zu erhöhen. Für HeyGen sehen wir uns selbst dabei, personalisierte Videos für alle unsere Kunden mit einem Vollkörper-Avatar zu erstellen.

Wie sehen Sie die Rolle der KI in der breiteren Feld der digitalen Erzählung und Inhalte-Erstellung in den nächsten fünf Jahren?

Es gibt viele Möglichkeiten da draußen. Menschen können jetzt Footage zusammenstellen und KI-gesteuertes Editing verwenden, um ein poliertes Video zu erstellen. Wenn wir auf dem Weg mit generativer KI voranschreiten, können wir die Technologie erheblich verbessern und die Leistung signifikant steigern. Dies könnte letztendlich dazu führen, dass wir die Ergebnisse der generativen KI-Erstellung im Streaming-Bereich erleben.

Wie wird die KI-Video-Generierung letztendlich die Filmindustrie stören?

Da HeyGen sich auf die Anpassung von Videos für Unternehmen spezialisiert hat, glauben wir, dass ansprechende, hochwertige Inhalte auch ohne eine Mobilkamera erstellt werden können.

Wenn es um die kreativen Künste geht, wird KI sicherlich die Filmindustrie stören. Stellen Sie sich eine Welt vor, in der Menschen Videos lokalisieren. Dieser Ansatz könnte die Nutzung generativer KI anstelle von zusätzlichen Kosten für Nachaufnahmen beinhalten.

HeyGen hat kürzlich erfolgreich eine Series-A-Finanzierungsrunde in Höhe von 60 Mio. USD abgeschlossen, wie wird dies die zukünftigen Pläne des Unternehmens beeinflussen?

Da unser Geschäft seit dem 2. Quartal 2023 profitabel ist, konzentrierte sich unsere Series-A-Finanzierungsrunde hauptsächlich darauf, weltklasse-Berater und Investoren zu gewinnen, um uns beim Skalieren zu helfen. Sie wird uns auch dabei helfen, unsere Produkt-Roadmap zu beschleunigen und das Wachstum der Markt-Teams in LA, San Francisco, Palo Alto und Toronto zu erweitern.

Vielen Dank für das großartige Interview, Leser, die mehr erfahren möchten, sollten HeyGen besuchen.

Antoine ist ein visionärer Führer und Gründungspartner von Unite.AI, getrieben von einer unerschütterlichen Leidenschaft für die Gestaltung und Förderung der Zukunft von KI und Robotik. Ein Serienunternehmer, glaubt er, dass KI so disruptiv für die Gesellschaft sein wird wie Elektrizität, und wird oft dabei ertappt, wie er über das Potenzial disruptiver Technologien und AGI schwärmt.

Als futurist ist er darauf fokussiert, zu erforschen, wie diese Innovationen unsere Welt formen werden. Zusätzlich ist er der Gründer von Securities.io, einer Plattform, die sich auf Investitionen in hochmoderne Technologien konzentriert, die die Zukunft neu definieren und ganze Branchen umgestalten.