Connect with us

Joshua Xu, Đồng sáng lập & CEO tại HeyGen – Loạt phỏng vấn

Phỏng vấn

Joshua Xu, Đồng sáng lập & CEO tại HeyGen – Loạt phỏng vấn

mm

Joshua Xu là Đồng sáng lập và CEO tại HeyGen một nền tảng cho phép người dùng tạo ra video chất lượng phòng thu một cách dễ dàng với hình đại diện và giọng nói được tạo bởi AI.

Bạn đã đồng sáng lập HeyGen vào năm 2020 với tầm nhìn tái định nghĩa cách kể chuyện trực quan thông qua AI. Bạn có thể chia sẻ những gì đã truyền cảm hứng cho bạn để bắt đầu HeyGen và tầm nhìn ban đầu của bạn cho nhiệm vụ này?

Trước khi thành lập HeyGen, tôi đã làm việc trong đội quảng cáo của Snap, nơi tôi đã dẫn đầu việc tích hợp AI vào nền tảng Snapchat. Sau đó, tôi chuyển sang làm việc trên camera tăng cường bằng AI. Đó là năm 2018, và AI không nhận được sự chú ý như bây giờ, nhưng đội của chúng tôi đã làm việc chăm chỉ để tạo ra các vật phẩm cho hình ảnh và video bằng AI mà không tồn tại tại thời điểm đó. Đó là khi tôi nhận ra rằng máy tính có thể tạo ra video chất lượng cao và thực tế. Tôi trở nên hào hứng về tiềm năng của công nghệ này và cách nó có thể thay đổi hoàn toàn cách mọi người tạo nội dung.

Các nền tảng nội dung mới đã cách mạng hóa việc giới thiệu máy ảnh di động. Chúng ta đã thấy Instagram, Snapchat, TikTok và các nền tảng nội dung khác xuất hiện và mở ra một cách mới cho các nhà tạo nội dung để tạo ra nội dung chất lượng và cá nhân hóa. Nhưng ngay cả với sự giúp đỡ của máy ảnh di động, vẫn còn những rào cản để tạo ra nội dung hàng đầu. Một số rào cản tôi đã gặp phải bao gồm: kỹ năng trên máy ảnh, thời gian và tài nguyên cần thiết để ghi video, và chi phí sản xuất cao.

Tại HeyGen, chúng tôi tin rằng máy ảnh có thể thay thế được. Tôi đã phát triển sự nghiệp của mình trong không gian máy ảnh di động, nơi tôi đã làm việc trên phần mềm và công nghệ để giúp mọi người tạo nội dung dễ dàng hơn. Nhưng khán giả đó vẫn gặp khó khăn trong việc tạo ra nội dung chất lượng chỉ bằng cách sử dụng máy ảnh di động. Đội ngũ của chúng tôi tại HeyGen cảm thấy rằng nếu chúng tôi có thể thay thế máy ảnh, điều đó có nghĩa là chúng tôi có thể loại bỏ rào cản đối với việc kể chuyện trực quan và tạo nội dung, điều này giúp chúng tôi đi trước.

Bạn có thể thảo luận về những thách thức mà HeyGen đã gặp phải trong giai đoạn đầu và cách đội ngũ đã vượt qua chúng để đạt được lợi nhuận và tăng trưởng nhanh chóng?

Vì người tiêu dùng vẫn còn mới với ngành công nghiệp AI tạo sinh, họ có nhiều câu hỏi về chính sách đạo đức của HeyGen. Chúng tôi muốn nhấn mạnh rằng các chính sách và sản phẩm của HeyGen nghiêm cấm việc tạo ra nội dung không được ủy quyền, và chúng tôi coi trọng việc lạm dụng nền tảng của chúng tôi một cách nghiêm trọng.

Các biện pháp bảo vệ an ninh của chúng tôi bao gồm xác minh người dùng tiên tiến, bao gồm cả việc đồng ý video trực tiếp, mã passcode động và xem xét nhanh chóng của con người đối với tất cả các xác minh hình đại diện. Theo kiến thức của chúng tôi, không có trường hợp lạm dụng nào đã xảy ra kể từ khi thực hiện các giao thức này. Niềm tin và An toàn là rất quan trọng đối với doanh nghiệp của chúng tôi, và chúng tôi đang tích cực hợp tác trên toàn ngành để tiếp tục phát triển các công cụ và thực hành tốt nhất cần thiết để chống lại thông tin sai lệch và lạm dụng AI.

Làm thế nào công nghệ AI của HeyGen cho phép các doanh nghiệp tạo video nhanh hơn 10 lần và với ít chi phí hơn?

Khi tôi bắt đầu HeyGen, tôi đã học được rằng việc chỉnh sửa video không tốn kém, nhưng việc thuê một đội sản xuất video thì có. Bởi vì chúng ta sống trong một thế giới ưu tiên video, các doanh nghiệp muốn thu hút khán giả của họ bằng nội dung video nhưng bị hạn chế bởi chi phí và sự phức tạp của sản xuất video. HeyGen giúp các công ty tạo ra video chất lượng chuyên nghiệp, hoàn chỉnh với hình đại diện AI nói từ văn bản mà không cần một studio, dàn diễn viên hoặc kỹ năng chuyên môn để tạo video cho doanh nghiệp của họ.

Khi các doanh nghiệp không cần thuê đội quay phim – mua thiết bị đắt tiền, đối phó với diễn viên khó tính, quay lại và chỉnh sửa hậu kỳ tốn thời gian – người dùng HeyGen tạo video nhanh hơn 10 lần. Điều này giúp các đội tiết kiệm thời gian và tiền bạc, và làm cho nó dễ dàng hơn để tăng quy mô nội dung ảnh hưởng đến lợi nhuận của họ.

Khả năng định vị video sang 175+ ngôn ngữ và phương ngữ là ấn tượng. Bạn có thể giải thích cách HeyGen đạt được điều này và duy trì sự đồng bộ hóa tự nhiên của môi và chất lượng giọng nói?

Đội ngũ của chúng tôi tại HeyGen sử dụng công nghệ văn bản thành giọng nói. Điều này có nghĩa là HeyGen chuyển đổi văn bản mà bạn viết thành tệp âm thanh. Chúng tôi tập trung vào việc tạo ra chất lượng video trên ngưỡng của chúng tôi, và chúng tôi muốn giúp mọi người thay thế máy ảnh thực sự và tăng quy mô quá trình sản xuất nội dung.

Với hơn 40.000 khách hàng trả tiền, loại ngành hoặc loại doanh nghiệp nào bạn đang thấy sự áp dụng nhiều nhất?

HeyGen giúp hơn 40.000 khách hàng của chúng tôi thực hiện ba việc: tạo, định vị và cá nhân hóa video mà không có chi phí thêm cho việc thuê một công ty sản xuất. Phần mềm của chúng tôi đang trở nên phổ biến trong các đội tiếp thị, nơi chúng tôi chắc chắn đang chứng kiến sự tăng trưởng về định vị.

McDonald’s và The Weather Channel là среди khách hàng đáng chú ý của bạn. Bạn có thể chia sẻ thêm chi tiết về các hợp tác này và kết quả họ đạt được khi sử dụng HeyGen?

Chiến dịch “Sweet Connections” của McDonald’s là một dự án thú vị cho đội ngũ của chúng tôi. Nó đã nhấn mạnh công nghệ của HeyGen, đặc biệt là tính năng dịch video của chúng tôi. Cháu trai và cháu gái đã ghi lại một thông điệp bằng ngôn ngữ mẹ đẻ của bà ngoại họ với công nghệ Video Translate của chúng tôi. Điều đó đã cho thấy thế giới rằng AI là dành cho mọi người, bao gồm cả bà và cháu.

Chúng tôi cũng đã hợp tác với Chương trình Phát triển Liên Hợp Quốc (UNDP) về một dự án toàn cầu cho chiến dịch Weather Kids mới của họ, được tạo ra hợp tác với Tổ chức Khí tượng Thế giới (WMO) và The Weather Channel. Chiến dịch là một phần của nỗ lực của UNDP nhằm tăng cường nhận thức về tác động của biến đổi khí hậu và huy động mọi người trên toàn thế giới thực hiện hành động có ý nghĩa về biến đổi khí hậu cho các thế hệ tương lai. Người xem có thể xem dự báo thời tiết năm 2050 được trình bày bởi Weather Kids: một dự báo đặc biệt từ năm 2050 do các nhà khí tượng học trẻ được cung cấp bởi HeyGen.

Trường hợp của công nghệ video AI đang phát triển nhanh chóng. Những ứng dụng hoặc tiến bộ trong công nghệ video AI trong tương lai bạn dự đoán, và HeyGen đang định vị mình như thế nào cho những điều này?

Nếu mọi người có thể tạo ra nội dung video hấp dẫn, họ sẽ tự nhiên tạo ra nhiều video hơn, và mọi doanh nghiệp đều nhằm tăng sản lượng video của mình trong thế giới ưu tiên video ngày nay. Đối với HeyGen, chúng tôi thấy mình đang tạo ra video cá nhân hóa cho tất cả khách hàng của mình bằng cách sử dụng hình đại diện toàn thân.

Bạn hình dung vai trò của AI trong lĩnh vực kể chuyện kỹ thuật số và tạo nội dung rộng lớn hơn sẽ phát triển như thế nào trong năm năm tới?

Có nhiều khả năng ở đó. Người ta có thể lắp ráp cảnh quay và sử dụng chỉnh sửa AI để tạo ra một video hoàn thiện. Nếu chúng tôi tiếp tục trên con đường phía trước với AI tạo sinh, chúng tôi có thể phát triển công nghệ và nâng cao hiệu suất đáng kể. Điều này cuối cùng có thể dẫn đến việc trải nghiệm kết quả của việc tạo ra AI trong không gian phát trực tuyến.

Làm thế nào việc tạo video AI sẽ cuối cùng phá vỡ ngành công nghiệp điện ảnh?

Mặc dù HeyGen chuyên tạo video tùy chỉnh cho các doanh nghiệp, chúng tôi tin rằng nội dung hấp dẫn và chất lượng cao có thể được tạo ra ngay cả khi không có máy ảnh di động.

Khi nói đến nghệ thuật sáng tạo, AI chắc chắn sẽ phá vỡ ngành công nghiệp điện ảnh. Mặc dù đây không phải là trọng tâm của HeyGen, hãy tưởng tượng một thế giới nơi mọi người định vị video. Cách tiếp cận này có thể liên quan đến việc tận dụng AI tạo sinh thay vì phải chịu thêm chi phí cho việc quay lại.

HeyGen gần đây đã huy động thành công 60 triệu đô la vòng tài trợ Series A, điều này sẽ ảnh hưởng đến kế hoạch tương lai của công ty như thế nào?

Kể từ khi doanh nghiệp của chúng tôi đã có lợi nhuận kể từ quý 2 năm 2023, vòng tài trợ Series A của chúng tôi tập trung chủ yếu vào việc đưa các cố vấn và nhà đầu tư hàng đầu thế giới đến để giúp chúng tôi mở rộng quy mô. Điều này cũng sẽ giúp chúng tôi tăng tốc đường lối sản phẩm và mở rộng sự tăng trưởng của các đội thị trường dựa tại Los Angeles, San Francisco, Palo Alto và Toronto.

Cảm ơn bạn vì cuộc phỏng vấn tuyệt vời, những người đọc muốn tìm hiểu thêm nên truy cập HeyGen.

Antoine là một nhà lãnh đạo có tầm nhìn và là đối tác sáng lập của Unite.AI, được thúc đẩy bởi một niềm đam mê không ngừng nghỉ để định hình và thúc đẩy tương lai của AI và robot. Là một doanh nhân liên tục, ông tin rằng AI sẽ gây ra sự gián đoạn cho xã hội giống như điện, và thường bị bắt gặp nói về tiềm năng của các công nghệ gây gián đoạn và AGI.
Như một futurist, ông dành để khám phá cách những đổi mới này sẽ định hình thế giới của chúng ta. Ngoài ra, ông là người sáng lập của Securities.io, một nền tảng tập trung vào đầu tư vào các công nghệ tiên tiến đang định nghĩa lại tương lai và thay đổi toàn bộ lĩnh vực.