Connect with us

Johan Wadenholt Vrethem, CEO tại Voxo – Loạt Phỏng Vấn

Phỏng vấn

Johan Wadenholt Vrethem, CEO tại Voxo – Loạt Phỏng Vấn

mm

Johan Wadenholt Vrethem mang lại hơn hai thập kỷ kinh nghiệm tại giao điểm của công nghệ và kinh doanh, với trọng tâm là tận dụng AI để chuyển đổi cách các tổ chức hoạt động và tương tác với khách hàng của họ. Ông đã dẫn đầu các sáng kiến kỹ thuật số chính và chương trình khách hàng trong lĩnh vực ngân hàng và tài chính tại CGI, trước khi đồng sáng lập Voxo để thúc đẩy đổi mới trong phân tích hội thoại và công nghệ sự kiện.

Tại Voxo AI, Johan đang dẫn đầu việc cung cấp thông tin thông minh dựa trên AI theo thời gian thực từ các cuộc thảo luận trực tiếp tại các sự kiện và hội nghị, cho phép các đội chuyển từ dữ liệu sang hành động với tốc độ và độ chính xác. Cam kết với cả tác động thương mại và lợi ích xã hội, ông cũng đã dẫn đầu các sáng kiến CSR nhằm ngăn chặn việc bóc lột trẻ em trực tuyến.

Voxo AI là một nền tảng thông minh sự kiện sử dụng trí tuệ nhân tạo để thu thập và chuyển đổi các cuộc trò chuyện trực tiếp từ các hội nghị, hội thảo và phiên họp thành thông tin có cấu trúc và có thể sử dụng. Bằng cách phân tích âm thanh theo thời gian thực, nó tạo ra bản tóm tắt tức thời, điểm chính và nội dung sau sự kiện như báo cáo và tài sản thương hiệu, cho phép các nhà tổ chức, người tham dự, nhà tài trợ và người nói có thể trích xuất giá trị lâu dài từ các cuộc thảo luận mà không cần ghi chú thủ công hoặc công việc theo dõi.

Trước khi thành lập Voxo, bạn đã dành nhiều năm dẫn đầu các sáng kiến kỹ thuật số và AI phức tạp trong lĩnh vực ngân hàng và dịch vụ tài chính tại CGI. Những khó khăn hoặc khoảng trống cụ thể nào từ kinh nghiệm đó đã khiến bạn quyết định xây dựng công ty của mình tập trung vào trí tuệ hội thoại?

Thời gian của tôi tại CGI rất có ý nghĩa. Đó là một tổ chức lớn với hàng trăm tài sản IP ngoài tư vấn, và tôi đã có một vị trí hàng đầu để xem các môi trường giao hàng phức tạp, quản trị và chuyển đổi doanh nghiệp quy mô lớn.

Tôi đã chuyển từ Chuyên viên Kinh doanh đến Giám đốc trong vòng hai năm, và tại thời điểm đó, tôi cảm thấy sẵn sàng để tập trung. Khi tôi gặp các đồng sáng lập, nó đã kích hoạt rằng chúng tôi có thể xây dựng một thứ gì đó sắc nét hơn, một đường ray đơn sử dụng công nghệ tốt nhất có sẵn để giải quyết một vấn đề cụ thể, có giá trị cao. Điều mà nhiều người không biết là chúng tôi bắt đầu như một công ty fintech tập trung vào tài liệu trong tư vấn tài chính. Từ đó, chúng tôi đã phát triển thành phân tích hội thoại, và cuối cùng mở rộng vào thông minh sự kiện sau gần một thập kỷ học cách trích xuất ý nghĩa thực sự từ cuộc trò chuyện của con người.

Sớm, những thách thức kỹ thuật hoặc thương mại khó khăn nhất trong việc xây dựng AI có thể hiểu đáng tin cậy các cuộc trò chuyện thực tế thay vì đầu vào được kiểm soát, kịch bản?

Trong các sản phẩm fintech đầu tiên của chúng tôi, công nghệ đã hạn chế sự tham vọng. Nhận dạng giọng nói tự động cho các ngôn ngữ Bắc Âu, vốn là焦 điểm ban đầu của chúng tôi, có tỷ lệ lỗi từ 70 đến 80 phần trăm. Ở mức đó, bạn đơn giản không thể xây dựng một sản phẩm thay thế ghi chú của con người.

Đồng thời, khả năng của mô hình ngôn ngữ lớn hiện đại không tồn tại tại thời điểm đó, vì vậy việc tạo ra bản tóm tắt đáng tin cậy gần như là không thể. Khi chúng tôi sau đó ra mắt dịch vụ sự kiện của mình, cảnh quan đã thay đổi. Chúng tôi đã xây dựng kiến thức sâu sắc trong nhiều năm, và chúng tôi cuối cùng đã có các khối xây dựng AI đúng để hiểu các cuộc thảo luận chính, tranh luận và bàn tròn theo cách có thể mở rộng.

Voxo bắt đầu với phân tích hội thoại và sau đó mở rộng vào thông minh sự kiện quy mô lớn. Những tín hiệu nào cho bạn biết rằng các sự kiện trực tiếp là biên giới lớn tiếp theo cho AI giọng nói?

Thật thú vị, chúng tôi lần đầu tiên làm việc với các sự kiện như một cách để tiếp cận các giám đốc điều hành cấp C nhanh hơn và展示 cách mạnh mẽ của trí tuệ hội thoại có thể là.

Nhưng một khi chúng tôi giao hàng tại sự kiện công nghệ lớn nhất của Thụy Điển, Techarenan, với hơn 10.000 người tham dự, chúng tôi đã thấy một sự thay đổi lớn.

Yêu cầu đầu vào ngay lập tức và rất rõ ràng. Người dân không chỉ ấn tượng, họ muốn mua dịch vụ sự kiện như một sản phẩm. Đó là tín hiệu. Chúng tôi đã quyết định đầu tư thời gian, tập trung và nguồn lực cần thiết để giao hàng toàn cầu, và để làm điều đó ở mức chất lượng cao nhất có thể.

Từ góc độ hệ thống, điều gì cơ bản thay đổi khi bạn chuyển từ ghi lại một cuộc họp đơn lẻ sang xử lý hàng trăm phiên đồng thời trên một sự kiện nhiều ngày?

Độ phức tạp tăng nhanh. Bạn không chỉ duy trì sự ổn định và chất lượng trên mỗi phiên riêng lẻ, mà bạn còn phải đối phó với sự hỗn loạn của thế giới thực. Thay đổi lịch trình phút cuối, thay thế diễn giả và cập nhật chương trình là bình thường tại các sự kiện lớn.

Để giao hàng mà không đặt thêm gánh nặng cho các đội sự kiện đã căng thẳng, bạn cần các quy trình nghiêm ngặt và vẫn linh hoạt. Bạn cũng cần một phương pháp phân tích đã được chứng minh. Bạn không thể chỉ ném hàng trăm giờ âm thanh vào một mô hình và yêu cầu một báo cáo thú vị. Để tạo ra đầu ra chất lượng cao trong vài phút, bạn phải kết hợp nhiều mô hình, đường ống và lớp cấu trúc.

Nhiều công cụ AI nhấn mạnh tự động hóa trên hết. Tại sao bạn quyết định bao gồm xem xét của con người như một phần cốt lõi của nền tảng Voxo?

Sự tin tưởng vẫn là rào cản lớn nhất, đặc biệt là đối với khách hàng doanh nghiệp như HubSpot, GitHub và Intuit. Nỗi sợ hãi về việc xuất bản điều gì đó không chính xác là rất thực. Đó là lý do tại sao các quy trình ổn định, cộng với sự kết hợp của xem xét AI và đảm bảo chất lượng của con người, vẫn là một yêu cầu cho nhiều khách hàng ngày nay.

Chúng tôi cũng cung cấp cho khách hàng quyền kiểm soát. Họ có thể xem xét và phê duyệt tóm tắt trước khi bất cứ điều gì được phân phối, và chúng tôi làm cho quy trình làm việc đó hiệu quả. Theo thời gian, tôi tin rằng nhu cầu về xem xét của con người sẽ giảm xuống khi công nghệ và biện pháp bảo vệ trưởng thành. Cho đến lúc đó, không có gì quan trọng hơn việc kiếm được quyền được tin cậy với nội dung đại diện cho thương hiệu của họ.

Làm thế nào việc ghi lại và tóm tắt gần thời gian thực đã thay đổi cách các đội sự kiện nghĩ về thời gian nội dung và giá trị sau sự kiện?

Nó cơ bản đặt lại thời gian. Thay vì nội dung là điều gì đó bạn xuất bản vài tuần sau, nó trở thành điều gì đó bạn có thể sử dụng trong khi sự kiện vẫn đang diễn ra và ngay sau mỗi phiên kết thúc.

Điều chúng tôi thấy là khách hàng đột nhiên có vật liệu mà giữ cho sự tham gia sống động trong nhiều tháng. Người tham dự và người nói cũng có nhiều khả năng chia sẻ nội dung ngay sau một phiên, miễn là nó dễ dàng và trông sắc nét. Nếu cùng một nội dung đến một tháng sau, nó thường quá muộn để thúc đẩy phân phối có ý nghĩa, đặc biệt là trên phương tiện truyền thông xã hội. Gần thời gian thực biến nội dung thành một phần mở rộng của trải nghiệm trực tiếp, không chỉ là kho lưu trữ sau sự kiện.

Các sự kiện liên quan đến nhiều bên liên quan, tổ chức, người nói, nhà tài trợ và người tham dự. Voxo thiết kế đầu ra như thế nào để phục vụ tất cả họ mà không làm loãng thông tin hoặc chất lượng?

Chúng tôi thiết kế từ bên liên quan trở ra, nhưng chúng tôi giữ cùng một nguồn thông tin cơ bản. Mọi người đều được hưởng lợi từ cùng một nội dung được thu thập, sau đó chúng tôi tùy chỉnh đầu ra để phù hợp với mục tiêu của bên liên quan.

Người tham dự nhận được bản tóm tắt phiên tức thời và khả năng xem lại các phiên họ đã bỏ lỡ. Các nhóm tiếp thị nhận được tài sản thương hiệu nhà tài trợ được xây dựng cho phân phối và tác động có thể đo lường được. Các nhà tổ chức nhận được giá trị người tham dự cao hơn, động lực sự kiện lâu dài và các tùy chọn doanh thu mới. Người nói nhận được một cách nhấp chuột để chia sẻ bản tóm tắt được đánh bóng, và các nhà tổ chức được hưởng lợi từ hiệu ứng mạng đó.

Chìa khóa là chúng tôi không làm loãng chất lượng. Chúng tôi xây dựng một động cơ nội dung mạnh mẽ, sau đó đóng gói nó khác nhau cho từng bên liên quan dựa trên những gì tạo ra giá trị thực.

Các sự kiện sử dụng Voxo báo cáo giao hàng nội dung nhanh hơn và tương tác nhà tài trợ cao hơn. Bạn nghĩ gì quan trọng hơn trong việc đạt được tác động đó, tốc độ, cấu trúc, hoặc chất lượng thông tin?

Đó là sự kết hợp. Tốc độ không quan trọng nếu nội dung thiếu cấu trúc và chất lượng.

Ưu thế thực sự là giao hàng tất cả ba cùng nhau. Thông tin chất lượng cao, được đóng gói trong một cấu trúc rõ ràng, được giao hàng đủ nhanh để vẫn cảm thấy có liên quan.

Điều gì “thời gian thực” thực sự có nghĩa là đối với các nền tảng nội dung dựa trên AI trong vài năm tới, và chúng ta gần với thực tế đó như thế nào ngày nay?

Trong một số trường hợp, thời gian thực thực sự đã ở đây. Chúng tôi đã giao hàng bình luận thời gian thực trên nhiều luồng trực tiếp, ví dụ với NHS ở Manchester mùa hè năm ngoái cùng với First Sight Media và Lineup Ninja. Chúng tôi cũng giới thiệu trải nghiệm thời gian thực từ năm 2023 tại Techarenan với người nói như Al Gore và Steve Wozniak.

Tuy nhiên, vẫn còn chỗ cho cả gần thời gian thực và thời gian thực thực sự tại các sự kiện. Phần quan trọng là có chủ đích về những gì tạo ra giá trị. Một từ cloud thời gian thực cập nhật phía sau một người nói có thể gây phân tâm hơn là hữu ích.

Cuối cùng, có một sự hiểu lầm phổ biến về tóm tắt hoặc bản ghi được tạo bởi AI mà bạn thường phải sửa khi nói chuyện với khách hàng doanh nghiệp?

Sự hiểu lầm lớn nhất là bạn có thể nhận được tóm tắt đáng tin cậy, nhất quán, chất lượng cao bằng cách chỉ chuyển đổi một tệp âm thanh và dán nó vào ChatGPT. Người dân cũng nhận ra nhanh chóng rằng nó tốn thời gian và khó để duy trì tính nhất quán, đặc biệt là khi bạn có một số lượng lớn các phiên.

Và thậm chí sau đó, chuyển录 và tóm tắt chỉ là một phần nhỏ của những gì chúng tôi giao hàng. Đó có thể là 5 phần trăm. Công việc thực sự là tốc độ, cấu trúc, ngữ cảnh, bao bì thương hiệu sẵn sàng, đảm bảo chất lượng và các định dạng phân phối làm cho nội dung có thể sử dụng và có giá trị ở quy mô doanh nghiệp.

Antoine là một nhà lãnh đạo có tầm nhìn và là đối tác sáng lập của Unite.AI, được thúc đẩy bởi một niềm đam mê không ngừng nghỉ để định hình và thúc đẩy tương lai của AI và robot. Là một doanh nhân liên tục, ông tin rằng AI sẽ gây ra sự gián đoạn cho xã hội giống như điện, và thường bị bắt gặp nói về tiềm năng của các công nghệ gây gián đoạn và AGI.
Như một futurist, ông dành để khám phá cách những đổi mới này sẽ định hình thế giới của chúng ta. Ngoài ra, ông là người sáng lập của Securities.io, một nền tảng tập trung vào đầu tư vào các công nghệ tiên tiến đang định nghĩa lại tương lai và thay đổi toàn bộ lĩnh vực.