Phỏng vấn

Rana Gujral, CEO của Behavioral Signals – Loạt phỏng vấn

Published October 19, 2020

Updated April 28, 2026

Antoine Tardif, CEO & Founder of Unite.AI

Rana Gujral là CEO của Behavioral Signals, một công ty bắc cầu khoảng cách giao tiếp giữa con người và máy móc bằng cách giới thiệu trí tuệ cảm xúc, từ giọng nói, vào các cuộc trò chuyện với AI.

Behavioral Signals là một công ty khởi nghiệp tương đối trẻ có từ năm 2016. Bạn có thể chia sẻ câu chuyện về sự ra đời của công ty này không?

Được thúc đẩy bởi niềm đam mê mang công nghệ đột phá được cấp bằng sáng chế về chuyển đổi giọng nói thành cảm xúc và hành vi đến thị trường, CTO, Alex Potamianos và Chief Scientist, Shri Narayanan đã thành lập Behavioral Signals vào năm 2016. Shri là giáo sư Andrew J. Viterbi tại Đại học Nam California (USC). Ông đã thành lập và hiện đang chỉ đạo Laboratory Signal Analysis và Interpretation (SAIL) tại USC. Alex là một nhà đổi mới được đánh giá cao trong lĩnh vực giọng nói và xử lý ngôn ngữ tự nhiên, hệ thống phản hồi giọng nói tương tác và thông tin hành vi. Ông có hơn 20 năm kinh nghiệm lãnh đạo cả về mặt doanh nghiệp và khởi nghiệp, trong khi nền tảng của ông bao gồm làm việc tại AT&T Labs-Research, Bell Labs và Lucent Technologies.

Với mục tiêu nâng cao và thay đổi mãi mãi thế giới kinh doanh, chúng tôi tin rằng công nghệ là cốt lõi của những gì có thể đạt được. Các thuật toán của Behavioral Signals phân tích cảm xúc và hành vi của con người, chuyển đổi dữ liệu thành thông tin có thể sử dụng, và dẫn đến việc đưa ra quyết định kinh doanh tốt hơn và tăng lợi nhuận. Cho đến nay, cảm xúc của con người đã được coi là không thể lượng hóa và không thể đo lường. Với động cơ phân tích được cấp bằng sáng chế của chúng tôi, chúng tôi đo lường và giải thích phần “như thế nào” của các tương tác của con người.

Behavioral Signals dựa trên một loại học máy tính cảm xúc (còn được gọi là Emotion AI). Bạn có thể giải thích điều này là gì?

Trí tuệ nhân tạo cảm xúc, còn được gọi là Emotion AI hoặc tính toán cảm xúc, đang được sử dụng để phát triển máy móc có khả năng đọc, giải thích, phản hồi và bắt chước ảnh hưởng của con người – cách chúng ta, với tư cách là con người, trải nghiệm và thể hiện cảm xúc. Điều này có ý nghĩa gì đối với người tiêu dùng? Điều đó có nghĩa là các thiết bị của bạn, chẳng hạn như điện thoại thông minh hoặc loa thông minh, sẽ có thể cung cấp cho bạn sự tương tác cảm giác tự nhiên hơn bao giờ hết, tất cả chỉ bằng cách đọc các tín hiệu cảm xúc trong giọng nói của bạn.

Khi sự phụ thuộc của chúng ta vào AI tăng lên, nhu cầu về AI thông minh về mặt cảm xúc cũng tăng lên. Một mặt, yêu cầu trợ lý ảo của bạn đọc cho bạn biết kết quả trò chơi ngày hôm nay, nhưng hoàn toàn là một việc khác để giao phó cha mẹ già của bạn cho sự chăm sóc của một bot được điều khiển bởi AI. Hiện tại, AI có thể làm được những việc tuyệt vời, như chẩn đoán tình trạng y tế và phác thảo phương pháp điều trị, nhưng nó vẫn cần trí tuệ cảm xúc để giao tiếp với bệnh nhân theo cách nhân đạo hơn.

Loại công nghệ học máy nào khác được sử dụng?

Khi nói đến học máy, chúng tôi chủ yếu sử dụng học sâu và NLP trong các mô hình phân tích xử lý tín hiệu hành vi của chúng tôi. Để giải thích điều này một chút tốt hơn, chúng tôi đã tiên phong trong một lĩnh vực, Xử lý tín hiệu hành vi, dựa trên hơn một thập kỷ nghiên cứu được giải thưởng và cấp bằng sáng chế, để tự động phát hiện thông tin được mã hóa trong giọng nói của con người từ âm thanh và đo lường chất lượng của tương tác con người. Đây là một lĩnh vực mới nổi kết nối kỹ thuật với khoa học hành vi và nhằm lượng hóa và giải thích giao tiếp và tương tác của con người thông qua việc sử dụng các đổi mới về kỹ thuật và tính toán. Học sâu là công cụ giúp tạo ra các mô hình dự đoán tốt hơn.

Loại dữ liệu nào bạn thu thập từ giọng nói?

Công nghệ AI học sâu của chúng tôi phân tích cả nội dung và phương thức nói, trên cả hai bên của cuộc trò chuyện, đo lường cảm xúc và hành vi. Phạm vi cảm xúc khá đa dạng nhưng điều thực sự quan trọng là trí tuệ tổng hợp của phân tích này. Để đưa ra một ví dụ, hãy xem xét một cuộc trò chuyện giữa nhân viên ngân hàng và khách hàng; chúng tôi có thể thu thập và đo lường sự lịch sự, sự bình tĩnh (làm chủ vs kích động), sự đồng cảm với khách hàng, phản ứng của khách hàng, và phong cách nói chung như chậm, nhanh, tham gia hoặc không tham gia, để tính toán điểm số chất lượng cuộc trò chuyện, hiệu quả của kết quả, và hiệu suất của nhân viên.

Loại phân tích dữ liệu nào được thực hiện để dự đoán ý định?

Dự đoán ý định rất giống với những gì đã được đề cập. Chúng tôi sử dụng tín hiệu hành vi trong giọng nói để dự đoán ý định của khách hàng trong việc mua sản phẩm, gia hạn đăng ký, hoặc liệu một con nợ sẽ trả nợ. Dự đoán ý định có thể giúp các công ty tăng doanh số và tỷ lệ thu hồi, giảm chi phí, và cuối cùng cải thiện sự hài lòng của khách hàng.

Behavioral Signals đã giành được 6 giải vàng của cuộc thi chất lượng tương tác con người và tính toán ngôn ngữ của INTERSPEECH. Thử thách này là gì và đây là một thành tựu quan trọng như thế nào?

Interspeech là hội nghị kỹ thuật lớn nhất trên thế giới tập trung vào xử lý và ứng dụng giọng nói. Nó tự hào có số lượng tham dự lớn nhất trong lĩnh vực này và một số lượng đáng kể các bài báo nghiên cứu. Hội nghị nhấn mạnh các phương pháp liên ngành giải quyết tất cả các khía cạnh của khoa học và công nghệ giọng nói, từ các lý thuyết cơ bản đến các ứng dụng tiên tiến. Các thử thách của nó được coi là Giải thưởng Turing trong lĩnh vực nhận dạng giọng nói và xử lý ngôn ngữ tự nhiên. Việc giành được giải thưởng này là một sự công nhận quan trọng về công việc khoa học và khả năng độc đáo của chúng tôi trong việc phát hiện tín hiệu từ dữ liệu âm thanh liên quan đến hành vi và đặc điểm thúc đẩy việc ra quyết định của con người.

Behavioral Signals có thể thích nghi với các ngôn ngữ khác nhau nhanh như thế nào, và một tập dữ liệu lớn đến mức nào là cần thiết?

Công nghệ của chúng tôi không phụ thuộc vào ngôn ngữ. Chúng tôi lắng nghe phương thức nói chứ không phải nội dung nói. Chúng tôi lắng nghe cảm xúc được thể hiện, điều này khá phổ biến trong tất cả các ngôn ngữ. Tất nhiên, mỗi ngôn ngữ có những đặc điểm riêng biệt có thể yêu cầu chúng tôi điều chỉnh các thuật toán của mình, nhưng sự khác biệt trong các mô hình phân tích dự đoán của chúng tôi thường nhỏ.

Bạn có thể thảo luận về giải pháp mới nhất của Behavioral Signals, cuộc trò chuyện được trung gian bởi AI?

Cuộc trò chuyện được trung gian bởi AI (AI-MC) là một giải pháp định tuyến cuộc gọi tự động sử dụng trí tuệ cảm xúc và dữ liệu giọng nói để kết nối khách hàng với nhân viên phù hợp nhất để xử lý một cuộc gọi cụ thể. Nếu chúng ta quay lại ví dụ trên về nhân viên ngân hàng và khách hàng, công nghệ của chúng tôi có thể hướng dẫn động lực của cuộc trò chuyện với mục tiêu cuối cùng là cải thiện kết quả, cho dù đó liên quan đến trải nghiệm khách hàng tốt hơn, tăng thu hồi, hoặc thời gian giải quyết nhanh hơn. Bất kể mục tiêu là gì, luôn có một yếu tố xúc tác cho phép cả hai bên đạt được kết quả mong muốn. Yếu tố đó thường là một quá trình con người đơn giản và tự nhiên: sự thân thiện hoặc quan hệ được phát triển giữa người với người. Không phụ thuộc vào loại hình giao tiếp kinh doanh (cuộc gọi bán hàng, hỗ trợ, thu hồi), nó sẽ luôn là một tương tác giữa những con người thực sự, nơi sự thân thiện giữa hai cặp người thường không giống nhau. Chúng tôi có những hành vi và đặc điểm cụ thể giúp chúng tôi hòa hợp với một số người tốt hơn so với những người khác. Sự kết hợp này dựa trên dữ liệu hồ sơ và các thuật toán ưu越 của chúng tôi được phát triển từ nhiều năm nghiên cứu và kinh nghiệm trong NLP và Xử lý tín hiệu hành vi.

Chúng tôi gần đây đã triển khai giải pháp AI-MC của Behavioral Signals để tăng cường hiệu quả và hiệu suất của trung tâm cuộc gọi của một ngân hàng EU. Trường hợp nghiên cứu này đã được Gartner công nhận và bao gồm trong Báo cáo về việc áp dụng Emotion AI. Giải pháp đã chứng minh một ROI đáng kể với mức tăng 20% trong số lượng đơn xin tái cấu trúc nợ hoạt động. Ngoài ra, sự cải thiện này đã được thực hiện với 7,6% ít cuộc gọi hơn, dẫn đến việc giảm chi phí thêm. Về số liệu tuyệt đối, những kết quả này tương ứng với mức tăng 300 triệu đô la cho ngân hàng.

Có điều gì khác bạn muốn chia sẻ về Behavioral Signals?

Mặc dù chúng tôi tự hào về những thành tựu nghiên cứu, chúng tôi cũng biết ơn về những giải thưởng của ngành. Vào mùa thu năm 2019, công nghệ của chúng tôi đã được liệt kê là một trường hợp sử dụng hàng đầu trong Nghiên cứu Maverick của Gartner, nơi giới thiệu các công nghệ tiên phong. Đầu năm nay, chúng tôi đã được включ vào Chu kỳ Hype của Gartner, nơi công nghệ của chúng tôi được đánh giá là “chuyển đổi”. Tháng trước, chúng tôi được liệt kê là Nhà cung cấp Cool của Gartner 2020.

Cảm ơn vì cuộc phỏng vấn tuyệt vời, những người đọc muốn tìm hiểu thêm nên truy cập Behavioral Signals.

Antoine Tardif, CEO & Founder of Unite.AI

Antoine là một nhà lãnh đạo có tầm nhìn và là đối tác sáng lập của Unite.AI, được thúc đẩy bởi một niềm đam mê không ngừng nghỉ để định hình và thúc đẩy tương lai của AI và robot. Là một doanh nhân liên tục, ông tin rằng AI sẽ gây ra sự gián đoạn cho xã hội giống như điện, và thường bị bắt gặp nói về tiềm năng của các công nghệ gây gián đoạn và AGI.
Như một futurist, ông dành để khám phá cách những đổi mới này sẽ định hình thế giới của chúng ta. Ngoài ra, ông là người sáng lập của Securities.io, một nền tảng tập trung vào đầu tư vào các công nghệ tiên tiến đang định nghĩa lại tương lai và thay đổi toàn bộ lĩnh vực.

Unite.AI

Rana Gujral, CEO của Behavioral Signals – Loạt phỏng vấn

You may like