Connect with us

รานา กุจราล์ ซีอีโอของ Behavioral Signals – สัมภาษณ์ซีรีส์

สัมภาษณ์

รานา กุจราล์ ซีอีโอของ Behavioral Signals – สัมภาษณ์ซีรีส์

mm

รานา กุจราล์ เป็นซีอีโอของ Behavioral Signals บริษัทที่เชื่อมช่องว่างในการสื่อสารระหว่างมนุษย์และเครื่องจักรโดยการนำความฉลาดทางอารมณ์จากเสียงพูดมาใช้ในการสนทนากับ AI

Behavioral Signals เป็นสตาร์ทอัพอายุน้อยที่ได้ก่อตั้งขึ้นในปี 2016 คุณสามารถเล่าเรื่องราวของการก่อตั้งได้หรือไม่?

ได้รับแรงบันดาลใจจากความหลงใหลในการนำเทคโนโลยี speech-to-emotion และ speech-to-behaviors ที่ได้รับอนุญาตสิทธิบัตรมาใช้ในตลาด CTO Alex Potamianos และ Chief Scientist Shri Narayanan ก่อตั้ง Behavioral Signals ในปี 2016 Shri เป็น Andrew J. Viterbi Professor of Engineering ที่ University of Southern California (USC) เขาก่อตั้งและเป็นผู้อำนวยการ Signal Analysis and Interpretation Laboratory (SAIL) ที่ USC Alex เป็นนวัตกรที่มีชื่อเสียงในด้านการประมวลผลเสียงและภาษาธรรมชาติ ระบบตอบรับเสียงอัตโนมัติและข้อมูลเชิงพฤติกรรม เขามีประสบการณ์เป็นผู้นำมากกว่า 20 ปีทั้งในด้านองค์กรและด้านการเป็นผู้ประกอบการ และมีประสบการณ์ทำงานที่ AT&T Labs-Research, Bell Labs และ Lucent Technologies

ด้วยเป้าหมายในการปรับปรุงและเปลี่ยนแปลงโลกธุรกิจ เราเชื่อว่าเทคโนโลยีเป็นแก่นกลางของสิ่งที่สามารถทำได้ อัลกอริทึมของ Behavioral Signals วิเคราะห์ความฉลาดทางอารมณ์และพฤติกรรมของมนุษย์ แปลงข้อมูลให้เป็นข้อมูลที่สามารถใช้ได้ และนำไปสู่การตัดสินใจทางธุรกิจที่ดีขึ้นและเพิ่มผลกำไร จนถึงตอนนี้ ความฉลาดทางอารมณ์ของมนุษย์ถือว่าเป็นสิ่งที่ไม่สามารถวัดผลได้ และไม่สามารถวัดผลได้ ด้วยเครื่องมือวิเคราะห์แบบพิเศษของเรา เราวัดและตีความ “วิธีการ” ของการโต้ตอบระหว่างมนุษย์

Behavioral Signals พึ่งพาเทคโนโลยี machine learning affective computing (หรือที่เรียกว่า Emotion AI) คุณสามารถอธิบายสิ่งนี้ได้หรือไม่?

Emotional artificial intelligence หรือที่เรียกว่า Emotion AI หรือ affective computing ถูกนำมาใช้ในการพัฒนาความสามารถของเครื่องจักรในการอ่าน ตีความ ตอบสนอง และเลียนแบบอารมณ์ของมนุษย์ สิ่งนี้หมายถึงอะไรสำหรับผู้บริโภค? หมายความว่าอุปกรณ์ของคุณ เช่น สมาร์ทโฟนหรือลำโพงอัจฉริยะ จะสามารถให้การโต้ตอบที่รู้สึกเป็นธรรมชาติ hơn bao giờ hết โดยการอ่านสัญญาณทางอารมณ์จากเสียงของคุณ

เมื่อเราใช้ AI มากขึ้น ความต้องการ AI ที่มีความฉลาดทางอารมณ์ก็เพิ่มขึ้นด้วย สิ่งนี้เป็นอีกสิ่งหนึ่งที่จะขอให้เสมียนของคุณอ่านคะแนนเกมวันนี้ แต่สิ่งนี้เป็นอีกสิ่งหนึ่งที่จะให้ความไว้วางใจในการดูแลผู้ปกครองของคุณให้กับ AI ที่ขับเคลื่อนด้วย AI ปัจจุบัน AI สามารถทำสิ่งที่น่าเหลือเชื่อ เช่น การวินิจฉัยสภาพทางการแพทย์และการรักษา แต่ยังคงต้องการความฉลาดทางอารมณ์เพื่อสื่อสารกับผู้ป่วยในลักษณะที่เป็นมนุษย์มากขึ้น

คุณใช้เทคโนโลยี machine learning อื่นๆ อีกหรือไม่?

เมื่อพูดถึง machine learning เราใช้ deep learning และ NLP ในโมเดลการประมวลผลสัญญาณพฤติกรรมของเรา เพื่ออธิบายสิ่งนี้ได้ดีขึ้น เราได้พัฒนาสาขา Behavioral Signal Processing โดยอาศัยการวิจัยที่ได้รับรางวัลและได้รับอนุญาตสิทธิบัตรมามากกว่าหนึ่งทศวรรษ เพื่อตรวจจับข้อมูลที่เข้ารหัสในเสียงพูดจากเสียงและวัดคุณภาพของการโต้ตอบระหว่างมนุษย์ นี่เป็นสาขาที่เกิดขึ้นใหม่ที่เชื่อมโยงระหว่างวิศวกรรมและวิทยาศาสตร์พฤติกรรม และมีเป้าหมายในการ量และตีความการโต้ตอบและการสื่อสารระหว่างมนุษย์โดยใช้นวัตกรรมทางวิศวกรรมและคอมพิวเตอร์ Deep learning เป็นเครื่องมือที่ช่วยสร้างแบบจำลองการคาดการณ์ที่ดีขึ้น

คุณเก็บข้อมูลใดจากน้ำเสียง?

เทคโนโลยี AI ที่เรียนรู้ลึกของเราวิเคราะห์สิ่งที่และ วิธีการ ที่บางสิ่งถูกกล่าว โดยวัดอารมณ์และพฤติกรรมทั้งสองฝ่ายของการสนทนา ช่วงอารมณ์มีความหลากหลาย แต่สิ่งที่สำคัญจริงๆ คือความฉลาดที่รวบรวมจากการวิเคราะห์นี้ ตัวอย่างเช่น ลองพิจารณาการสนทนาระหว่างพนักงานธนาคารและลูกค้า เราสามารถจับและวัดความสุภาพ ความสงบ (สงบหรือโกรธ) ความเห็นอกเห็นใจต่อลูกค้า ปฏิกิริยาของลูกค้า และรูปแบบการพูดโดยรวม เช่น ช้า เร็ว มีส่วนร่วมหรือไม่มีส่วนร่วม เพื่อคำนวณคะแนนคุณภาพการสนทนา ประสิทธิภาพของผลลัพธ์ และประสิทธิภาพการทำงานของพนักงาน

คุณวิเคราะห์ข้อมูลใดเพื่อคาดการณ์วัตถุประสงค์?

การคาดการณ์วัตถุประสงค์คล้ายกับสิ่งที่กล่าวมาแล้ว เราใช้สัญญาณพฤติกรรมในเสียงเพื่อคาดการณ์วัตถุประสงค์ของลูกค้าในการซื้อสินค้า การต่ออายุสมาชิกภาพ หรือว่าลูกหนี้จะชำระหนี้หรือไม่ การคาดการณ์วัตถุประสงค์สามารถช่วยให้บริษัทเพิ่มยอดขายและอัตราการเก็บหนี้ ลดต้นทุน และปรับปรุงความพึงพอใจของลูกค้าในขณะเดียวกัน

Behavioral Signals ได้รับรางวัล INTERSPEECH 6 ครั้งสำหรับการท้าทายคุณภาพของการโต้ตอบระหว่างมนุษย์และการประมวลผลคำพูดเชิงพาราลิงก์ สิ่งนี้คืออะไรและเป็นความสำเร็จที่สำคัญแค่ไหน?

Interspeech เป็นงานประชุมทางเทคนิคที่ใหญ่ที่สุดในโลกที่เน้นไปที่การประมวลผลเสียงและการใช้งาน มีผู้เข้าร่วมงานมากที่สุดในด้านนี้และมีจำนวนงานวิจัยที่สำคัญ การประชุมเน้นย้ำถึงแนวทางที่เป็นเชิงบูรณาการที่แก้ไขทุกด้านของวิทยาศาสตร์และเทคโนโลยีการพูด ตั้งแต่ทฤษฎีฐานจนถึงการประยุกต์ใช้ที่ทันสมัย การท้าทายของมันถือเป็นรางวัล Turing ในสาขาการรู้จานเสียงและการประมวลผลภาษาธรรมชาติ การชนะรางวัลนี้เป็นการยอมรับที่สำคัญต่องานวิจัยทางวิทยาศาสตร์ของเราและความสามารถที่ไม่เหมือนใครในการตรวจจับสัญญาณจากข้อมูลเสียงที่เกี่ยวข้องกับพฤติกรรมและลักษณะที่ขับเคลื่อนการตัดสินใจของมนุษย์

Behavioral Signals สามารถปรับให้เข้ากับภาษาต่างๆ ได้อย่างรวดเร็วแค่ไหน และต้องการชุดข้อมูลขนาดใหญ่แค่ไหน?

เทคโนโลยีของเรามีความเป็นอิสระจากภาษา เราฟัง วิธีการ ที่บางสิ่งถูกกล่าวมากกว่าสิ่งที่กล่าวจริงๆ เราฟังอารมณ์ที่แสดงออก ซึ่งเป็นสิ่งที่เป็นสากลในภาษาทุกภาษา แน่นอนว่าภาษาแต่ละภาษามีลักษณะเฉพาะที่อาจต้องมีการปรับเปลี่ยนอัลกอริทึมของเรา แต่ความแตกต่างในโมเดลการวิเคราะห์เชิงพยากรณ์ของเรามักจะไม่มาก

คุณสามารถพูดคุยเกี่ยวกับโซลูชันล่าสุดของ Behavioral Signals ได้หรือไม่ ซึ่งก็คือ AI-Mediated Conversation?

AI-Mediated Conversations (AI-MC) เป็นโซลูชันการกำหนดเส้นทางการโทรอัตโนมัติที่ใช้ Emotion AI และข้อมูลเสียงเพื่อจับคู่ลูกค้ากับพนักงานที่เหมาะสมที่สุดในการจัดการการโทรนั้น หากเราไปกลับไปยังตัวอย่างที่กล่าวถึงข้างต้น ของพนักงานธนาคารและลูกค้า เทคโนโลยีของเราสามารถชี้นำพลวัตของการสนทนาโดยมีเป้าหมายสูงสุดในการปรับปรุงผลลัพธ์ ไม่ว่าจะเป็นประสบการณ์ของลูกค้าที่ดีขึ้น การเก็บหนี้ที่เพิ่มขึ้น หรือการแก้ปัญหาอย่างรวดเร็ว สิ่งที่เป็นตัวขับเคลื่อนให้เกิดผลลัพธ์ที่ต้องการนั้น มักจะเป็นกระบวนการธรรมชาติและง่ายๆ ที่เกิดขึ้นระหว่างคนๆ หนึ่ง ซึ่งก็คือความสัมพันธ์หรือความสอดคล้องระหว่างคนๆ หนึ่ง ไม่ว่าการสื่อสารทางธุรกิจจะเป็นการสนทนาแบบขาย การสนับสนุน หรือการเก็บหนี้ จะเป็นการโต้ตอบระหว่างมนุษย์ที่แท้จริงเสมอ โดยที่ความสัมพันธ์ระหว่างคนสองคนมักจะไม่เหมือนกันเสมอไป เรามีพฤติกรรมและลักษณะเฉพาะที่ช่วยให้เราสามารถเข้ากันได้ดีกับบางคนมากกว่าคนอื่นๆ การจับคู่นี้ขึ้นอยู่กับข้อมูลโปรไฟล์และอัลกอริทึมที่เหนือกว่าซึ่งพัฒนาขึ้นจากประสบการณ์หลายปีใน NLP และ Behavioral Signal Processing

เราทำการนำโซลูชัน AI-MC ของ Behavioral Signals ไปใช้เพื่อเพิ่มประสิทธิภาพและประสิทธิผลของศูนย์บริการลูกค้าของธนาคารในยุโรป การศึกษากรณีนี้ได้รับการยอมรับจาก Gartner และรวมอยู่ในรายงานการนำ Emotion AI ไปใช้ โซลูชันนี้แสดงให้เห็นถึง ROI ที่สำคัญพร้อมกับการเพิ่มขึ้น 20% ของการยื่นคำขอRestructuring หนี้ที่ใช้งานอยู่ นอกจากนี้ การปรับปรุงนี้ยังเกิดขึ้นพร้อมกับการโทรที่ลดลง 7.6% ซึ่งนำไปสู่การลดต้นทุนเพิ่มเติม ในตัวเลขที่แท้จริง ผลลัพธ์เหล่านี้สอดคล้องกับผลกำไรที่เพิ่มขึ้น 300 ล้านดอลลาร์สำหรับธนาคาร

มีสิ่งอื่นใดที่คุณต้องการแบ่งปันเกี่ยวกับ Behavioral Signals หรือไม่?

ในขณะที่เรารู้สึกภาคภูมิใจในความสำเร็จของการวิจัยของเรา เราก็รู้สึกขอบคุณสำหรับการยอมรับจากอุตสาหกรรมด้วย ในช่วงฤดูใบไม้ร่วงปี 2019 เทคโนโลยีของเราได้รับการจัดให้เป็นผู้นำในการใช้งานในรายงาน Maverick Research ของ Gartner ซึ่งแสดงถึงเทคโนโลยีที่มีคุณสมบัติเป็นเลือดใหม่ ในช่วงต้นปีนี้ เราได้รับการรวมอยู่ใน Hype Cycle ของ Gartner โดยที่เทคโนโลยีของเราถูกจัดให้เป็น ‘การเปลี่ยนแปลง’ เมื่อเดือนที่แล้ว เราได้รับการจัดให้เป็น Gartner Cool Vendor 2020

ขอขอบคุณสำหรับการสัมภาษณ์ที่ดี ผู้อ่านสามารถเยี่ยมชม Behavioral Signals เพื่อเรียนรู้เพิ่มเติม

อ็องตวนเป็นผู้นำที่มีวิสัยทัศน์และเป็นพันธมิตรผู้ก่อตั้งของ Unite.AI โดยมีความหลงใหลที่ไม่สั่นคลอนในการ塑造และส่งเสริมอนาคตของ AI และหุ่นยนต์ เขาเป็นผู้ประกอบการที่มีประสบการณ์หลายครั้ง และเชื่อว่า AI จะมีผลกระทบต่อสังคมมากเท่ากับไฟฟ้า และมักจะพูดถึงศักยภาพของเทคโนโลยีที่เปลี่ยนแปลงและ AGI

As a futurist เขาได้ให้ความสนใจในการสำรวจว่านวัตกรรมเหล่านี้จะเปลี่ยนแปลงโลกของเราอย่างไร นอกจากนี้เขายังเป็นผู้ก่อตั้ง Securities.io ซึ่งเป็นแพลตฟอร์มที่มุ่งเน้นในการลงทุนในเทคโนโลยีที่ทันสมัยซึ่งกำลังกำหนดอนาคตและเปลี่ยนแปลงภาคส่วนต่างๆ