เชื่อมต่อกับเรา

James Kaplan ซีอีโอและผู้ร่วมก่อตั้ง MeetKai Metaverse – ซีรีส์สัมภาษณ์

บทสัมภาษณ์

James Kaplan ซีอีโอและผู้ร่วมก่อตั้ง MeetKai Metaverse – ซีรีส์สัมภาษณ์

mm

การตีพิมพ์

 on

James Kaplan เป็น CEO และผู้ร่วมก่อตั้งของ พบกับไก่ บริษัทปัญญาประดิษฐ์, VR และการสนทนาในลอสแอนเจลิส แคลิฟอร์เนีย ปัจจุบันเป็นผู้นำการแข่งขันการพูดด้วย AI ด้วยคุณสมบัติที่ไม่เคยมีมาก่อน AI เชิงสนทนาของมันสามารถเข้าใจคำพูดที่ซับซ้อนมากขึ้นและให้ผลลัพธ์ที่เป็นส่วนตัวในการสนทนาที่เป็นธรรมชาติเกี่ยวกับหลาย ๆ เรื่องในความเป็นจริงที่แตกต่างกัน เทคโนโลยีของ MeetKai ถูกนำไปใช้งานทั่วโลกผ่าน iOS, Google Play และ AppGallery

คุณมีความหลงใหลใน AI ตั้งแต่อายุ 6 ขวบ คุณรู้จักเทคโนโลยีนี้ได้อย่างไรเป็นครั้งแรก

การแนะนำ AI ของฉันมาจากวิดีโอเกม ประการแรก มันมาจากการพยายามทำความเข้าใจว่า AI ทำงานอย่างไรในเกม Oregon Trail แม้ว่าจะไม่ฉลาดขนาดนั้น แต่ก็ยังเป็นรูปแบบหนึ่งของ AI จากจุดนั้นความสนใจใน AI ของฉันก็เพิ่มมากขึ้นเมื่อฉันเข้าสู่เกม MMORPG ฉันชอบเล่นเกมออนไลน์มาก แต่ฉันเกลียดการควานหาไอเทม ดังนั้นฉันจึงเขียนบอท

แอปพลิเคชัน AI แรกที่คุณเขียนโค้ดมีอะไรบ้าง

การเขียนบอทสำหรับ MMO เป็นการโจมตีครั้งแรกที่ฉันได้พัฒนารูปแบบเฉพาะของ AI ในตอนแรก บอทของฉันค่อนข้างเรียบง่ายและใกล้เคียงกับมาโครมากกว่าปัญญาประดิษฐ์ แต่เมื่อฉันอายุมากขึ้นและการตรวจจับบอทได้ดีขึ้นในหลาย ๆ เกม สิ่งนี้เริ่มทำให้บอทดูเหมือนผู้เล่นมากขึ้นเรื่อย ๆ ฉันสนุกกับการเขียนบอทมาตลอด — ฉันลงเอยด้วยการเขียนบอทเพื่อชนะการประกวด Taylor Swift ขณะที่ฉันเรียนอยู่ (และเธอก็มาแสดงจริง ๆ ด้วย!) ในทำนองเดียวกัน ฉันยังเขียนบอทโปเกมอนโกตัวแรก และเสียใจที่หลายคนถูกแบนเมื่อฉันเลิกสนใจที่จะหลบเลี่ยงการตรวจจับ

คุณเปิดตัว MeetKai ในปี 2018 หลังจากผิดหวังกับผู้ช่วยเสียง AI ในปัจจุบัน เหตุใดผู้ช่วย AI ส่วนใหญ่จึงมอบประสบการณ์ที่น่าเบื่อ

ปมของปัญหาคือผู้ช่วย AI ส่วนใหญ่พึ่งพา API ภายนอกมากเกินไปเพื่อเติมเต็ม แม้ว่าพวกเขาจะควบคุมการเติมเต็ม เช่น Alexa สำหรับการค้นหาอีคอมเมิร์ซ พวกเขาก็ประสบปัญหาเดียวกัน พูดง่ายๆ คือ คุณจะคาดหวังให้ผู้ช่วยสั่งงานด้วยเสียงฉลาดได้อย่างไร ในเมื่อทุกอย่างทำเพียงแค่เปลี่ยนเสียงพูดเป็นข้อความและใส่ข้อความนั้นลงในเครื่องมือค้นหาแบบข้อความ เราเริ่มต้น MeetKai ด้วยแนวคิดที่ว่าเราสามารถจัดหาผู้ช่วย AI ที่ "ก้าวกระโดด" ได้ด้วยการควบคุมไปป์ไลน์การประมวลผลตั้งแต่ต้นทางถึงปลายทางทั้งหมดซึ่งประกอบกันเป็นผู้ช่วยเสียง เราพัฒนาเครื่องมือค้นหาการสนทนาแทนที่จะใช้คำหลักเพื่อรองรับข้อความค้นหาและการสนทนาที่ซับซ้อนมากขึ้น ผู้ช่วยคนอื่นติดอยู่กับประสบการณ์ที่ขาดความดแจ่มใสเพราะพวกเขาไม่สามารถสร้างการสนับสนุนการสนทนาแบบหลายผลัดเปลี่ยนจากปัจจัยจำกัดดังกล่าวได้ ในขณะที่เป้าหมายของเราคือการไปให้ถึงจุดนั้น เรายังคงอยู่ในช่วงเริ่มต้นของการขยายเทคโนโลยีของเราเพื่อให้บรรลุจำนวนโดเมนที่เท่ากันกับผู้เล่นที่มีอยู่

อะไรคือความท้าทายในการเข้าใจภาษาธรรมชาติและการประมวลผลภาษาธรรมชาติที่อยู่เบื้องหลังการสร้างประสบการณ์ผู้ช่วยเสียงที่ล้ำสมัย?

หนึ่งในความท้าทายหลักสำหรับ NLU รุ่นต่อไปคือการก้าวข้ามความตั้งใจและเอนทิตี NLU ส่วนใหญ่มุ่งเน้นไปที่การมีแนวทางดั้งเดิมในการทำความเข้าใจภาษา คำพูดที่ป้อนเข้าแต่ละรายการจะถูกจัดประเภทตามเจตนา จากนั้นโทเค็นภายในจะถูกระบุเป็นเอนทิตีโดยใช้แบบจำลองการติดฉลากตามลำดับ ฉันสามารถระบุปัญหาได้มากมายด้วยแนวทางมาตรฐานนี้ อย่างไรก็ตาม สิ่งที่สำคัญที่สุดได้แก่:

  1. การจำแนกเจตนาที่ไม่มีบริบทล้มเหลวในการจัดการการสนทนาแบบหลายเทิร์น วิธีการส่วนใหญ่สนใจเฉพาะข้อความดิบที่ถอดความเท่านั้น พวกเขาไม่สนใจบริบท — ไม่สนใจว่าผู้ใช้เป็นใคร ไม่สนใจว่าผู้ใช้ชอบอะไร แต่สนใจเฉพาะสิ่งที่พวกเขาเพิ่งถามถึงเท่านั้น นี่เป็นสิ่งสำคัญอย่างยิ่งเมื่อผู้ใช้พูดอะไรเป็นข้อๆ ตัวอย่างเช่น ถ้ามีคนพูดว่า cosmopolitan อาจหมายถึงเครื่องดื่มหรือนิตยสาร และขึ้นอยู่กับบุคคลนั้นเป็นอย่างมาก
  2. แบบจำลองการจดจำเอนทิตีทำงานได้ไม่ดีสำหรับสิ่งใดก็ตามที่ไม่ใช่ค่าตามหมวดหมู่ โมเดลภาษาขนาดใหญ่ไม่สามารถปรับตัวได้เร็วพอกับเอนทิตีใหม่ที่อยู่ในมาตรฐาน เนื่องจากไม่ได้อยู่ในชุดข้อมูล AI จำเป็นต้องมีวิธีที่ซับซ้อนกว่านี้มากในการจดจำเอนทิตีโดยพิจารณาจากบริบทที่ลึกกว่านั้นมาก ตัวอย่างเช่น ตำแหน่งของผู้ใช้ควรมีอิทธิพลอย่างมากหากชื่อร้านอาหารเป็นชื่ออื่น
  3. ความสัมพันธ์ของเอนทิตีไม่ได้รับการพิจารณาอย่างดี ตัวอย่างที่ฉันชอบคือความถี่ที่เครื่องมือค้นหาส่วนใหญ่ล้มเหลวเมื่อมีการปฏิเสธ ลองค้นหาภาพยนตร์ที่ไม่มีความรักจากผู้ช่วยเสียงอื่นๆ แล้วคุณจะเห็นว่าฉันหมายถึงอะไร

ปัจจุบันผู้ช่วยเสียงส่วนใหญ่เพียงแปลเสียงเป็นข้อความและทำการค้นหาโดย Google MeetKai AI ทำงานแตกต่างจากนี้อย่างไร

ข้อแตกต่างหลักระหว่าง MeetKai และ Google เมื่อเป็นเรื่องของการค้นหาคือ เราใช้โมเดลการทำความเข้าใจภาษาที่สมบูรณ์ยิ่งขึ้นในการค้นหารายการต่างๆ แทนที่จะเป็นเพียงหน้าเว็บ เมื่อคุณค้นหา "ภาพยนตร์ Tom Cruise ที่ไม่มีการดำเนินการ" Google กำลังมองหาหน้าเว็บที่มีโทเค็นชุดนั้นปรากฏอยู่ในหน้านั้น (Tom Cruise, ภาพยนตร์, แอ็กชัน) ที่ MeetKai เราเข้าใจอย่างถูกต้องว่า Tom Cruise เป็นนักแสดง ภาพยนตร์เป็นสื่อประเภทหนึ่งที่พวกเขากำลังมองหา และการกระทำนั้นเป็นแนวที่ไม่ต้องการ ด้วยวิธีนี้ เราสามารถทำการค้นหาที่ชาญฉลาดมากขึ้น

Meetkai เพิ่งเปิดตัวโลก VR ไลฟ์สไตล์แห่งแรก: MeetKai Metaverse คุณสามารถพูดคุยว่าแอปพลิเคชันนี้คืออะไรโดยเฉพาะ?

บริษัทส่วนใหญ่ในพื้นที่ metaverse กำลังทำงานเกี่ยวกับบุคคล<>ปฏิสัมพันธ์ระหว่างบุคคล ยิ่งไปกว่านั้น เนื้อหาส่วนใหญ่ยังเป็นการ์ตูนหรือเป็นเพียงวิดีโอ 360° เป้าหมายของเรากับ Metaverse ของ MeetKai คือการมุ่งเน้นไปที่มุมที่แตกต่างอย่างสิ้นเชิง — บุคคล<>AI เรากำลังพัฒนาเมตาเวิร์สที่ตัวละครที่คุณโต้ตอบด้วยล้วนขับเคลื่อนโดย AI การสนทนาที่ล้ำสมัยของเรา นอกจากนี้ เรากำลังทำงานเพื่อดำเนินการสร้างขั้นตอนของสภาพแวดล้อมเพื่อให้ดูสมจริงและสมจริงมากขึ้นเมื่อเทียบกับบริษัทอื่นๆ ในพื้นที่ โลกเริ่มต้นสองโลกที่มีให้สำรวจใน metaverse ของเรามีไว้สำหรับสองกรณีการใช้งานเบื้องต้น: การทำสมาธิและพิพิธภัณฑ์ ในอดีต เราได้ทำให้ผู้เชี่ยวชาญหย่งชุนกลายเป็นดิจิทัล และเป็นครั้งแรกที่เราสร้างตัวละคร AI ที่สามารถแนะนำผู้ใช้เกี่ยวกับวิธีการใช้เทคนิคการทำสมาธิแบบปฏิวัติเพื่อเข้าสู่สภาวะของการผ่อนคลาย ในระยะหลัง เราได้สร้างพิพิธภัณฑ์ศิลปะที่เติบโตขึ้นเรื่อยๆ และจัดหาภัณฑารักษ์ที่ขับเคลื่อนด้วย AI ที่สามารถตอบคำถามเกี่ยวกับศิลปะในพื้นที่และให้บริการนำเที่ยว

ตัวอย่างการใช้ AI ใน Metaverse นี้มีอะไรบ้าง

เราใช้ AI ในสามแห่ง:

  1. เพื่อเสริมพลังความสามารถในการสนทนาของตัวละครแต่ละตัวใน metaverse ของเรา
  2. เพื่อสร้างเนื้อหาแบบไดนามิกที่ให้บริการแก่ผู้ใช้ผ่านการแนะนำด้วยเสียง ตัวอย่างนี้รวมถึงการทำสมาธิและทัวร์หอศิลป์ในประสบการณ์สองครั้งแรกของเรา
  3. เพื่อสร้างพื้นที่ 3 มิติตามขั้นตอนแทนที่จะต้องใช้เค้าโครงด้วยมือ

วิสัยทัศน์ของคุณเกี่ยวกับอนาคตของผู้ช่วยเสียงคืออะไร

เพื่อให้ผู้ช่วยเสียงมีอนาคต พวกเขาจำเป็นต้องพัฒนาไปสู่สิ่งที่มากกว่าระบบตามคำสั่ง ซึ่งหมายถึงการได้รับความเชี่ยวชาญและความสามารถเชิงลึกในโดเมนเฉพาะต่างๆ ฉันคิดว่าการประกอบผู้ช่วยเสียงเฉพาะโดเมนที่แตกต่างกันจะเป็นกุญแจสำคัญในการสร้างผู้ช่วยเมตาที่ชาญฉลาดทั้งหมด สิ่งนี้ตรงกันข้ามกับความพยายามที่จะ "ทำทุกอย่างพร้อมกัน" ที่เราได้เห็นตั้งแต่ผู้ช่วยเสียงเข้ามาในพื้นที่เป็นครั้งแรก

มีอะไรอีกบ้างที่คุณต้องการแชร์เกี่ยวกับ MeetKai หรือ Metaverse ของ MeetKai

เรายังคงอยู่ที่จุดเริ่มต้นของแผนงาน metaverse ของเรา เป้าหมายสุดท้ายของเราคือเราต้องการจำลองประสบการณ์ที่คุณมีในโลกแห่งความเป็นจริงด้วย metaverse แล้วก้าวไปไกลกว่านั้น ซึ่งหมายความว่าเราต้องการขจัดปัจจัยด้านต้นทุนและเวลาที่จำกัดประสบการณ์เดียวกันในความเป็นจริง metaverse สามารถช่วยให้เรามีชีวิตที่สมบูรณ์ยิ่งขึ้น ไม่ใช่แทนที่พวกเขา เรามีความท้าทายทางเทคนิคหลายประการที่ยังคงต้องแก้ไข อย่างไรก็ตาม เรามีเหตุการณ์สำคัญที่ชัดเจนซึ่งสามารถทำได้โดยสมมติว่าฮาร์ดแวร์มีการปรับปรุงอย่างต่อเนื่อง เรากำลังทำงานอย่างใกล้ชิดกับพันธมิตรด้านฮาร์ดแวร์เพื่อให้แน่ใจว่าพื้นที่ VR ก้าวไปข้างหน้าอย่างรวดเร็ว นอกเหนือจาก VR เราต้องการทำให้ประสบการณ์ metaverse เป็นไปได้นอก VR เราจะประกาศข้อมูลเพิ่มเติมเกี่ยวกับเรื่องนี้ในอีกไม่กี่เดือนข้างหน้า

ขอบคุณสำหรับบทสัมภาษณ์ที่ยอดเยี่ยม ฉันตั้งตารอที่จะติดตามความคืบหน้าของคุณเกี่ยวกับ metaverse เวอร์ชันของคุณ ผู้อ่านที่ต้องการเรียนรู้เพิ่มเติมควรเยี่ยมชม พบกับไก่.

Antoine เป็นผู้นำที่มีวิสัยทัศน์และเป็นหุ้นส่วนผู้ก่อตั้ง Unite.AI ซึ่งขับเคลื่อนโดยความมุ่งมั่นอย่างไม่ลดละในการกำหนดและส่งเสริมอนาคตของ AI และหุ่นยนต์ ในฐานะผู้ประกอบการที่ประสบความสำเร็จอย่างต่อเนื่อง เขาเชื่อว่า AI จะสร้างความปั่นป่วนให้กับสังคมได้ไม่แพ้ไฟฟ้า และมักจะพูดถึงศักยภาพของเทคโนโลยีที่สร้างความปั่นป่วนและ AGI อยู่เสมอ

ในฐานะที่เป็น ผู้เป็นเจ้ายังมาไม่ถึงเขาอุทิศตนเพื่อสำรวจว่านวัตกรรมเหล่านี้จะหล่อหลอมโลกของเราอย่างไร นอกจากนี้ เขายังเป็นผู้ก่อตั้ง หลักทรัพย์.ioแพลตฟอร์มที่มุ่งเน้นการลงทุนในเทคโนโลยีล้ำสมัยที่กำลังนิยามอนาคตใหม่และปรับเปลี่ยนรูปลักษณ์ของภาคส่วนต่างๆ