สัมภาษณ์

เจมส์ คาพแลน ซีอีโอ และผู้ร่วมก่อตั้ง MeetKai Metaverse – สัมภาษณ์ ซีรีส์

Published January 21, 2022

Updated April 28, 2026

Antoine Tardif, CEO & Founder of Unite.AI

เจมส์ คาพแลน เป็น ซีอีโอ และผู้ร่วมก่อตั้ง MeetKai บริษัทด้านปัญญาประดิษฐ์ วีอาร์ และการค้นหาด้วยการสนทนา ที่ตั้งอยู่ในลอสแองเจลิส แคลิฟอร์เนีย ปัจจุบันกำลังนำการแข่งขันการพูดด้วยปัญญาประดิษฐ์ไปสู่ระดับที่ไม่เคยเห็นมาก่อนด้วยคุณสมบัติที่ไม่เคยเห็นมาก่อน ปัญญาประดิษฐ์ด้านการสนทนาของ MeetKai สามารถเข้าใจภาษาพูดที่ซับซ้อนได้มากขึ้น และให้ผลลัพธ์ที่เป็นส่วนตัวในการสนทนาเกี่ยวกับหัวข้อต่างๆ ในความเป็นจริงที่แตกต่างกัน เทคโนโลยีของ MeetKai ถูกใช้ทั่วโลกผ่าน iOS Google Play และ AppGallery

คุณมีความหลงใหลใน AI ตั้งแต่อายุ 6 ขวบ คุณได้รับการแนะนำให้รู้จักกับเทคโนโลยีนี้ครั้งแรกอย่างไร?

การแนะนำ AI ของฉันมาจากวิดีโอเกม ก่อนอื่นฉันพยายามเข้าใจว่า AI ในเกม Oregon Trail ทำงานอย่างไร — ไม่ใช่ AI ที่ฉลาดมาก แต่ก็เป็นรูปแบบหนึ่งของ AI อยู่ดี ตั้งแต่นั้นความสนใจใน AI ของฉันก็เพิ่มขึ้นเมื่อฉันเล่นเกม MMORPG ฉันชอบเล่นเกมออนไลน์ แต่ฉันไม่ชอบการเก็บของ ดังนั้นฉันจึงเริ่มเขียน Bots

แอปพลิเคชัน AI แรกที่คุณเขียนคืออะไร?

การเขียนบอทสำหรับเกม MMORPG เป็นการเข้าสู่การเป็นนักพัฒนาด้าน AI อย่างแท้จริง บอทของฉันในตอนแรกค่อนข้างง่ายและใกล้เคียงกับแมคโครมากกว่า AI จริงๆ แต่เมื่อฉันโตขึ้นและระบบตรวจจับบอทในเกมต่างๆ ดีขึ้น สิ่งนี้ต้องการให้บอทดูเหมือนผู้เล่นมากขึ้น ฉันชอบเขียนบอท — ฉันเขียนบอทเพื่อชนะการแข่งขัน Taylor Swift ในขณะที่ฉันยังอยู่ในโรงเรียน (และเธอก็มาแสดงจริงๆ!) ในทำนองเดียวกัน ฉันเขียนบอท Pokémon Go แรกๆ และเสียใจที่ทำให้หลายคนถูกแบนเมื่อฉันเสียความสนใจในการหลบการตรวจจับ

คุณเปิดตัว MeetKai ในปี 2018 หลังจากรู้สึกผิดหวังที่มีต่อผู้ช่วยเสียง AI ในปัจจุบัน ทำไมผู้ช่วย AI ส่วนใหญ่จึงให้ประสบการณ์ที่น่าผิดหวัง?

ประเด็นสำคัญของปัญหา คือ ผู้ช่วย AI ส่วนใหญ่พึ่งพา API ภายนอกสำหรับการเติมเต็ม แม้ว่าพวกเขาจะควบคุมการเติมเต็ม เช่น Alexa สำหรับการค้นหาในอีคอมเมิร์ซ พวกเขาก็ยังคงประสบปัญหาเดียวกัน พูดตรงๆ ว่าคุณคาดหวังว่าผู้ช่วยเสียงจะฉลาดได้อย่างไรเมื่อทุกสิ่งที่พวกเขาทำคือการแปลงเสียงเป็นข้อความและใส่ข้อความนั้นลงในเครื่องมือค้นหาข้อความ? เราเริ่มต้น MeetKai ด้วยแนวคิดที่ว่าเราสามารถให้ผู้ช่วย AI ที่ “ล้ำสมัย” ได้โดยการควบคุมทุกขั้นตอนของการประมวลผลที่ประกอบเป็นผู้ช่วยเสียง เราได้พัฒนาเครื่องมือค้นหาด้วยการสนทนาแทนการค้นหาโดยใช้คำค้นหา เพื่อสนับสนุนคำถามและการสนทนาที่ซับซ้อนมากขึ้น ผู้ช่วยอื่นๆ ติดอยู่กับประสบการณ์ที่น่าผิดหวังเพราะพวกเขาไม่สามารถสร้างการสนับสนุนการสนทนาหลายรอบได้บนสิ่งเหล่านี้ ในขณะที่เป้าหมายของเราคือการบรรลุเป้าหมายนี้ เรายังคงอยู่ในขั้นตอนแรกๆ ของการขยายเทคโนโลยีของเราเพื่อเติมเต็มโดเมนจำนวนเท่ากันกับผู้เล่นที่มีอยู่

ท้าทายด้านการเข้าใจภาษาธรรมชาติและประมวลผลภาษาธรรมชาติเบื้องหลังการสร้างประสบการณ์ผู้ช่วยเสียงรุ่นล่าสุดคืออะไร?

หนึ่งในท้าทายหลักของ NLU รุ่นต่อไป คือ การพัฒนานอกเหนือจากเจตนาและหน่วยต่างๆ ส่วนใหญ่ของ NLU มุ่งเน้นไปที่การเข้าใจภาษาแบบดั้งเดิมๆ แต่ละอินพุตจะถูกจัดประเภทเป็นเจตนา และจากนั้นตัวอักษรภายในจะถูกป้ายกำกับเป็นหน่วยต่างๆ โดยใช้แบบจำลองการทำเครื่องหมายลำดับ ฉันสามารถระบุปัญหาหลายสิบปัญหาของแนวทางมาตรฐานนี้ได้ แต่สิ่งที่สำคัญที่สุดคือ:

การจำแนกเจตนาแบบไม่มีบริบทล้มเหลวในการจัดการการสนทนาหลายรอบ ส่วนใหญ่เพียงแค่ดูข้อความที่ถอดเสียงออกมาเท่านั้น พวกเขาไม่สนใจบริบท — ไม่ว่าผู้ใช้คือใคร ไม่ว่าผู้ใช้ชอบอะไร เพียงแค่สิ่งที่พวกเขาเพิ่งถามเท่านั้น สิ่งนี้มีความสำคัญอย่างยิ่งเมื่อผู้ใช้พูดสิ่งที่สั้นและกระชับ เช่น ถ้าใครบางคนพูดว่า “คอสมอปอลิแทน” อาจหมายถึงเครื่องดื่มหรือนิตยสาร และขึ้นอยู่กับบุคคลนั้นอย่างมาก
แบบจำลองการรู้จำหน่วยต่างๆ ทำงานไม่ดีสำหรับสิ่งที่ไม่ใช่ค่าเชิงวัตถุ แบบจำลองภาษาขนาดใหญ่ไม่สามารถปรับตัวให้เข้ากับหน่วยใหม่ๆ ในป่าได้อย่างรวดเร็วเพราะพวกมันไม่ได้อยู่ในเซตข้อมูล AI ต้องการวิธีการรู้จำหน่วยต่างๆ ที่ซับซ้อนมากขึ้นโดยพิจารณาบริบทที่ลึกกว่านี้ ตัวอย่างเช่น ที่ตั้งของผู้ใช้ควรส่งผลต่อว่าสิ่งใดเป็นชื่อร้านอาหารหรือสิ่งอื่น
ความสัมพันธ์ระหว่างหน่วยต่างๆ ไม่ได้รับการพิจารณาอย่างดี ตัวอย่างที่ฉันชอบมากที่สุดคือความบ่อยที่เครื่องมือค้นหาส่วนใหญ่ล้มเหลวเมื่อเกี่ยวข้องกับการปฏิเสธ ลองค้นหาภาพยนตร์ที่ไม่มีโรแมนติกในผู้ช่วยเสียงอื่นๆ และคุณจะเห็นความหมาย

ปัจจุบันผู้ช่วยเสียงส่วนใหญ่เพียงแค่แปลเสียงเป็นข้อความและทำการค้นหาแบบ Google MeetKai AI ทำงานแตกต่างจากสิ่งนี้อย่างไร?

ความแตกต่างหลักๆ ระหว่าง MeetKai และ Google เมื่อพูดถึงการค้นหานั้น คือ เราใช้แบบจำลองการเข้าใจภาษาที่มีความเข้าใจมากกว่าในการค้นหาสิ่งของเอง แทนที่จะค้นหาเพียงหน้าเว็บ เมื่อคุณค้นหา “ภาพยนตร์ของ Tom Cruise ที่ไม่มีแอ็คชั่น” Google กำลังมองหาหน้าที่มีชุดโทเค็นเหล่านี้ปรากฏบนหน้า (Tom Cruise, ภาพยนตร์, แอ็คชั่น) ที่ MeetKai เราเข้าใจว่า Tom Cruise เป็นนักแสดง ภาพยนตร์เป็นประเภทสื่อที่พวกเขากำลังมองหา และแอ็คชั่นเป็นประเภทที่ไม่พึงประสงค์ ด้วยสิ่งนี้ เราสามารถทำการค้นหาที่ฉลาดกว่าได้

MeetKai ได้เปิดตัวโลก VR แห่งแรก: MeetKai Metaverse คุณสามารถพูดคุยเกี่ยวกับแอปพลิเคชันนี้ได้หรือไม่?

บริษัทส่วนใหญ่ในพื้นที่ Metaverse กำลังทำงานเกี่ยวกับการโต้ตอบระหว่างคนกับคน นอกเหนือจากนั้น เนื้อหาส่วนใหญ่ยังเป็นการ์ตูนหรือเป็นวิดีโอ 360 องศา เป้าหมายของเรากับ MeetKai Metaverse คือ มุ่งเน้นไปที่มุมมองที่แตกต่าง — คนกับ AI เรากำลังพัฒนา Metaverse ที่ตัวละครที่คุณโต้ตอบนั้นได้รับการขับเคลื่อนด้วย AI การสนทนาที่ทันสมัยของเรา นอกจากนี้ เรากำลังทำงานเพื่อสร้างสภาพแวดล้อมแบบกระบวนการเพื่อให้ดูสมจริงและดึงดูดมากขึ้นเมื่อเทียบกับบริษัทอื่นๆ ในพื้นที่ โลกสองโลกแรกที่สามารถสำรวจได้ใน Metaverse ของเราคือสำหรับการใช้งานสองกรณี: การทำสมาธิและพิพิธภัณฑ์ ในกรณีแรก เราได้แปลงวิชาเอกวิชา Wing Chun และสร้างตัวละคร AI ที่สามารถสอนผู้ใช้ในการใช้เทคนิคการทำสมาธิที่ปฏิวัติวิธีการเข้าสู่สภาวะผ่อนคลาย ในกรณีที่สอง เราได้สร้างพิพิธภัณฑ์ศิลปะที่เติบโตอย่างต่อเนื่องและให้คนดูแลพิพิธภัณฑ์ที่มี AI ที่สามารถตอบคำถามเกี่ยวกับศิลปะในพื้นที่และให้การท่องเที่ยว

ตัวอย่างของการใช้ AI ใน Metaverse นี้คืออะไร?

เราใช้ AI ในสามจุด:

เพื่อขับเคลื่อนความสามารถในการสนทนาของตัวละครแต่ละตัวใน Metaverse ของเรา
เพื่อสร้างเนื้อหาที่มีให้สำหรับผู้ใช้ผ่านการนำทางด้วยเสียง ตัวอย่างเช่น การทำสมาธิและทัวร์พิพิธภัณฑ์ศิลปะในประสบการณ์แรกสองประสบการณ์ของเรา
เพื่อสร้างพื้นที่ 3 มิติแบบกระบวนการแทนการวางผังด้วยมือ

วิสัยทัศน์ของคุณสำหรับอนาคตของผู้ช่วยเสียงคืออะไร?

เพื่อให้ผู้ช่วยเสียงมีอนาคต พวกเขาต้องพัฒนาไปสู่สิ่งที่มากกว่าระบบที่ขึ้นอยู่กับคำสั่ง ซึ่งหมายความว่าได้รับความรู้และความสามารถที่ลึกซึ้งในโดเมนเฉพาะหลายโดเมน ฉันคิดว่าการรวบรวมผู้ช่วยเสียงที่มีความเชี่ยวชาญเฉพาะโดเมนต่างๆ จะเป็นกุญแจสำคัญในการสร้างผู้ช่วยเมตาที่ฉลาดทั้งหมด ซึ่งตรงกันข้ามกับการพยายาม “ทำทุกอย่างในครั้งเดียว” ที่เราเห็นตั้งแต่ผู้ช่วยเสียงเข้าสู่พื้นที่

มีสิ่งอื่นที่คุณต้องการแบ่งปันเกี่ยวกับ MeetKai หรือ MeetKai Metaverse หรือไม่?

เรายังคงอยู่ในขั้นตอนแรกๆ ของเส้นทาง Metaverse ของเรา เป้าหมายสุดท้ายของเราคือต้องการสามารถจำลองประสบการณ์ใดๆ ที่คุณมีในโลกแห่งความเป็นจริงด้วย Metaverse และไปไกลกว่านั้น ซึ่งหมายความว่าเราต้องการกำจัดปัจจัยที่จำกัดด้านต้นทุนและเวลาในการเข้าถึงประสบการณ์เหล่านั้นในโลกแห่งความเป็นจริง Metaverse สามารถทำให้เรามีชีวิตที่มีความ豊ka มากขึ้น ไม่ใช่การแทนที่มัน เรามีคำท้าทายทางเทคนิคที่ยังคงต้องแก้ไข แต่เรามีเป้าหมายที่ชัดเจนที่สามารถทำได้โดยสมมติว่าฮาร์ดแวร์จะดีขึ้นเรื่อยๆ เรากำลังทำงานอย่างใกล้ชิดกับคู่ค้าฮาร์ดแวร์เพื่อให้พื้นที่ VR ก้าวหน้าเร็วๆ นี้ นอกเหนือจาก VR แล้ว เราต้องการทำให้ประสบการณ์ Metaverse ของเราเป็นไปได้นอก VR เราจะประกาศข้อมูลเพิ่มเติมเกี่ยวกับสิ่งนี้ในเดือนที่จะมาถึง

ขอขอบคุณสำหรับการสัมภาษณ์ที่ยอดเยี่ยม ฉันหวังว่าจะติดตามความก้าวหน้าของคุณใน Metaverse ของคุณ ผู้อ่านซึ่งต้องการเรียนรู้เพิ่มเติมควรเยี่ยมชม MeetKai

Antoine Tardif, CEO & Founder of Unite.AI

อ็องตวนเป็นผู้นำที่มีวิสัยทัศน์และเป็นพันธมิตรผู้ก่อตั้งของ Unite.AI โดยมีความหลงใหลที่ไม่สั่นคลอนในการ塑造และส่งเสริมอนาคตของ AI และหุ่นยนต์ เขาเป็นผู้ประกอบการที่มีประสบการณ์หลายครั้ง และเชื่อว่า AI จะมีผลกระทบต่อสังคมมากเท่ากับไฟฟ้า และมักจะพูดถึงศักยภาพของเทคโนโลยีที่เปลี่ยนแปลงและ AGI

As a futurist เขาได้ให้ความสนใจในการสำรวจว่านวัตกรรมเหล่านี้จะเปลี่ยนแปลงโลกของเราอย่างไร นอกจากนี้เขายังเป็นผู้ก่อตั้ง Securities.io ซึ่งเป็นแพลตฟอร์มที่มุ่งเน้นในการลงทุนในเทคโนโลยีที่ทันสมัยซึ่งกำลังกำหนดอนาคตและเปลี่ยนแปลงภาคส่วนต่างๆ

Unite.AI

เจมส์ คาพแลน ซีอีโอ และผู้ร่วมก่อตั้ง MeetKai Metaverse – สัมภาษณ์ ซีรีส์

You may like