مقابلات
جيمس كابلان، الرئيس التنفيذي ومؤسس MeetKai Metaverse – سلسلة المقابلات

جيمس كابلان، هو الرئيس التنفيذي ومؤسس MeetKai شركة ذكاء اصطناعي وواقع افتراضي وبحث محادثات مقرها لوس أنجلوس، كاليفورنيا، وتقود حاليًا سباق الكلام الاصطناعي بميزات لم تُرى من قبل. يمكن للذكاء الاصطناعي المحادثاتي فهم كلام أكثر تعقيدًا وتقديم نتائج مخصصة في محادثة طبيعية حول مواضيع عديدة، في réalités مختلفة. يتم نشر تقنية MeetKai على مستوى العالم من خلال iOS و Google Play و AppGallery.
لقد كان لديك شغف بالذكاء الاصطناعي في سن مبكرة، كيف تعرفت على هذه التقنية لأول مرة؟
جاءت معرفتي بالذكاء الاصطناعي من ألعاب الفيديو. أولاً، كان ذلك من خلال محاولة فهم كيف يعمل الذكاء الاصطناعي في لعبة Oregon Trail – ليس ذكياً جدًا، ولكن لا يزال شكلًا من أشكال الذكاء الاصطناعي. من هناك، نمت اهتمامي بالذكاء الاصطناعي أكثر عندما دخلت إلى ألعاب MMORPGs. كنت أحب اللعب في الألعاب عبر الإنترنت، ولكنني كرهت البحث عن عناصر. وبالتالي، دخلت في كتابة البوتات.
ما هي بعض التطبيقات الأولى للذكاء الاصطناعي التي قمت ببرمجةها؟
كتابة البوتات لألعاب MMORPGs كانت بالفعل أول محاولة لي في تطوير شكل معين من الذكاء الاصطناعي. في البداية، كانت بوتاتي بسيطة جدًا وأقرب إلى الماكروات منها الذكاء الاصطناعي. ولكن مع تقدمي في السن ومع تحسن كشف البوتات في العديد من الألعاب، بدأ هذا يتطلب جعل البوتات تبدو أكثر مثل اللاعب. لقد استمتعت دائمًا بكتابة البوتات – ووصلت إلى كتابة بوت للفوز في مسابقة تايلور سويفت أثناء وجودي في المدرسة (وأتيحت لها الأداء!). كما قمت بكتابة بوت بوكيمون جو الأول وندمت على حظر العديد من الأشخاص عندما فقدت الاهتمام بتجنب الكشف.
أطلقت MeetKai في عام 2018 بعد شعورك بالإحباط من مساعدي الذكاء الاصطناعي الحالية. لماذا يقدم معظم مساعدي الذكاء الاصطناعي تجربة مخيبة؟
مكمن القضية هو أن معظم مساعدي الذكاء الاصطناعي يعتمدون بشكل كبير على واجهات برمجة التطبيقات الخارجية للتحقق. حتى عندما يتحكمون في التحقق، مثل أليكسا للبحث التجاري، يعانون من نفس المشاكل. ببساطة، كيف يمكن توقع مساعد ذكاء اصطناعي ذكي عندما كل ما يفعله هو تحويل الكلام إلى نص ووضع ذلك النص في محرك بحث قائم على النص؟ بدأنا MeetKai مع فكرة أننا يمكن أن نقدم مساعد ذكاء اصطناعي قفزًا عن طريق التحكم في трубة المعالجة الكاملة التي تتكون منها مساعد الصوت. قمنا بتطوير محرك بحث محادثاتي بدلاً من محرك بحث قائم على الكلمات لتدعم استفسارات وأحاديث أكثر تعقيدًا. مساعدو الذكاء الاصطناعي الآخرون عالقون في تجارب مخيبة لأنهم لا يستطيعون بناء دعم محادثة متعددة الدورات على قاعدة هذه العوامل المحدودة. بينما هدفنا هو الوصول إلى هناك، ما زلنا في مرحلة مبكرة جدًا من توسيع تقنيتنا لتحقيق نفس عدد المجالات مثل اللاعبين الحاليين.
ما هي بعض التحديات المتعلقة بفهم اللغة الطبيعية ومعالجة اللغة الطبيعية في بناء تجربة مساعد صوتي متقدم؟
أحد التحديات الأساسية مع الجيل التالي من فهم اللغة الطبيعية هو الانتقال بعيدًا عن النوايا والكيانات. يركز معظم فهم اللغة الطبيعية على نهج تقليدي جدًا لفهم اللغة. يتم تصنيف كل إدخال إلى نية، ثم يتم وضع علامات على الرموز داخلها إلى كيانات باستخدام نموذج وضع تسلسل. يمكنني تعداد عشرات المشاكل مع هذا النهج القياسي. ومع ذلك، فإن أكثر المشاكل حرجة هي:
- تصنيف النية الذي لا يعتمد على السياق يفشل في التعامل مع محادثة متعددة الدورات. لا يهتم معظم النهج إلا بالنص الخام الذي تم نسخه. لا يهتمون بالسياق – لا من هو المستخدم، ولا ما يعجبه المستخدم، فقط ما سأل عنه للتو. هذا مهم جدًا عندما يقول المستخدم شيئًا قصيرًا جدًا. على سبيل المثال، إذا قال شخص ما كوزموبوليتان، فقد يعني ذلك المشروب أو المجلة ويت phụ thuộc بشكل كبير على الشخص.
- يؤدي نموذج التعرف على الكيانات أداءً سيئًا لأي شيء ليس قيمة فئوية. لا تستطيع نماذج اللغة الكبيرة التكيف بسرعة كافية مع كيانات جديدة في البرية لأنها ليست في مجموعة البيانات. يحتاج الذكاء الاصطناعي إلى طريقة أكثر تعقيدًا لتعرف الكيانات من خلال النظر في سياق أعمق. على سبيل المثال، يجب أن يؤثر موقع المستخدم بشكل كبير على ما إذا كان شيء ما هو اسم مطعم أو شيء آخر.
- لا يتم النظر في علاقات الكيانات جيدًا. مثال tôi المفضل هو كيف يفشل معظم محركات البحث عندما يتعلق الأمر بالسلبية. حاول البحث عن فيلم بدون رومانسية على مساعدي الصوت الآخرين، وسترون ما أعني.
يعمل معظم مساعدي الصوت ببساطة بترجمة الصوت إلى نص وإجراء بحث جوجل. كيف يعمل MeetKai AI بشكل مختلف عن هذا؟
الفرق الرئيسي بين MeetKai و Google عند البحث هو أننا نستخدم نموذج فهم لغة أكثر غنى للبحث عن العناصر نفسها بدلاً من صفحات الويب فقط. عندما تبحث عن “أفلام توم كروز بدون إثارة،” يبحث جوجل عن صفحات تحتوي على مجموعة من الرموز التي تظهر على الصفحة (توم كروز، أفلام، إثارة). في MeetKai، نفهم بشكل صحيح أن توم كروز هو ممثل، والأفلام هي فئة الإعلام التي يبحثون عنها، والإثارة هي النوع غير المرغوب فيه. مع ذلك، يمكننا إجراء عمليات بحث أكثر ذكاءً.
أطلقت MeetKai مؤخرًا أول عالم افتراضي حياتي: MeetKai Metaverse. يمكنك مناقشة ما هو هذا التطبيق بالتحديد؟
تعمل معظم الشركات في مجال Metaverse على تفاعل شخص-شخص. بخلاف ذلك، فإن المحتوى غالبًا ما يكون مخططًا أو مجرد فيديو 360°. هدفنا مع MeetKai Metaverse هو التركيز على زاوية مختلفة تمامًا – شخص-ذكاء اصطناعي. نحن نطور متaverse حيث يتم تشغيل الشخصيات التي تتفاعل معها بذكاء اصطناعي محادثاتي قوي. بالإضافة إلى ذلك، نحن نعمل على توليد بيئات إجرائية لجعلها تبدو أكثر واقعية وغامرة عند مقارنتها بشركات أخرى في هذا المجال. العالمان الأوليان المتاحان لاستكشافهم في متناولنا هما لاستخدامات أولية: التأمل والمتاحف. في الأولى، قمنا برقمية خبير وينج تشون، وأول مرة قمنا بإنشاء شخصية ذكاء اصطناعي قادرة على تعليم المستخدمين كيفية استخدام تقنيات التأمل الثورية للدخول إلى حالة استرخاء. في الثانية، قمنا بإنشاء متحف فني متزايد دائمًا وقمنا بتقديم معرض قوي بالذكاء الاصطناعي قادر على الإجابة على أسئلة حول الفن في الفضاء وتنظيم الجولات.
ما هي بعض الأمثلة على كيفية استخدام الذكاء الاصطناعي في هذا Metaverse؟
نستخدم الذكاء الاصطناعي في ثلاثة أماكن:
- لتشغيل القدرات المحادثية لكل شخصية في متناولنا.
- لإنشاء المحتوى ديناميكيًا المتاح للمستخدم من خلال التوجيه الصوتي. أمثلة على ذلك هي جلسات التأمل وجولات معرض الفن في تجاربنا الأولية.
- لإنشاء الفضاء ثلاثي الأبعاد إجرائيًا بدلاً من الحاجة إلى تخطيط يدوي.
ما هو رؤيتك لمستقبل مساعدي الصوت؟
من أجل أن يكون لمساعدي الصوت مستقبل، يجب أن يتطوروا إلى شيء أكثر من نظام قائم على الأوامر. هذا يعني الحصول على خبرة وقدرات sâu في العديد من المجالات المحددة. أعتقد أن تجميع مساعدي الصوت المحدد لكل مجال سيكون مفتاح بناء مساعد ذكاء اصطناعي شاملاً. هذا يتناقض بشكل صارخ مع محاولات “فعل كل شيء في وقت واحد” التي رأيناها منذ دخول مساعدي الصوت إلى هذا المجال.
هل هناك شيء آخر تود مشاركته حول MeetKai أو MeetKai Metaverse؟
ما زلنا في بداية خارطة طريق متناولنا. هدفنا النهائي هو أن نكون قادرين على复制 أي تجربة لديك في العالم الحقيقي مع متناولنا، ثم الذهاب أبعد من ذلك. هذا يعني أننا نريد القضاء على العوامل الزمنية والتكلفة التي تحد من نفس التجارب في الواقع. يمكن لمتناولنا أن يسمح لنا بالعيش حياة أكثر غنى، لا يغيّرها. لدينا تحديات تقنية لا يزالون بحاجة إلى حل، ومع ذلك، لدينا مجموعة واضحة من المعالم التي يمكن تحقيقها مع افتراض أن الأجهزة ستستمر في التحسين. نحن نعمل بشكل وثيق مع شركاء الأجهزة لضمان تقدم مساحة VR بسرعة. بخلاف VR فقط، نريد جعل تجربة متناولنا ممكنة خارج VR. سنعلن عن المزيد من المعلومات حول هذا في الأشهر القادمة.
شكرًا على المقابلة الرائعة، أتطلع إلى متابعة تقدمك على إصدارك من Metaverse. القراء الذين يرغبون في معرفة المزيد يجب أن يزوروا MeetKai.












