Connect with us

نيكولا مركشيك، المؤسس المشارك والرئيس التنفيذي لشركة PolyAI – سلسلة المقابلات

مقابلات

نيكولا مركشيك، المؤسس المشارك والرئيس التنفيذي لشركة PolyAI – سلسلة المقابلات

mm

نيكولا مركشيك هو المؤسس المشارك والرئيس التنفيذي لشركة PolyAI، وهي شركة رائدة في توفير مساعدين صوتيين جاهزين للشركات لخدمة العملاء الآلية.

ما الذي جذبك في البداية إلى مجال الذكاء الاصطناعي؟

لقد كنت مهتما بالرياضيات وعلوم الحاسوب منذ سن مبكر جدا. خلال دراستي في جامعة كامبريدج، حظيت بفرصة للعمل مع باحثين رائدين في مجال التعلم الآلي، بما في ذلك ستيف يونغ و زوبين غهراماني. أقنعني ستيف بالانضمام إلى شركته، VocalIQ، للعمل على بناء أنظمة حوار صوتي. فيما بعد، قمت بدراسة الدكتوراه مع ستيف أيضا، حيث عملت على بناء نماذج فهم اللغة مدفوعة بالبيانات التي تعمل عبر مختلف الحالات واللغات. الذكاء الاصطناعي الحواري هو مجال عمل صعب ومعقد، مع العديد من الاكتشافات العلمية والهندسية التي لا تزال أمامنا، وهو ما أبقىني مشغولا منذ ذلك الحين.

في عام 2017، أسست شركة PolyAI، وهي شركة ذكاء اصطناعي حواري، يمكنك مناقشة قصة ولادة شركة PolyAI؟

قمت أنا وزميلاي المؤسسون، شون وين وإدي سو، بدراسة الدكتوراه في جامعة كامبريدج في نفس الوقت. لقد عملنا على أنظمة الحوار لسنوات عديدة، ولكننا سرعان ما أدركنا أن الأنظمة المتطورة التي كنا معتادين على العمل عليها لها تطبيقات تجارية قليلة جدا. لذلك، اجتمعت معهم لإنشاء حل ذكاء اصطناعي حواري سيكون مفيدا في العالم الحقيقي. رأينا فرصة لإنشاء أنظمة حوار حقيقية، متعددة الدورات، وتراسلية يمكنها التفاعل مع الناس الحقيقيين في الحياة اليومية.

ركزنا على خدمة العملاء لأننا شعنا أن القدرات التكنولوجية الحالية ومتطلبات العملاء كانت متطابقة جيدا.

يمكنك مناقشة بعض تقنيات التعلم الآلي ومعالجة اللغة الطبيعية المستخدمة؟

سرنا الرئيسي هو مجموعة من نماذج التشفير المملوكة لنا. لقد قمنا بتدريبهم مسبقا على مليارات من المحادثات الطبيعية، لذلك يمكنهم استخراج النية حتى عندما يستخدم الكلام لغة عامية أو تعابير مثلا. هذا أمر بالغ الأهمية للتواصل عبر الهاتف. العملاء لا يتكلمون بالكلمات المفتاحية؛ إنهم يروون قصصا، يقطعون، يسألون أسئلة ويتصرفون بشكل عام كما لو كانوا يريدون السيطرة على المحادثة.

لقد أعلنا مؤخرا عن نموذج ConVEx، وهو مستخرج كيانات فعال من حيث البيانات، والذي يسمح لنا بالاستخراج الدقيق للقيم من المحادثات.

عملية توجيه نظام التعرف على الكلام لدينا تتضمن استخدام منصات التعرف على الكلام المحددة لتعطيل الضوضاء الناجمة عن لهجات مختلفة، بالإضافة إلى ضبط دقيق للسياقات المختلفة.

لقد طوّرنا أيضا مكتبة سياسات حوار قوية مع حالات استخدام مُسبقة التصميم تشمل جميع معاملات خدمة العملاء الشائعة، لذلك يمكننا تشغيل مساعد صوتي جديد للعملاء بسرعة فائقة.

ما هو ما يميز منتج ذكاء اصطناعي حواري جيدًا عن منتج ذكاء اصطناعي حواري سيئ؟

منتج جيد سيفهم باستمرار ما يعنيه المستخدمون وسيمنعهم من تكرار أنفسهم. غالبا ما تحدث المكالمات في بيئات صاخبة، لذلك يجب على المنتجات أن تكون قادرة على تحمل الإدخالات المزعجة. مع تواصل العلامات التجارية مع أسواق كبيرة، يجب على المنتجات فهم مجموعة متنوعة من اللهجات وطرق صياغة النيات. كل ذلك يتطلب من المنتجات ضمان القدرات القوية للاعتراف بالكلام، وتصنيف النية، وتصنيف الكيانات.

منتج رائع سيكون ممتعا للمستخدمين. سيتابع مسار أفكار المستخدم، وسيتمكن من التعامل مع الحالات اليومية المعقدة حيث قد يشارك المستخدمون عدة نيات ومعلومات في نفس الوقت، ويمكنهم القفز بين سياقات مختلفة. ذلك يتطلب تصنيفا متعدد العلامات قويا وإدارة السياق.

منتج ممتع سيعرض سمات بشرية دون أن يكون غريبا أو روبوتيا. هذا يعني تفاعلات سريعة، وأصوات حقيقية، ورسائل إشعار مستمرة، ودرجة من العشوائية والعيوب.

أخيرا، منتج ذكاء اصطناعي حواري رائع سيتفاعل مع المستخدمين حيثما كانوا وسيقدم تجربة سلسة وخاصة بالمنصة، والتي قد تشمل الصوت والرسائل القصيرة أو المحادثة أو منصات المراسلة الاجتماعية. نمط التفاعل يجب أن يعتمد على خصوصية كل منصة اتصال.

ما هي بعض مزايا استخدام الشركات للذكاء الاصطناعي الحواري بدلا من محاولة توجيه الاستفسارات إلى البوتات المحادثة؟

تجربة العملاء هي أمر بالغ الأهمية وأصبحت محركا رئيسيا للاحتفاظ بالعملاء. يجب أن يكون الأولوية الأولى هي جعل الأمر سهلا للعملاء لتحقيق ما يريدون.

الهاتف لا يزال هو القناة المفضلة لدى معظم العملاء للتواصل مع الشركة. تصل نسبة التفاعلات مع العملاء عبر الهاتف إلى 65٪ من جميع التفاعلات مع العملاء. خلال جائحة كوفيد-19، تم دفع مراكز الاتصال إلى الحد الأقصى مع المزيد من العملاء الذين يتصلون طلبا للدعم.

بالطبع، تجربة رائعة تسمح للعملاء بالتواصل بأي طريقة يفضلونها، لذلك لأي شخص يفضل الاتصالات غير المتزامنة، نجعل من السهل على العلامات التجارية تقديم نفس المستوى من التجربة عبر القنوات النصية.

ما مدى صعوبة تحديد نية ما يريد العملاء قوله؟

هناك العديد من التحديات في فهم العملاء عبر قنوات الصوت. لفهم دقيق ومستمر لمعنى المستخدمين يتطلب العديد من المكونات للعمل معا جيدا.

أولا، التعرف على الكلام صعب، خاصة عندما يتصل الناس من بيئات صاخبة مثل عندما يكونون على هاتف محمول أو أثناء القيادة في حركة المرور أو النفق. التعرف على الكلام يمكن أن يكون صعبا أيضا في المناطق التي تختلف اللهجات والمفردات. لقد طوّرنا طريقة فعالة لتحيز نماذج التعرف على الكلام بالنسبة للسياق المعطى من أجل تحسين التعرف على الكلام.

بسبب أن نموذج ConveRT قد تم تدريبه على كمية هائلة من البيانات الحوارية، يمكنه اكتشاف النية من خلال إشارات ضعيفة، مثل قدرة البشر على فهم ما يقوله شخص ما حتى إذا فاتنا كلمة أو كلمتين.

نظرية أخرى هي فهم عندما يريد المستخدمون القيام بعدة أعمال في نفس الوقت. على سبيل المثال، قد يقول شخص ما: “لقد فقدت بطاقتي. هل يمكنك أن تخبرني إذا كانت قد استخدمت وبلوكيها؟” في هذه الحالة، يحتاج النموذج إلى التعرف على نيتين والعمل عليهما بالترتيب الذي يتناسب معه.

النموذج cũng يحتاج إلى القدرة على استخراج وفهم الكيانات التي ي提供ها العملاء. على سبيل المثال، “هل لديك طاولة يوم السبت للغداء من أجلي و زوجتي و أطفالنا؟” النية السطحية هنا هي التحقق من توفر الطاولة، ولكن النموذج يحتاج إلى استخراج التاريخ (السبت) وعدد الأشخاص (4) وأي معلومات أخرى قد تكون ذات صلة (ربما لا يُسمح للأطفال بالجلوس في منطقة المطعم، ويمكنهم الجلوس فقط في البار).

أخيرا، المحادثة ليست دائمًا خطية. العملاء قد يقطعون بأسئلة غير متعلقة بتحفيز مساعد الصوت، لذلك يجب على المساعد أن يكون قادرا على “استماع” إلى نوع معين من الإدخال، مع كونه مفتوحا لتحفيزات مختلفة مثل الأسئلة الشائعة أو التغييرات في المعلومات التي قدمها المستخدم في السابق.

ما هي العملية والجدول الزمني المطلوب لشركة تريد إطلاق مساعد ذكاء اصطناعي حواري مع PolyAI؟

نحن هنا لتقديم مساعدين صوتيين له تأثير ملموس على الأعمال. لذلك، نبدأ كل تعاون مع اكتشاف حيث نساعد العملاء على تحديد وتبليغ أهداف تجربة العملاء، والمetrics الرئيسية، وعمليات الدعم. هذا هو المكان الذي نحدد فيه الرحلات التي سيتوجب على مساعد الصوت إرشاد العملاء من خلالها. هذا، بالإضافة إلى نموذج ConveRT المسبق التدريب، يعني أننا لا نحتاج إلى كميات كبيرة من بيانات المحادثة من العملاء.

من هناك، يمكننا تطوير مساعد صوتي مع الحد الأدنى من المدخلات المطلوبة من العميل، لذلك لا يتطلب ذلك الكثير من فرق تكنولوجيا المعلومات الداخلية.

اعتمادا على التعقيد، يمكننا تشغيل دليل قيمة في غضون أسبوعين، وتنفيذا كاملا في شهرين.

شكرا على المقابلة الرائعة، القراء الذين يرغبون في معرفة المزيد يجب أن يزوروا PolyAI.

أنطوان هو قائد رؤى ومؤسس شريك في Unite.AI، مدفوعًا بشغف لا يتزعزع لتشكيل وتعزيز مستقبل الذكاء الاصطناعي والروبوتات. رجل أعمال متسلسل، يعتقد أن الذكاء الاصطناعي سيكون مدمرًا للمجتمع مثل الكهرباء، وغالبًا ما يُقبض عليه وهو يثرثر عن إمكانات التكنولوجيات المدمرة و AGI.

كما أنه مستقبلي، فهو مخصص لاستكشاف كيف سيشكل هذه الابتكارات العالم. بالإضافة إلى ذلك، فهو مؤسس Securities.io، وهي منصة تركز على الاستثمار في التكنولوجيات المتقدمة التي تعيد تعريف المستقبل وتهيئ القطاعات بأكملها.