مقابلات

شارون بن ليفي، نائب الرئيس للبيع العالمي وتطوير الأعمال، مركز الاتصال، أوديو كودز – سلسلة المقابلات

mm

شارون بن ليفي، نائب الرئيس للبيع العالمي وتطوير الأعمال، مركز الاتصال، أوديو كودز، هو مسؤول تنفيذي في تكنولوجيا الاتصالات مع أكثر من 25 عامًا من الخبرة في مجالات البيع والتسويق وتطوير الأعمال وابتكارات مركز الاتصال. على مدار مسيرته المهنية التي شملت أكثر من عقدين في أوديو كودز، شغل مناصب قيادية رفيعة المستوى تركز على دفع النمو عبر اتصالات الشركات وحلول تجربة العملاء وتكنولوجيا مركز الاتصال القائم على الذكاء الاصطناعي. قبل أن ينضم إلى أوديو كودز، عمل في نظام NICE، حيث اكتسب خبرة قيمة في Participation العملاء وبرامج الشركات. على مدار مسيرته المهنية، ركز بن ليفي على مساعدة المنظمات في تحديث التفاعلات مع العملاء من خلال اتصالات السحابة والآلية والذكاء الاصطناعي الحواري، مما جعله صوتًا معترفًا به في تطور تكنولوجيا مركز الاتصال.

أوديو كودز هي شركة تكنولوجيا اتصالات متخصصة في صوت الشركات ومركز الاتصال وحلول تجربة العملاء القائمة على الذكاء الاصطناعي. تأسست الشركة في عام 1993، وتطورت من مزود لشبكات الصوت وبيئة VoIP إلى رائدة في اتصالات الصوت الذكية، مما يساعد المنظمات على تحديث التفاعلات مع العملاء والموظفين عبر السحابة والبيئات الهجينة والمنشآت. تشمل محفظتها منصات صوت الذكاء الاصطناعي، وحلول الذكاء الاصطناعي الحواري، ومراقبي الحدود الدورية، وتكاملات صوت Microsoft Teams، وعروض CPaaS، وأدوات تحديث مركز الاتصال. من خلال منصات مثل VoiceAI Connect و Live Hub، تمكن أوديو كودز الشركات من نشر بوتات الصوت ووكلاء الذكاء الاصطناعي وقدرات مساعدة الوكيل وحلول IVR الحوارية وخدمات الاتصال في الوقت الفعلي أثناء التكامل مع البنية التحتية للاتصالات الهاتفية ومركز الاتصال الحالي.

لقد قمت بإنفاق أكثر من عقدين في أوديو كودز، وتطورت من هندسة الأنظمة المدمجة إلى قيادة تطبيقات الإنتاجية. كيف شكلت هذه الرحلة منظورك حول ما يلزم لجعل الذكاء الاصطناعي الصوتي موثوقًا به في بيئات الشركات؟

لقد رأيت اتصالات الشركات من منظورات متعددة، وهذه الرحلة عززت درسي الأساسي: يجب بناء الموثوقية في كل слой من النظام من البداية.

العمل على الأنظمة المدمجة علمني أن الشيطان يكمن في التفاصيل، والقرارات الفنية الصغيرة لها تأثير كبير في بيئات الإنتاج. يجب هندسة التأخير وجودة الصوت ودقة النص والتحول الطبيعي لكل عنصر مع مراعاة الموثوقية، لأن أي فشل في أحد هذه العناصر يؤدي إلى فشل النظام كله. لا يمكن أن تدعي أن نظام الذكاء الاصطناعي الصوتي يعمل إذا كان يعمل فقط في ظروف مثالية.

الانتقال إلى القيادة جعل هذا واضحًا أكثر. تدعم الشركات آلاف المستخدمين عبر بنى تحتية معقدة مع متطلبات وقت تشغيل صارمة. نظام يعمل جيدًا في تجربة ولكن يتراجع تحت الحمل الفعلي لم يحل المشكلة.

هذا ما علمتني مسيرتي المهنية: معيار الذكاء الاصطناعي الصوتي في الشركات هو الثقة. والثقة تبنى فقط عندما يمكن للمنظمات الاعتماد على النظام لاداءه بشكل موثوق به بما يكفي ليدخل في عمليات الأعمال الحرجة.

لدي العديد من المنظمات التي جربت بوتات الدردشة، لكن الصوت يضيف طبقة مختلفة من التعقيد. ما هي أكبر التحديات الفنية في الانتقال من أنظمة الذكاء الاصطناعي القائمة على النص إلى أنظمة صوتية حوارية كاملة؟

التحدي الأكبر هو تعقيد بيئات الصوت في الشركات، والتي غالبًا ما تكون مقسمة إلى “جزر” منفصلة تتطلب الوساطة بين بروتوكولات الهاتف وبروتوكولات API القائمة على HTTP/SSE. بل إنها تنحدر إلى الناس. قليل من المهندسين يعرفون كل من بروتوكول SIP وبروتوكول HTTP/SSE. بالإضافة إلى ذلك، على عكس الأنظمة القائمة على النص، يتطلب الصوت معالجة وتنسيق في الوقت الفعلي، بما في ذلك التحويل بين بروتوكولات مختلفة حتى تتمكن هذه الأنظمة من التواصل بسلاسة. يضيف هذا الضرورة والتفاعل يزيد من الصعوبة بشكل كبير من الناحية التكنولوجية. التأخير والضوضاء الخلفية واللهجة والكلام المتقاطع هي الآن في المزيج. هذه المتغيرات لم تكن موجودة مع النص فقط.

تركز أوديو كودز على ربط أنظمة الهاتف التقليدية مع منصات الذكاء الاصطناعي الحديثة. يمكنك أن تفسر كيف تدمج حلول مثل VoiceAI Connect البنية التحتية التقليدية مع نماذج الذكاء الاصطناعي المتقدمة؟

VoiceAI Connect هو الجسر الذي يربط النقاط التقليدية للاتصال بالعملاء (أرقام الهاتف، وخطوط SIP، وتليفونات مركز الاتصال) مباشرةً مع منصات الذكاء الاصطناعي الحواري الثالثة مثل Google CX Agent Studio و Amazon Lex و Microsoft Copilot وأكثر من 30 أخرى. يتعامل مع التكامل الصوتي في الوقت الفعلي، بما في ذلك تحويل النص إلى كلام وترجمة النص إلى كلام وتوجيه إطار البوت، مما يسمح للشركات بدمج بوتات الذكاء الاصطناعي الصوتية بسهولة دون التخلي عن إعدادات الهاتف التقليدية.

غالبًا ما تعاني الشركات من صعوبة الانتقال من مشاريع التجربة إلى التطبيق الكامل. ما هي الحواجز المعمارية أو التشغيلية الرئيسية التي تمنع الذكاء الاصطناعي الصوتي من التوسع عبر المنظمات بأكملها؟

الذكاء الاصطناعي الصوتي لا يزال يتطور. بالتوقيت الذي تجري فيه شركة تجربة لتقنية الذكاء الاصطناعي، يأتي تقنية جديدة أفضل. منذ أن تتكامل أوديو كودز باستمرار مع أحدث حلول الذكاء الاصطناعي الصوتي، تسمح للشركات بمزج وتمازج وضمان بيئتها من التطورات المستقبلية. تتيح أوركسترا أوديو كودز لهم تجربة بوتات مختلفة لأغراض مختلفة، مع الأخذ في الاعتبار الأداء والتكلفة واللغة والامتثال.

مضافًا إلى ذلك، هناك اعتبارات أخرى تتعلق بالتوسيع والاستمرارية التجارية والاتصال ببيئات مركز الاتصال المتعددة حول العالم.

في التطبيقات الفعلية، ما هو شكل تجربة الاتصال القائمة على الذكاء الاصطناعي الناجحة من منظور المستخدم النهائي، وكيف قريبنا من تحقيق التفاعلات البشرية الشبيهة بالبشر على نطاق واسع؟

لدينا العديد من العملاء الكبار الذين بدأوا معنا حول عام 2020 و 2021. هم دليل على أن التفاعلات الشبيهة بالبشر على نطاق واسع تعمل جيدًا بالفعل. تشمل الحالات الواقعية المهام المواجهة للعملاء مثل توجيه المكالمات وترتيب المواعيد وعمليات النقل، بالإضافة إلى أدوات مواجهة الوكيل مثل تلخيص المكالمات القائمة على الذكاء الاصطناعي والتوجيه المعرفي في الوقت الفعلي وترجمة الصوت الحية.

من منظور المستخدم النهائي، تعتبر تجربة الاتصال القائمة على الذكاء الاصطناعي خالية من التعقيد. بدلاً من التنقل عبر شجرات القوائم الصلبة (اضغط 1 من أجل هذا، اضغط 2 من أجل ذلك)، يمكن للمكالمين التحدث ب自然ية باستخدام أنظمة الرد التفاعلي التي تفهم النية وتستجيب بشكل مناسب. هذا يخلق تفاعلًا أكثر直觉ًا وفعالية من النقطة الأولى.

على الرغم من أن الصناعة لم تصل بعد إلى التفاعلات المعقدة الشبيهة بالبشر على نطاق واسع، فإن هذه القدرات تجعل الشركات أقرب بشكل كبير. من خلال مزج الذكاء الاصطناعي والآلية مع الدعم البشري، يمكن للشركات تقديم تجارب أكثر دقة وأكثر شخصنة.

يعتمد الذكاء الاصطناعي الصوتي على تحليل الكلام وفهم اللغة الطبيعية والمعالجة في الوقت الفعلي. أين ترى أكبر حواجز اليوم، وكيف يتم تناولها؟

حاجز كبير في تبني الذكاء الاصطناعي الصوتي في الشركات يعود إلى التكامل. وفقًا لتقرير حديث من Opus Research، يذكر فقط 38% من الشركات أن التكلفة هي حاجز لتبني الذكاء الاصطناعي الصوتي. ومع ذلك، 65% يذكر أن التكامل داخل الأنظمة الحالية و 60% يذكر أن تعقيد التكامل.

موردي CCaaS يزيدون بشكل متزايد من الحواجز لنموذج “جلب بوتك الخاص” عن طريق حظر التكامل أو جعلها ماليًا غير مجدية. الأنظمة القديمة ببساطة لا تمتلك تكاملات API محدثة. حلول مثل Voice AI Connect من أوديو كودز تصل إلى بيئات مركز الاتصال الحالية عبر SIP القياسي وتكاملات API مع أكثر من 30 إطار عمل بوت الذكاء الاصطناعي الصوتي وأكثر من 20 محرك للنص إلى الكلام والكلام إلى النص، مما يلغي الحاجة إلى كتابة هذه الواجهات البرمجية بشكل يدوي.

يبرز التقرير نفسه جودة الأداء العامة (جودة الصوت، تدفق المحادثة، إلخ) كأهم سبب (72%) الذي يبطئ عملية التبني. ما يسمح به Voice AI Connect هو مزج إطارات البوت و STT و TTS لتحسين التنفيذات منذ أن لا يتناسب كل الذكاء الاصطناعي مع كل حالة استخدام، كما يلزم التباين للهجاء واللغات. علاوة على ذلك، تتطور صناعة الذكاء الاصطناعي بسرعة، مما يتطلب التبديل بسهولة إلى مزود الذكاء الاصطناعي الجديد مع تحسن التكنولوجيا.

يجب أن يكون التكامل منخفض التأخير وميسور التكلفة وسهل التنفيذ. كما يجب أن يعزز الأمان وتصحيح الأخطاء وضمان استمرارية الأعمال ويوفر خيارًا محليًا.

تروج أوديو كودز لمقاربة مرنة تربط معايير الذكاء الاصطناعي والكلام. ما مدى أهمية مرونة المورد عند بناء أنظمة الذكاء الاصطناعي الصوتي القوية والمستقبلية؟

مرونة المورد حرجة لأن الشركات نادرًا ما تعمل في بيئة مورد واحد، وهناك العديد من حلول الذكاء الاصطناعي والكلام والهاتف والاتصالات في السوق. لإنشاء استراتيجية موحدة للذكاء الاصطناعي الصوتي، تحتاج المنظمات إلى إحضار هذه الحلول المختلفة معًا وضمان التفاعل بين جميعها مع تحسين التكلفة والتأخير وأداء الحالات استخدام اللغة والدعم.

تسمح المقاربة المرنة للشركات بتكامل مع موردين متعددين، واختيار التكنولوجيا المناسبة لحالات استخدام مختلفة، والتكيف مع تطور السوق.

في الصناعات الخاضعة لللوائح مثل المالية أو الرعاية الصحية، كيف يختلف جمع وتحليل بيانات التفاعل الصوتي عن سير عمل الذكاء الاصطناعي القائم على السحابة؟

تخضع معالجة بيانات الصوت إلى متطلبات صارمة للخصوصية والامتثال التي تقيد بشكل كبير استخدام أدوات الذكاء الاصطناعي القائمة على السحابة. لتحقيق ذلك، تعتمد العديد من المنظمات الخاضعة للرقابة على التوزيعات المحلية لضمان بقاء البيانات الحساسة داخل البيئات الخاضعة للرقابة وألا تغادر البنية التحتية أبدًا.

تتطلب معايير الامتثال أيضًا أن يتم تسجيل تفاعلات الصوت وتخزينها في صيغ محددة لسنوات، مع نسخ دقيقة ومتطابقة للتحقق. على سبيل المثال، في المالية، يجب على شركة التداول تخزين كل مكالمة مسجلة ونسخة متطابقة كما تم التحدث بها للتحقق من الامتثال – لا يمكن تعديل البيانات أو تلخيصها. في مجال الرعاية الصحية، يجب على مقدم الرعاية تخزين التسجيلات والنسخ بشكل آمن ومتوافق مع HIPAA. على مدى اللوحة، غالبًا ما يتعين معالجة البيانات على الموقع لمنع كشف المعلومات المحمية إلى خدمات السحابة الخارجية.

مع بدء الشركات في نشر وكلاء الذكاء الاصطناعي الذين يمكنهم اتخاذ إجراءات بدلاً من مجرد الاستجابة، كيف يتغير دور واجهات الصوت في خدمة العملاء والعمليات الداخلية؟

تتطور واجهات الصوت من أدوات سلبية إلى أنظمة ذكية ومتفاعلة يمكنها تحليل العمل والتفاعل في الوقت الفعلي. بدلاً من تسجيل أو توجيه المحادثات فقط، يمكن لأنظمة الصوت القائمة على الذكاء الاصطناعي فهم النية واتخاذ إجراء فوري، مثل حل مشاكل العملاء أو تشغيل عمليات خلفية أو مساعدة موظف في حل مشكلة تقنية. هذا التحول قوي بشكل خاص لأن الصوت غالبًا ما يكون النقطة الأولى والأكثر طبيعية للاتصال.

يمكن لوكلاء الذكاء الاصطناعي الآن التفاعل بشكل استباقي مع مشرف بشري – على سبيل المثال، للموافقة على خصم للعميل. كما يمكنهم اتخاذ إجراءات مباشرة، مثل إضافة عناصر إلى عربة التسوق على الويب. كما يمكنهم التعاون مع بوتات أخرى ذات مهارات متخصصة، مثل تحليل الصور التي يشاركها العملاء لفهم السياق بشكل أفضل. كل هذه تمثل مستوى من التعقيد الذي لم يكن موجودًا من قبل.

في المستقبل، هل ترى الصوت يصبح واجهة رئيسية لأنظمة الذكاء الاصطناعي في الشركات، أو سوف يبقى جزءًا من تجربة متعددة الواجهات الأوسع؟

دعني أستخدم مثالًا شخصيًا لتوضيح وجهة نظري. لدي طفلان مراهقان. يفضلان عدم التفاعل مع ممثل خدمة العملاء البشري إذا كان ذلك ممكنًا. ومع ذلك، يفضلون التحدث مع بوت بدلاً من النص. الصوت هو وسيلة الاتصال الطبيعية للبشر منذ ملايين السنين. يفضل على لوحة المفاتيح أو الفأرة، على الأقل حتى تصبح قراءة الأفكار حقيقة.

شكرًا على المقابلة الرائعة، يرجى زيارة أوديو كودز لمعرفة المزيد.

أنطوان هو قائد رؤيوي وشريك مؤسس في Unite.AI، مدفوعًا برغبة لا تكل في تشكيل وتعزيز مستقبل الذكاء الاصطناعي والروبوتات. وهو رائد أعمال متسلسل، يعتقد أن الذكاء الاصطناعي سيكون مدمرًا للمجتمع مثل الكهرباء، وغالبًا ما يُقبض عليه وهو يثرثر عن إمكانات التكنولوجيات المدمرة والذكاء الاصطناعي العام.

كما أنه مستقبلي، فهو يلتزم بفحص كيف ستشكل هذه الابتكارات العالم. بالإضافة إلى ذلك، فهو مؤسس Securities.io، وهي منصة تركز على الاستثمار في التكنولوجيات المتقدمة التي تعيد تعريف المستقبل وتهيئ القطاعات بأكملها.