Connect with us

كاشف الكذب القائم على الذكاء الاصطناعي للمكالمات في مراكز الاتصال

الذكاء الاصطناعي

كاشف الكذب القائم على الذكاء الاصطناعي للمكالمات في مراكز الاتصال

mm

قام باحثون في ألمانيا باستخدام التعلم الآلي لإنشاء نظام تحليل الصوت يهدف في المقام الأول إلى العمل ككاشف كذب قائم على الذكاء الاصطناعي للعملاء في الاتصالات الصوتية مع موظفي مركز الاتصال والدعم.

نظام النظام يستخدم مجموعة بيانات مخصصة من تسجيلات صوتية من قبل 40 طالبًا ومعلمًا خلال مناقشات حول مواضيع خلافية، بما في ذلك مشروعية عقوبة الإعدام والرسوم الدراسية. تم تدريب النموذج على هيكل يستخدم شبكات 神经ية التجميعية (CNNs) وذاكرة قصيرة الأمد (LSTM)، وحقق معدل دقة مدعومًا بنسبة 98٪.

على الرغم من أن النية المعلنة للعمل تشير إلى اتصالات العملاء، فإن الباحثين يعترفون بأنها تعمل بشكل فعال ككاشف كذب عام الغرض:

‘النتائج قابلة للتطبيق على مجموعة واسعة من عمليات الخدمة ومفيدة بشكل خاص لجميع التفاعلات مع العملاء التي تتم عبر الهاتف. يمكن تطبيق الخوارزمية المقدمة في أي حالة يكون فيها من المفيد لموظف الخدمة أن يعرف ما إذا كان العميل يتحدث بصدق.

‘هذا يمكن، على سبيل المثال، أن يؤدي إلى تقليل المطالبات التأمينية المشكوك فيها، أو البيانات الكاذبة في المقابلات الوظيفية. هذا لن يقلل فقط من الخسائر التشغيلية لشركات الخدمة، ولكن أيضًا يشجع العملاء على أن يكونوا أكثر صدقًا.’

توليد مجموعة البيانات

في غياب مجموعة بيانات عامة مناسبة باللغة الألمانية، قام الباحثون – من جامعة Neu-Ulm التطبيقية (HNU) – بإنشاء مادة مصدرهم الخاصة. تم نشر المنشورات في الجامعة والمدارس المحلية، وتم اختيار 40 متطوعًا مع الحد الأدنى لسن 16 عامًا. تم دفع للمتطوعين بونوس بقيمة 10 يورو من قسائم أمازون.

تم إجراء الجلسات على نموذج نادي المناقشة المصمم لتحريض الرأي وإثارة ردود فعل قوية حول مواضيع مثيرة للجدل، مما يؤدي بشكل فعال إلى نمذجة التوتر الذي يمكن أن يحدث في محادثات العملاء المشكلة على الهاتف.

المواضيع التي كان على المتطوعين التحدث بحرية لمدة ثلاث دقائق في الجمهور كانت:

– هل يجب إعادة إدخال عقوبة الإعدام والتنفيذ العام في ألمانيا؟
– هل يجب فرض رسوم دراسية تغطي التكاليف في ألمانيا؟
– هل يجب قانوننة استخدام المخدرات القاسية مثل الهيروين والميثامفيتامين في ألمانيا؟
– هل يجب حظر سلاسل المطاعم التي تقدم الطعام السريع غير الصحي، مثل ماكدونالدز أو برجر كينج، في ألمانيا؟

المعالجة المسبقة

فضلت المشروع تحليل ميزات الكلام الصوتية في نهج التعرف على الكلام الآلي (ASR) أكثر من نهج NLP (حيث يتم تحليل الكلام على مستوى لغوي، ويتحسس “درجة حرارة” الخطاب مباشرة من استخدام اللغة).

تم تحليل العينات المُستخرجة المُعالجة مسبقًا في البداية من خلال معاملات السبستروفية الميل-تردد (MFCCs)، وهي طريقة قديمة وموثوقة لا تزال شائعة جدًا في تحليل الكلام. منذ أن تم اقتراح الطريقة لأول مرة في عام 1980، فهي ملحوظة في الاقتصاد مع الموارد الحاسوبية من حيث التعرف على الأنماط المتكررة في الكلام، ومقاومة لمستويات مختلفة من جودة التقاط الصوت. نظرًا لأن الجلسات تمت عبر منصات VOIP في ظروف الإغلاق في ديسمبر 2020، كان من المهم وجود إطار تسجيل يمكن أن يعتمد على جودة الصوت الرديئة عند الضرورة.

من المثير للاهتمام أن نلاحظ أن القيدين الفنيين المذكورين أعلاه (الموارد المحدودة للCPU في الثمانينيات ومزايا VOIP في سياق الشبكة المزدحمة) يجمعان هنا لإنشاء ما يعادل “نموذجًا تقنيًا نحيلا” يبدو أنه قوي بشكل غير عادي في غياب ظروف العمل المثالية والموارد عالية المستوى – مما يقلد الساحة المستهدفة للخوارزمية الناتجة.

بعد ذلك، تم تطبيق خوارزمية تحويل فورييه السريع (FFT) على مقاطع الصوت لتوفير ملف تعريف طيفي لكل “إطار صوتي”، قبل الخريطة النهائية إلى مقياس ميل.

التدريب والنتائج والقيود

خلال التدريب، يتم تمرير متجهات الميزات المستخرجة إلى طبقة شبكة توزيعية متعددة، ثم يتم تسطيحها وتمريرها إلى طبقة LSTM.

هيكل عملية التدريب لكاشف الحقيقة الذكي. مصدر: https://arxiv.org/ftp/arxiv/papers/2107/2107.11175.pdf

هيكل عملية التدريب لكاشف الحقيقة الذكي. مصدر: https://arxiv.org/ftp/arxiv/papers/2107/2107.11175.pdf

أخيرًا، يتم توصيل جميع العصبونات ببعضها البعض من أجل توليد تنبؤ ثنائي حول ما إذا كان المتحدث يقول أشياء يعتقد أنها صحيحة.

في الاختبارات بعد التدريب، حقق النظام مستوى دقة يصل إلى 98.91٪ من حيث تمييز النية (حيث قد لا تعكس المحتوى المُتحدث عنه النية). يعتبر الباحثون أن العمل يثبت تجريبيًا تحديد الإقناع على أساس أنماط الصوت، ويمكن أن يتم ذلك بدون تحليل اللغة على غرار NLP.

فيما يتعلق بالقيود، يعترف الباحثون بأن عينة الاختبار صغيرة. على الرغم من أن الورقة لا تشير صراحة إلى ذلك، يمكن أن يقلل حجم البيانات الاختبارية من التطبيق لاحقًا في حالة أن افتراضات الميزات المعمارية وعمليات التدريب العامة يتم تخصيصها بشكل مفرط للبيانات. تشير الورقة إلى أن ستة من ثمانية نماذج تم بناؤها خلال المشروع تم تخصيصها في某جة في عملية التعلم، وهناك المزيد من العمل الذي يجب القيام به في تعميم قابلية تطبيق المعاملات المحددة للنموذج.

علاوة على ذلك، يجب أن تأخذ أبحاث من هذا القبيل في الاعتبار الخصائص الوطنية، وتشير الورقة إلى أن المواضيع الألمانية المشاركة في توليد البيانات قد يكون لها أنماط اتصال لا يمكن تكرارها مباشرة عبر الثقافات – حالة من شأنها أن تنشأ في أي دراسة من هذا القبيل في أي دولة.

كاتب في تعلم الآلة، متخصص في مجال 합성 الصور البشرية. السابق رئيس محتوى البحث في Metaphysic.ai.
الsite الشخصي: martinanderson.ai
التواصل: [email protected]
تويتر: @manders_ai