رطم جهاز كشف الكذب القائم على الذكاء الاصطناعي لمحادثات مركز الاتصال - Unite.AI
اتصل بنا للحصول على مزيد من المعلومات

الذكاء الاصطناعي

كاشف الكذب القائم على الذكاء الاصطناعي لمحادثات مركز الاتصال

mm
تحديث on

استخدم الباحثون في ألمانيا التعلم الآلي لإنشاء نظام تحليل صوتي يهدف في المقام الأول إلى العمل كجهاز كشف الكذب القائم على الذكاء الاصطناعي للعملاء في الاتصالات الصوتية مع مركز الاتصال وموظفي الدعم.

نظام يستخدم مجموعة بيانات تم إنشاؤها خصيصًا من التسجيلات الصوتية بواسطة 40 طالبًا ومعلمًا أثناء المناقشات حول مواضيع مثيرة للجدل، بما في ذلك أخلاقيات عقوبة الإعدام والرسوم الدراسية. تم تدريب النموذج على بنية تستخدم الشبكات العصبية التلافيفية (CNN) والذاكرة الطويلة قصيرة المدى (LSTM)، وحقق معدل دقة مُبلغ عنه يبلغ 98%.

على الرغم من أن الغرض المعلن من العمل يستشهد باتصالات العملاء ، إلا أن الباحثين يقرون بأنه يعمل بشكل فعال كجهاز كشف كذب للأغراض العامة:

النتائج قابلة للتطبيق على مجموعة واسعة من عمليات الخدمة ومفيدة بشكل خاص لجميع تفاعلات العملاء التي تحدث عبر الهاتف. يمكن تطبيق الخوارزمية المقدمة في أي موقف حيث يكون من المفيد للوكيل معرفة ما إذا كان العميل يتحدث إلى قناعته.

قد يؤدي هذا ، على سبيل المثال ، إلى انخفاض مطالبات التأمين المشكوك في تحصيلها ، أو بيانات غير صادقة في مقابلات العمل. لن يؤدي ذلك إلى تقليل الخسائر التشغيلية لشركات الخدمات فحسب ، بل سيشجع العملاء أيضًا على أن يكونوا أكثر صدقًا.

إنشاء مجموعة البيانات

في حالة عدم وجود مجموعة بيانات مناسبة ومتاحة للجمهور باللغة الألمانية ، قام الباحثون - من جامعة Neu-Ulm للعلوم التطبيقية (HNU) - بإنشاء مواد المصدر الخاصة بهم. تم نشر منشورات في الجامعة والمدارس المحلية ، مع اختيار 40 متطوعًا بحد أدنى 16 عامًا.

تم إجراء الجلسات على نموذج نادي المناظرات المصمم لاستقطاب الرأي وإثارة ردود قوية حول الموضوعات الحارقة ، ونمذجة بشكل فعال للتوتر الذي يمكن أن يحدث في محادثات العملاء التي تنطوي على مشاكل على الهاتف.

المواضيع التي كان على المتطوعين التحدث عنها بحرية لمدة ثلاث دقائق في الأماكن العامة هي:

- هل يجب إعادة العمل بعقوبة الإعدام والإعدامات العلنية في ألمانيا؟
- هل يجب فرض الرسوم الدراسية التي تغطي التكاليف في ألمانيا؟
- هل يجب تقنين استخدام العقاقير القوية مثل الهيروين والكريستال ميث في ألمانيا؟
- هل يجب حظر سلاسل المطاعم التي تقدم وجبات سريعة غير صحية ، مثل ماكدونالدز أو برجر كنج ، في ألمانيا؟

ما قبل المعالجة

فضل المشروع تحليل ميزات الكلام الصوتي في نهج التعرف التلقائي على الكلام (ASR) على نهج البرمجة اللغوية العصبية (حيث يتم تحليل الكلام على المستوى اللغوي ، ويتم استنتاج "درجة حرارة" الخطاب مباشرة من استخدام اللغة).

تم تحليل العينات المستخرجة المجهزة مسبقًا في البداية عبر معاملات Cepstral ذات التردد الميل (MFCCs)، وهي طريقة موثوقة وقديمة لا تزال تحظى بشعبية كبيرة في تحليل الكلام. منذ أن تم اقتراح هذه الطريقة لأول مرة في عام 1980، فهي مقتصدة بشكل ملحوظ في موارد الحوسبة من حيث التعرف على الأنماط المتكررة في الكلام، كما أنها مرنة لمستويات مختلفة من جودة التقاط الصوت. نظرًا لأن الجلسات تم إجراؤها عبر منصات VOIP في ظروف الإغلاق في ديسمبر 2020، كان من المهم أن يكون لديك إطار تسجيل يمكن أن يأخذ في الاعتبار ضعف جودة الصوت عند الضرورة.

من المثير للاهتمام أن نلاحظ أن التقيدين التقنيين المذكورين أعلاه (موارد وحدة المعالجة المركزية المحدودة في أوائل الثمانينيات والغرابة في اتصال VOIP في سياق شبكة مزدحم) يتحدان هنا لإنشاء نموذج `` متناثر تقنيًا '' (على ما يبدو) قويًا بشكل غير عادي في حالة عدم وجود ظروف عمل مثالية وموارد عالية المستوى - محاكاة الساحة المستهدفة للخوارزمية الناتجة.

بعد ذلك تحويل فورييه سريع (الاتحاد الفرنسي للتنس) تم تطبيق خوارزمية على المقاطع الصوتية لتوفير ملف تعريف طيفي لكل "إطار سمعي" ، قبل التقابل النهائي لمقياس Mel.

التدريب والنتائج والقيود

أثناء التدريب ، يتم تمرير متجهات الميزات المستخرجة إلى طبقة شبكة تلافيفية موزعة زمنيًا ، ويتم تسويتها ثم تمريرها إلى طبقة LSTM.

بنية العملية التدريبية لكاشف الحقيقة بالذكاء الاصطناعي. المصدر: https://arxiv.org/ftp/arxiv/papers/2107/2107.11175.pdf

بنية العملية التدريبية لكاشف الحقيقة بالذكاء الاصطناعي. المصدر: https://arxiv.org/ftp/arxiv/papers/2107/2107.11175.pdf

أخيرًا ، ترتبط جميع الخلايا العصبية ببعضها البعض من أجل توليد تنبؤ ثنائي لما إذا كان المتحدث يقول أشياء يعتقد أنها صحيحة أم لا.

في الاختبارات بعد التدريب ، حقق النظام مستوى دقة يصل إلى 98.91٪ من حيث تمييز النية (حيث قد لا يعكس المحتوى المنطوق القصد). يعتبر الباحثون أن العمل يوضح بشكل تجريبي تحديد الإدانة بناءً على أنماط الصوت ، ويمكن تحقيق ذلك دون تفكيك اللغة بأسلوب البرمجة اللغوية العصبية.

من حيث القيود ، يقر الباحثون بأن عينة الاختبار صغيرة. على الرغم من أن الورقة لا تذكرها صراحةً ، إلا أن بيانات الاختبار ذات الحجم المنخفض يمكن أن تقلل من قابلية التطبيق لاحقًا في حالة أن الافتراضات والميزات المهندسة وعملية التدريب العامة تتلاءم بشكل مفرط مع البيانات. تشير الورقة البحثية إلى أن ستة من النماذج الثمانية التي تم إنشاؤها في جميع أنحاء المشروع كانت أكثر من اللازم في مرحلة ما من عملية التعلم ، وأن هناك المزيد من العمل الذي يتعين القيام به في تعميم قابلية تطبيق المعايير المحددة للنموذج.

علاوة على ذلك ، يجب أن يأخذ البحث من هذا النوع في الاعتبار الخصائص الوطنية ، وتشير الورقة البحثية إلى أن الأشخاص الألمان المشاركين في توليد البيانات قد يكون لديهم أنماط اتصالات لا يمكن تكرارها بشكل مباشر عبر الثقافات - وهو موقف من المحتمل أن ينشأ في أي دراسة من هذا القبيل في أي أمة.