اتصل بنا للحصول على مزيد من المعلومات

النضال لمنع الذكاء الاصطناعي من الغش في الاختبارات

الذكاء الاصطناعي

النضال لمنع الذكاء الاصطناعي من الغش في الاختبارات

mm

تقدم نتائج بحثية جديدة من جامعة صينية نظرة ثاقبة حول سبب ميل نماذج معالجة اللغة الطبيعية التوليدية مثل GPT-3 إلى "الغش" عند طرح سؤال صعب، مما ينتج عنه إجابات قد تكون صحيحة من الناحية الفنية، ولكن بدون أي فهم حقيقي للخوارزميات. لماذا الإجابة صحيحة؛ ولماذا يُظهرون قدرة ضئيلة أو معدومة على تفسير المنطق الكامن وراء إجاباتهم "السهلة". يقترح الباحثون أيضًا أساليب جديدة لجعل الأنظمة "أكثر قدرة على الدراسة" خلال مرحلة التدريب.

المشكلة ذات شقين: أولاً ، نصمم أنظمة تحاول تحقيق النتائج بسرعة وباستخدام أمثل للموارد. حتى عندما تكون الموارد ، كما هو الحال مع GPT-3 ، أكبر بكثير من متوسط ​​قدرة مشروع بحث البرمجة اللغوية العصبية (NLP) على حشدها ، فإن ثقافة التحسين المدفوع بالنتائج هذه لا تزال تسود المنهجية ، لأنها أصبحت تهيمن على الاتفاقية الأكاديمية.

وبالتالي ، فإن تصميمات التدريب لدينا تكافئ النماذج التي تتقارب بسرعة وتنتج ردودًا مناسبة على ما يبدو للأسئلة ، حتى لو كان نموذج البرمجة اللغوية العصبية لاحقًا غير قادر على تبرير استجابته ، أو إظهار كيفية توصله إلى استنتاجاته.

استعداد مبكر للغش

يحدث هذا لأن النموذج يتعلم "الاستجابات المختصرة" في وقت أبكر بكثير من تعلمه لأنواع أكثر تعقيدًا من اكتساب المعرفة. ولأن زيادة الدقة غالبًا ما تُكافأ عشوائيًا طوال فترة التدريب، فإن النموذج يُعطي الأولوية لأي نهج يُمكّنه من الإجابة على سؤال "بسهولة" ودون فهم حقيقي.

نظرًا لأن التعلم باختصار سيمثل حتمًا ملف أول النجاحات أثناء التدريب ، ستميل الجلسة بطبيعة الحال إلى الابتعاد عن المهمة الأكثر صعوبة المتمثلة في اكتساب منظور معرفي مفيد وأكثر اكتمالاً ، والذي قد يحتوي على طبقات أعمق وأكثر ثاقبة للإسناد والمنطق.

تغذية الذكاء الاصطناعي بالإجابات "السهلة"

المشكلة الثانية هي أنه على الرغم من المبادرات البحثية الأخيرة مدروس ولكن في حين أن الذكاء الاصطناعي يميل إلى "الغش" بهذه الطريقة، وقد حددنا ظاهرة "الاختصارات"، لم تكن هناك حتى الآن أي جهود لتصنيف المواد التي تمكن "الاختصارات" في مجموعة بيانات مساهمة، والتي ستكون الخطوة الأولى المنطقية في معالجة ما قد يثبت أنه خلل معماري أساسي في أنظمة فهم القراءة الآلية (MRC).

الجديد ورقة، وهو تعاون بين معهد Wangxuan لتكنولوجيا الكمبيوتر ومختبر MOE الرئيسي للغويات الحاسوبية في جامعة بكين ، يختبر نماذج لغوية مختلفة مقابل مجموعة البيانات المشروحة حديثًا والتي تتضمن تصنيفات للحلول "السهلة" و"الصعبة" لسؤال محتمل.

المصدر: https://arxiv.org/pdf/2106.01024.pdf

المصدر: https://arxiv.org/pdf/2106.01024.pdf

تستخدم مجموعة البيانات إعادة الصياغة كمعيار للإجابات الأكثر تعقيدًا وعمقًا، إذ يتطلب الأمر فهمًا دلاليًا لإعادة صياغة المعرفة المُكتسبة. في المقابل، يمكن للإجابات المختصرة استخدام رموز مثل التواريخ وكلمات مفتاحية أخرى مُغلِّفة، لإنتاج إجابة دقيقة من الناحية الواقعية، ولكن دون أي سياق أو منطق.

يتميز مكون الاختصار في التعليقات التوضيحية بمطابقة كلمات السؤال (QWM) والمطابقة البسيطة (SpM). بالنسبة إلى QWM ، يستخدم النموذج الكيانات المستخرجة من البيانات النصية المزودة وسياق عمليات التخلص ؛ بالنسبة لـ SpM ، يحدد النموذج التداخل بين جمل الإجابة والأسئلة ، وكلاهما متوفر في بيانات التدريب.

بيانات الاختصارات أصبحت "فيروسية" تقريبًا من حيث التأثير في مجموعة البيانات

يؤكد الباحثون أن مجموعات البيانات تميل إلى احتواء نسبة عالية من الأسئلة المختصرة ، مما يجعل النماذج المدربة تعتمد على حيل مختصرة.

النموذجان المستخدمان في التجارب هما بيداف وجوجل بيرتلاحظ الباحثون أنه حتى عند تدريبهم على اختلافات مجموعات البيانات ذات نسبة أعلى من الأسئلة "الصعبة"، لا يزال كلا النموذجين يحققان أداءً أفضل في الأسئلة المختصرة مقارنةً بالأسئلة الأكثر صعوبة، على الرغم من قلة الأمثلة في مجموعات البيانات.

يقدم هذا "بيانات مختصرة" تقريبًا في سياق الفيروس - حيث يلزم وجود القليل جدًا منها في مجموعة البيانات حتى يتم اعتمادها وإعطائها الأولوية في التدريب، وفقًا للمعايير والممارسات التقليدية في معالجة اللغة الطبيعية.

إثبات الغش

إحدى الطرق التي يستخدمها البحث لإثبات هشاشة الإجابة المختصرة هي استبدال كلمة "سهلة" بكلمة شاذة. عند استخدام طريقة مختصرة، لا يمكن تقديم منطق الإجابة "المغشوشة"؛ ولكن عندما تُقدم الإجابة من سياق أعمق وتقييم دلالي لمجموعة أوسع من النصوص المساهمة، يُمكن للنظام تحليل الخطأ وإعادة بناء إجابة صحيحة.

استبدال "بيونسيه" (شخص) بـ "أمريكا" (موقع) ، يكشف ما إذا كان للنموذج أي منطق خلفية لإجابته.

إن استبدال "بيونسيه" (شخص) بـ "أمريكا" (موقع) يكشف ما إذا كان النموذج لديه أي منطق خلفي لإجابته.

اختصارات لضرورة اقتصادية

فيما يتعلق ببعض الأسباب المعمارية التي تجعل الاختصارات تحظى بالأولوية في سير عمل التدريب على البرمجة اللغوية العصبية ، يعلق المؤلفون "قد تتعلم نماذج MRC الحيل المختصرة، مثل QWM، باستخدام موارد حسابية أقل من تحديات الفهم، مثل تحديد إعادة الصياغة".

هذا ، إذن ، يمكن أن يكون نتيجة غير مقصودة للتحسين القياسي وفلسفات الحفاظ على الموارد في مناهج فهم قراءة الآلة ، والضغط للحصول على نتائج بموارد محدودة في أطر زمنية ضيقة.

لاحظ الباحثون أيضًا:

'[نظرًا] لإمكانية استخدام الخدعة المختصرة للإجابة على معظم أسئلة التدريب بشكل صحيح، فإن الأسئلة المحدودة غير المحلولة المتبقية قد لا تحفز النماذج على استكشاف حلول معقدة تتطلب مهارات صعبة.'

إذا تم تأكيد نتائج البحث لاحقًا، فسيبدو أن مجال معالجة البيانات المسبقة الواسع والمتنامي باستمرار قد يحتاج إلى النظر في "المخازن المخفية" في البيانات كمشكلة يجب معالجتها على المدى الطويل، أو مراجعة هياكل معالجة اللغة الطبيعية لإعطاء الأولوية للروتينات الأكثر تحديًا لاستيعاب البيانات.

 

كاتب في مجال التعلم الآلي، متخصص في مجال تركيب الصور البشرية. رئيس سابق لمحتوى الأبحاث في Metaphysic.ai.
الموقع الشخصي: martinanderson.ai
اتصال: [البريد الإلكتروني محمي]
تويتر:manders_ai