الذكاء الاصطناعي 101
ما هو التأهيل الزائد؟

ما هو التأهيل الزائد؟
عندما تقوم بتدريب شبكة عصبونية، يجب أن تتجنب التأهيل الزائد. التأهيل الزائد هو مشكلة داخل تعلم الآلة والإحصاء حيث يتعلم النموذج أنماط مجموعة البيانات التدريبية جيدًا جدًا، ويفسر مجموعة البيانات التدريبية بشكل مثالي، ولكن يفشل في تعميم قوته التنبؤية إلى مجموعات بيانات أخرى.
لنضع ذلك بطريقة أخرى، في حالة نموذج التأهيل الزائد، غالبًا ما يظهر دقة عالية جدًا على مجموعة البيانات التدريبية ولكن دقة منخفضة على البيانات التي تم جمعها وتشغيلها من خلال النموذج في المستقبل. هذا هو تعريف سريع للتأهيل الزائد، ولكن دعونا نناقش مفهوم التأهيل الزائد بالتفصيل. دعونا نلقي نظرة على كيفية حدوث التأهيل الزائد وكيف يمكن تجنبه.
فهم “التأهيل” والتأهيل غير الكافي
من المفيد النظر إلى مفهوم التأهيل غير الكافي و “التأهيل” بشكل عام عند مناقشة التأهيل الزائد. عندما نقوم بتدريب نموذج، نحاول تطوير إطار قادرة على التنبؤ بطبيعة أو فئة العناصر في مجموعة البيانات، بناءً على الميزات التي تصف هذه العناصر. يجب أن يكون النموذج قادرًا على تفسير نمطًا في مجموعة البيانات وتنبؤ بفئات نقاط البيانات المستقبلية بناءً على هذا النمط. كلما كان النموذج أفضل في تفسير العلاقة بين ميزات مجموعة التدريب، زادت “`التأهيل”‘ لدينا.

الخط الأزرق يمثل التنبؤات التي يقدمها نموذج يتعرض للتأهيل غير الكافي، بينما يمثل الخط الأخضر نموذجًا أفضل. الصورة: Pep Roca via Wikimedia Commons, CC BY SA 3.0, (https://commons.wikimedia.org/wiki/File:Reg_ls_curvil%C3%ADnia.svg)
نموذج يفسر بشكل سيئ العلاقة بين ميزات البيانات التدريبية ويفشل في تصنيف أمثلة البيانات المستقبلية بدقة هو تأهيل غير كافٍ لبيانات التدريب. إذا كنت ترسم العلاقة التنبؤية لنموذج غير كافٍ مقابل تقاطع الفعلي للميزات والملabelات، فإن التنبؤات سوف تختلف عن العلامة. إذا كان لدينا مخططًا مع القيم الفعلية لمجموعة تدريبية ملabeled، فإن نموذجًا غير كافٍ سيخطئ بشكل كبير معظم نقاط البيانات. قد يمر نموذج ذو تأهيل أفضل عبر وسط نقاط البيانات، مع اختلاف نقاط البيانات الفردية قليلاً عن القيم التنبؤية.
يمكن أن يحدث التأهيل غير الكافي عندما لا يكون هناك بيانات كافية لإنشاء نموذج دقيق، أو عند محاولة تصميم نموذج خطي مع بيانات غير خطية. غالبًا ما سوف يقلل المزيد من بيانات التدريب أو المزيد من الميزات من التأهيل غير الكافي.
لذلك، لماذا لا ننشئ نموذجًا يفسر كل نقطة في مجموعة التدريب بدقة؟ بالتأكيد، الدقة المثالية مرغوبة؟ إن إنشاء نموذج تعلم أنماط مجموعة البيانات التدريبية جيدًا جدًا هو ما يسبب التأهيل الزائد. مجموعة بيانات التدريب ومجموعات البيانات الأخرى التي تقوم بتشغيلها من خلال النموذج لن تكون متطابقة تمامًا. من المحتمل أن تكون متشابهة في العديد من الجوانب، ولكنها ستختلف أيضًا في جوانب رئيسية. لذلك، تصميم نموذج يفسر مجموعة بيانات التدريب بدقة يعني أنك سوف تنتهي بنظرية حول العلاقة بين الميزات التي لا ت일반 جيدًا إلى مجموعات بيانات أخرى.
فهم التأهيل الزائد
يحدث التأهيل الزائد عندما يتعلم النموذج التفاصيل داخل مجموعة البيانات التدريبية جيدًا جدًا، مما يسبب للنموذج معاناة عند إجراء تنبؤات على بيانات خارجية. قد يحدث هذا عندما يتعلم النموذج ليس فقط ميزات مجموعة البيانات، ولكن أيضًا التقلبات العشوائية أو الضوضاء داخل مجموعة البيانات، ويوضع التركيز على هذه الحوادث العشوائية أو غير المهمة.
يصبح التأهيل الزائد أكثر احتمالاً عند استخدام نماذج غير خطية، لأنها أكثر مرونة عند تعلم ميزات البيانات. غالبًا ما يكون للخوارزميات غير المعلمة في تعلم الآلة العديد من المعلمات والتقنيات التي يمكن تطبيقها لتقيد حساسية النموذج للبيانات وبالتالي تقليل التأهيل الزائد. على سبيل المثال، نماذج شجرة القرار حساسة جدًا للتأهيل الزائد، ولكن يمكن استخدام تقنية称ى بالتقليم لتحديد عشوائي لبعض التفاصيل التي تعلمها النموذج.
إذا كنت ترسم تنبؤات النموذج على المحورين X و Y، سوف يكون لديك خط تنبؤ يتنقل ذهابًا وعودة، مما يعكس حقيقة أن النموذج حاول بجدية أن يلائم جميع النقاط في مجموعة البيانات في تفسيره.
ضبط التأهيل الزائد
عندما نقوم بتدريب نموذج، نريد أن يكون أداء النموذج خاليًا من الأخطاء. عندما يتجه أداء النموذج نحو إجراء تنبؤات صحيحة على جميع نقاط البيانات في مجموعة التدريب، يصبح التأهيل أفضل. نموذج ذو تأهيل جيد يمكنه تفسير几乎 جميع مجموعة التدريب بدون تأهيل زائد.
عندما يتدرب النموذج، يتحسن أداؤه مع مرور الوقت. معدل الخطأ للنموذج يقل مع مرور وقت التدريب، ولكن يقل فقط إلى حد معين. النقطة التي يبدأ فيها أداء النموذج على مجموعة الاختبار في الارتفاع مرة أخرى هي النقطة التي يحدث فيها التأهيل الزائد عادةً. من أجل الحصول على أفضل تأهيل لنموذج، نريد إيقاف تدريب النموذج عند نقطة الخسارة الأقل على مجموعة التدريب، قبل أن يبدأ الخطأ في الزيادة مرة أخرى. يمكن تحديد نقطة الإيقاف المثالية من خلال رسم أداء النموذج خلال وقت التدريب وإيقاف التدريب عندما تكون الخسارة هي الأقل. ومع ذلك، هناك مخاطر مع هذه الطريقة لضبط التأهيل الزائد، وهي أن تحديد نقطة النهاية للتدريب بناءً على أداء الاختبار يعني أن بيانات الاختبار تصبح جزءًا من إجراء التدريب، ويفقد وضعها كبيانات “غير ملموسة” تمامًا.
هناك عدة طرق لمكافحة التأهيل الزائد. أحد طرق تقليل التأهيل الزائد هو استخدام استراتيجية إعادة العينة، والتي تعمل عن طريق تقدير دقة النموذج. يمكنك أيضًا استخدام مجموعة التحقق بالإضافة إلى مجموعة الاختبار وترسم دقة التدريب مقابل مجموعة التحقق بدلاً من مجموعة الاختبار. هذا يحافظ على مجموعة الاختبار غير مرئية. طريقة إعادة العينة الشهيرة هي التحقق العشاري المتقاطع. هذه التقنية تمكنك من تقسيم بياناتك إلى مجموعات فرعية يتم تدريب النموذج عليها، ثم يتم تحليل أداء النموذج على المجموعات الفرعية لتقدير كيف سيعمل النموذج على بيانات خارجية.
استخدام التحقق العشاري المتقاطع هو واحد من أفضل الطرق لتقدير دقة نموذج على بيانات غير مرئية، وعندما يتم الجمع بينه وبين مجموعة التحقق، يمكن أن يتم الحفاظ على التأهيل الزائد إلى الحد الأدنى.












