رطم ما هو التعلم الجماعي؟ - اتحدوا
اتصل بنا للحصول على مزيد من المعلومات
دروس متقدمة في الذكاء الاصطناعي:

منظمة العفو الدولية 101

ما هو التعلم الجماعي؟

mm
تحديث on

أحد أقوى تقنيات التعلم الآلي هو التعلم الجماعي. طاقم تعلم هو استخدام نماذج متعددة للتعلم الآلي لتحسين موثوقية ودقة التنبؤات. ومع ذلك ، كيف يؤدي استخدام نماذج التعلم الآلي المتعددة إلى تنبؤات أكثر دقة؟ ما نوع التقنيات المستخدمة لإنشاء نماذج التعلم الجماعي؟ سنستكشف إجابة هذه الأسئلة ، ونلقي نظرة على الأساس المنطقي وراء استخدام نماذج المجموعات والطرق الأساسية لإنشاء نماذج المجموعات.

ما هو التعلم الجماعي؟

ببساطة ، التعلم الجماعي هو عملية تدريب نماذج متعددة للتعلم الآلي والجمع بين مخرجاتها معًا. تُستخدم النماذج المختلفة كقاعدة لإنشاء نموذج تنبؤي أمثل. يمكن أن يؤدي الجمع بين مجموعة متنوعة من نماذج التعلم الآلي الفردية إلى تحسين استقرار النموذج العام ، مما يؤدي إلى تنبؤات أكثر دقة. غالبًا ما تكون نماذج التعلم الجماعي أكثر موثوقية من النماذج الفردية ، ونتيجة لذلك ، فإنها غالبًا ما تحتل المرتبة الأولى في العديد من مسابقات التعلم الآلي.

هناك تقنيات مختلفة يمكن للمهندس استخدامها لإنشاء نموذج تعليمي للمجموعة. تتضمن تقنيات تعلم المجموعات البسيطة أشياء مثل حساب متوسط ​​مخرجات النماذج المختلفة ، بينما توجد أيضًا طرق وخوارزميات أكثر تعقيدًا تم تطويرها خصيصًا للجمع بين تنبؤات العديد من المتعلمين / النماذج الأساسية معًا.

لماذا تستخدم طرق تدريب الفرق؟

يمكن أن تختلف نماذج التعلم الآلي عن بعضها لعدة أسباب. قد تعمل نماذج مختلفة للتعلم الآلي على عينات مختلفة من بيانات السكان ، ويمكن استخدام تقنيات نمذجة مختلفة ، ويمكن استخدام فرضية مختلفة.

تخيل أنك تلعب لعبة أسئلة مع مجموعة كبيرة من الناس. إذا كنت في فريق بمفردك ، فلا بد أن تكون هناك بعض الموضوعات التي لديك معرفة بها والعديد من الموضوعات التي ليس لديك معرفة بها. افترض الآن أنك تلعب في فريق مع أشخاص آخرين. مثلك تمامًا ، سيكون لديهم بعض المعرفة فيما يتعلق بتخصصاتهم الخاصة وليس لديهم معرفة بالموضوعات الأخرى. ومع ذلك ، عندما يتم الجمع بين معرفتك ، يكون لديك تخمينات أكثر دقة لمزيد من الحقول ، وعدد الموضوعات يفتقر فريقك إلى المعرفة بالتقلص. هذا هو نفس المبدأ الذي يقوم عليه التعلم الجماعي ، ويجمع بين تنبؤات أعضاء الفريق المختلفين (النماذج الفردية) لتحسين الدقة وتقليل الأخطاء.

لقد أثبت الإحصائيون أنه عندما يُطلب من حشد من الناس تخمين الإجابة الصحيحة لسؤال معين مع مجموعة من الإجابات المحتملة ، فإن جميع إجاباتهم تشكل توزيعًا احتماليًا. سيختار الأشخاص الذين يعرفون الإجابة الصحيحة حقًا الإجابة الصحيحة بثقة ، بينما يقوم الأشخاص الذين يختارون الإجابات الخاطئة بتوزيع تخميناتهم عبر مجموعة من الإجابات غير الصحيحة المحتملة. بالعودة إلى مثال لعبة الأسئلة ، إذا كنت تعرف أنت وأصدقاؤك أن الإجابة الصحيحة هي A ، فإن الثلاثة منكم جميعًا سيصوتون A ، بينما من المحتمل أن يكون الأشخاص الثلاثة الآخرون في فريقك الذين لا يعرفون الإجابة غير صحيحين تخمين B أو C أو D أو E. والنتيجة هي أن A لديها ثلاثة أصوات وأن الإجابات الأخرى من المرجح أن يكون لها صوت واحد أو صوتان فقط كحد أقصى.

جميع النماذج لديها قدر من الخطأ. ستختلف أخطاء أحد النماذج عن الأخطاء التي ينتجها نموذج آخر ، حيث تختلف النماذج نفسها للأسباب الموضحة أعلاه. عندما يتم فحص جميع الأخطاء ، لن يتم تجميعها حول إجابة واحدة أو أخرى ، بل ستنتشر حولها. تنتشر التخمينات غير الصحيحة بشكل أساسي عبر جميع الإجابات الخاطئة المحتملة ، مما يؤدي إلى إلغاء بعضها البعض. وفي الوقت نفسه ، سيتم تجميع التخمينات الصحيحة من النماذج المختلفة حول الإجابة الصحيحة والصحيحة. عند استخدام طرق تدريب المجموعات ، يمكن العثور على الإجابة الصحيحة بموثوقية أكبر.

طرق تدريب فريق بسيط

عادةً ما تتضمن طرق تدريب المجموعات البسيطة تطبيق تقنية الملخص الإحصائيق ، مثل تحديد الوضع أو المتوسط ​​أو المتوسط ​​المرجح لمجموعة من التنبؤات.

يشير الوضع إلى العنصر الأكثر تكرارا ضمن مجموعة من الأرقام. من أجل الحصول على الوضع ، تعيد نماذج التعلم الفردية تنبؤاتها وتعتبر هذه التنبؤات أصواتًا للتنبؤ النهائي. يتم تحديد متوسط ​​التنبؤات ببساطة عن طريق حساب المتوسط ​​الحسابي للتنبؤات ، مقربًا إلى أقرب عدد صحيح صحيح. أخيرًا ، يمكن حساب المتوسط ​​المرجح عن طريق تعيين أوزان مختلفة للنماذج المستخدمة لإنشاء تنبؤات ، مع الأوزان التي تمثل الأهمية المتصورة لهذا النموذج. يتم ضرب التمثيل العددي للتنبؤ بالفئة جنبًا إلى جنب مع الوزن من 0 إلى 1.0 ، ثم يتم جمع التوقعات الموزونة الفردية معًا ويتم تقريب النتيجة إلى أقرب عدد صحيح.

طرق تدريب الفرقة المتقدمة

هناك ثلاث تقنيات تدريب أولية متقدمة للمجموعات ، كل منها مصمم للتعامل مع نوع معين من مشاكل التعلم الآلي. تقنيات "التكييس" تُستخدم لتقليل التباين في تنبؤات النموذج ، مع تباين يشير إلى مدى اختلاف نتائج التنبؤات عندما تستند إلى نفس الملاحظة. تقنيات "التعزيز" تستخدم لمكافحة تحيز النماذج. أخيراً، "تكديس" يستخدم لتحسين التنبؤات بشكل عام.

يمكن عمومًا تقسيم طرق تعلم المجموعات نفسها إلى واحدة من مجموعتين مختلفتين: الأساليب المتسلسلة وطرق المجموعات المتوازية.

تحصل أساليب المجموعات المتسلسلة على الاسم "المتسلسل" لأن المتعلمين / النماذج الأساسية يتم إنشاؤها بالتتابع. في حالة الطرق المتسلسلة ، فإن الفكرة الأساسية هي أن الاعتماد بين المتعلمين الأساسيين يتم استغلاله من أجل الحصول على تنبؤات أكثر دقة. تم تعديل أوزان الأمثلة ذات العلامات الخاطئة بينما تحافظ الأمثلة المصنفة بشكل صحيح على نفس الأوزان. في كل مرة يتم إنشاء متعلم جديد ، تتغير الأوزان وتتحسن الدقة (نأمل).

على عكس نماذج المجموعات المتسلسلة ، فإن طرق المجموعات المتوازية تولد المتعلمين الأساسيين بالتوازي. عند تنفيذ التعلم الجماعي الموازي ، تكمن الفكرة في استغلال حقيقة أن المتعلمين الأساسيين يتمتعون بالاستقلالية ، حيث يمكن تقليل معدل الخطأ العام عن طريق حساب متوسط ​​تنبؤات المتعلمين الفرديين.

يمكن أن تكون طرق تدريب المجموعات إما متجانسة أو غير متجانسة في طبيعتها. معظم طرق التعلم الجماعي متجانسة ، مما يعني أنها تستخدم نوعًا واحدًا من نموذج / خوارزمية التعلم الأساسي. في المقابل ، تستفيد المجموعات غير المتجانسة من خوارزميات التعلم المختلفة ، وتنويع المتعلمين وتنويعهم لضمان أن تكون الدقة عالية قدر الإمكان.

أمثلة على خوارزميات التعلم الجماعي

تصور تعزيز الفرقة. الصورة: Sirakorn عبر ويكيميديا ​​كومنز ، CC BY SA 4.0 ، (https://commons.wikimedia.org/wiki/File:Ensemble_Boosting.svg)

تتضمن أمثلة طرق التجميع المتسلسلة adaBoost, XGBoostو تعزيز التدرج الشجري. هذه كلها نماذج معززة. بالنسبة لهذه النماذج المعززة ، الهدف هو تحويل المتعلمين الضعفاء ضعيفي الأداء إلى متعلمين أكثر قوة. نماذج مثل AdaBoost و XGBoost تبدأ بالعديد من المتعلمين الضعفاء الذين يقدمون أداءً أفضل قليلاً من التخمين العشوائي. مع استمرار التدريب ، يتم تطبيق الأوزان على البيانات وتعديلها. يتم إعطاء الأمثلة التي تم تصنيفها بشكل غير صحيح من قبل المتعلمين في جولات التدريب السابقة وزناً أكبر. بعد تكرار هذه العملية للعدد المطلوب من جولات التدريب ، يتم ربط التنبؤات معًا إما من خلال مجموع مرجح (لمهام الانحدار) وتصويت مرجح (لمهام التصنيف).

عملية التعلم في التعبئة. الصورة: SeattleDataGuy عبر Wikimedia Commons، CC BY SA 4.0 (https://commons.wikimedia.org/wiki/File:Bagging.png)

مثال على نموذج المجموعة المتوازية هو a غابة عشوائية المصنف ، والغابات العشوائية هي أيضًا مثال على تقنية التعبئة. مصطلح "التعبئة" يأتي من "تجميع التمهيد". يتم أخذ العينات من مجموعة البيانات الإجمالية باستخدام تقنية أخذ العينات المعروفة باسم "أخذ عينات التمهيد" ، والتي يستخدمها المتعلمون الأساسيون لعمل التنبؤات. بالنسبة لمهام التصنيف ، يتم تجميع مخرجات النماذج الأساسية باستخدام التصويت ، بينما يتم حساب متوسطها معًا لمهام الانحدار. تستخدم الغابات العشوائية أشجار القرار الفردية كمتعلمين أساسيين ، ويتم إنشاء كل شجرة في المجموعة باستخدام عينة مختلفة من مجموعة البيانات. يتم أيضًا استخدام مجموعة فرعية عشوائية من الميزات لإنشاء الشجرة. يؤدي إلى أشجار قرارات فردية عشوائية للغاية ، والتي يتم دمجها معًا لتوفير تنبؤات موثوقة.

تصور تكديس المجموعة. الصورة: Supun Setunga عبر ويكيميديا ​​كومنز ، CC BY SA 4.0 (https://commons.wikimedia.org/wiki/File:Stacking.png)

فيما يتعلق بتقنيات التجميع المتراصة ، يتم دمج نماذج الانحدار أو التصنيف المتعددة معًا من خلال مستوى أعلى ، النموذج التلوي. يتم تدريب النماذج الأساسية ذات المستوى الأدنى من خلال تغذية مجموعة البيانات بأكملها. ثم يتم استخدام مخرجات النماذج الأساسية كميزات لتدريب النموذج التلوي. غالبًا ما تكون نماذج مجموعات التكديس غير متجانسة في طبيعتها.

Blogger والمبرمج مع تخصصات في تعلم آلة و تعلم عميق المواضيع. يأمل دانيال في مساعدة الآخرين على استخدام قوة الذكاء الاصطناعي من أجل الصالح الاجتماعي.