منظمة العفو الدولية 101

ما هو نقل التعلم؟

تحديث on 17 أكتوبر 2020

ما هو نقل التعلم؟

عند ممارسة التعلم الآلي، قد يستغرق تدريب النموذج وقتًا طويلاً. إن إنشاء بنية نموذجية من الصفر، وتدريب النموذج، ثم تعديل النموذج يتطلب قدرًا هائلاً من الوقت والجهد. الطريقة الأكثر فعالية لتدريب نموذج التعلم الآلي هي استخدام بنية تم تعريفها بالفعل، وربما مع الأوزان التي تم حسابها بالفعل. هذه هي الفكرة الرئيسية وراء نقل التعلم، أخذ نموذج تم استخدامه بالفعل وإعادة تخصيصه لمهمة جديدة.

قبل الخوض في الطرق المختلفة التي يمكن من خلالها استخدام التعلم النقلي، دعونا نتوقف لحظة لفهم سبب كون التعلم النقلي أسلوبًا قويًا ومفيدًا.

حل مشكلة التعلم العميق

عندما تحاول حل مشكلة تعلم عميقة ، مثل بناء مصنف صور ، يجب عليك إنشاء بنية نموذجية ثم تدريب النموذج على بياناتك. يتضمن تدريب مصنف النموذج ضبط أوزان الشبكة ، وهي عملية يمكن أن تستغرق ساعات أو حتى أيامًا اعتمادًا على مدى تعقيد كل من النموذج ومجموعة البيانات. سيتم قياس وقت التدريب وفقًا لحجم مجموعة البيانات وتعقيد بنية النموذج.

إذا لم يحقق النموذج نوع الدقة المطلوبة للمهمة ، فمن المحتمل أن يلزم إجراء تعديل في النموذج ومن ثم سيحتاج النموذج إلى إعادة تدريبه. وهذا يعني المزيد من ساعات التدريب حتى يمكن العثور على التصميم الأمثل وطول التدريب وقسم مجموعة البيانات. عندما تفكر في عدد المتغيرات التي يجب أن تتماشى مع بعضها البعض حتى يكون المصنف مفيدًا ، فمن المنطقي أن يبحث مهندسو التعلم الآلي دائمًا عن طرق أسهل وأكثر فاعلية لتدريب النماذج وتنفيذها. لهذا السبب ، تم إنشاء تقنية نقل التعلم.

بعد تصميم النموذج واختباره ، إذا ثبت أن النموذج مفيد ، يمكن حفظه وإعادة استخدامه لاحقًا لمشاكل مماثلة.

أنواع التعلم بالنقل

بشكل عام ، هناك نوعان مختلفان أنواع نقل التعلم: تطوير نموذج من الصفر واستخدام نموذج مُدرَّب مسبقًا.

عندما تقوم بتطوير نموذج من البداية ، ستحتاج إلى إنشاء بنية نموذجية قادرة على تفسير بيانات التدريب الخاصة بك واستخراج الأنماط منها. بعد تدريب النموذج لأول مرة ، ستحتاج على الأرجح إلى إجراء تغييرات عليه من أجل الحصول على الأداء الأمثل من النموذج. يمكنك بعد ذلك حفظ بنية النموذج واستخدامها كنقطة بداية لنموذج سيتم استخدامه في مهمة مماثلة.

في الحالة الثانية - استخدام نموذج مدرب مسبقًا - عليك فقط اختيار نموذج مدرب مسبقًا للاستفادة منه. ستجعل العديد من الجامعات وفرق البحث مواصفات طرازها متاحة للاستخدام العام. يمكن تنزيل بنية النموذج مع الأوزان.

عند إجراء تعلم النقل ، يمكن استخدام بنية النموذج بالكامل والأوزان للمهمة المطروحة ، أو يمكن استخدام أجزاء / طبقات معينة فقط من النموذج. يُشار إلى استخدام بعض النماذج المدربة مسبقًا فقط وتدريب بقية النموذج على أنه ضبط دقيق.

ضبط الشبكة

يصف التوليف الدقيق للشبكة عملية تدريب بعض الطبقات فقط في الشبكة. إذا كانت مجموعة بيانات التدريب الجديدة تشبه إلى حد كبير مجموعة البيانات المستخدمة لتدريب النموذج الأصلي ، فيمكن استخدام العديد من نفس الأوزان.

يجب أن يتم قياس عدد الطبقات في الشبكة التي يجب إلغاء تجميدها وإعادة تدريبها وفقًا لحجم مجموعة البيانات الجديدة. إذا كانت مجموعة البيانات التي يتم التدريب عليها صغيرة ، فمن الأفضل الاحتفاظ بأغلبية الطبقات كما هي وتدريب الطبقات القليلة الأخيرة فقط. هذا لمنع الشبكة من التخصيص. بدلاً من ذلك ، يمكن إزالة الطبقات النهائية للشبكة المدربة مسبقًا وإضافة طبقات جديدة يتم تدريبها بعد ذلك. في المقابل ، إذا كانت مجموعة البيانات عبارة عن مجموعة بيانات كبيرة ، يحتمل أن تكون أكبر من مجموعة البيانات الأصلية ، فيجب إعادة تدريب الشبكة بالكامل. لاستخدام الشبكة باسم مستخرج ميزة ثابتة، يمكن استخدام غالبية الشبكة لاستخراج الميزات بينما يمكن إلغاء تجميد الطبقة الأخيرة من الشبكة وتدريبها.

عندما تقوم بضبط الشبكة ، تذكر فقط أن الطبقات السابقة من ConvNet هي التي تحتوي على المعلومات التي تمثل الميزات العامة للصور. هذه ميزات مثل الحواف والألوان. في المقابل ، تحتوي طبقات ConvNet اللاحقة على التفاصيل الأكثر تحديدًا للفئات الفردية الموجودة داخل مجموعة البيانات التي تم تدريب النموذج عليها في البداية. إذا كنت تقوم بتدريب نموذج على مجموعة بيانات مختلفة تمامًا عن مجموعة البيانات الأصلية ، فربما تريد استخدام الطبقات الأولية للنموذج لاستخراج الميزات وإعادة تدريب بقية النموذج فقط.

نقل أمثلة التعلم

من المحتمل أن تكون التطبيقات الأكثر شيوعًا لتعلم النقل هي تلك التي تستخدم بيانات الصورة كمدخلات. غالبًا ما تكون هذه مهام تنبؤ / تصنيف. الطريقة الشبكات العصبية التلافيفية يفسح تفسير بيانات الصورة نفسه لإعادة استخدام جوانب النماذج ، حيث أن الطبقات التلافيفية غالبًا ما تميز سمات متشابهة جدًا. أحد الأمثلة على مشكلة تعلم النقل الشائعة هو مهمة ImageNet 1000 ، وهي مجموعة بيانات ضخمة مليئة بـ 1000 فئة مختلفة من الكائنات. غالبًا ما تقوم الشركات التي تطور نماذج تحقق أداءً عاليًا في مجموعة البيانات هذه بإصدار نماذجها بموجب تراخيص تسمح للآخرين بإعادة استخدامها. بعض النماذج التي نتجت عن هذه العملية تشمل نموذج Microsoft ResNetو Google Inception Model و نموذج أكسفورد VGG المجموعة.