الذكاء الاصطناعي 101
ما هو التعلم التحويلي؟

ما هو التعلم التحويلي؟
عند ممارسة التعلم الآلي، يمكن أن يستغرق تدريب نموذج وقتًا طويلاً. إن إنشاء بنية نموذجية من الصفر، وتدريب النموذج، ثم تعديله يعتبر كمية هائلة من الوقت والجهد. هناك طريقة أكثر كفاءة لتدريب نموذج التعلم الآلي، وهي استخدام بنية تم تعريفها بالفعل، وربما مع أوزان تم حسابها بالفعل. هذا هو الفكرة الرئيسية وراء التعلم التحويلي، حيث يتم أخذ نموذج تم استخدامه بالفعل وإعادة توجيهه لمهمة جديدة.
قبل الغوص في الطرق المختلفة التي يمكن استخدام التعلم التحويلي من خلالها، دعونا نتخذ لحظة لتفهم لماذا التعلم التحويلي هو تقنية قوية ومفيدة.
حل مشكلة التعلم العميق
عندما تحاول حل مشكلة تعلم عميق، مثل بناء مصنف صور، عليك إنشاء بنية نموذجية ثم تدريب النموذج على بياناتك. يتضمن تدريب مصنف النموذج تعديل أوزان الشبكة، عملية يمكن أن تستغرق ساعات أو حتى أيام، اعتمادًا على تعقيد النموذج ومدى قوة البيانات. سيتوسع وقت التدريب وفقًا لحجم البيانات وتعقيد بنية النموذج.
إذا لم يصل النموذج إلى الدقة المطلوبة للمهمة، فمن المحتمل أن يتعين تعديل النموذج ثم إعادة تدريبه. هذا يعني المزيد من ساعات التدريب حتى يتم العثور على بنية مثالية وطول تدريب وpartition بيانات. عندما تفكر في كمية المتغيرات التي يجب محاذاتها لجعل المصنف مفيدًا، فمن المنطقي أن مهندسي التعلم الآلي دائمًا يبحثون عن طرق أسهل وأكثر كفاءة لتدريب وتنفيذ النماذج. لهذا السبب تم إنشاء تقنية التعلم التحويلي.
بعد تصميم واختبار نموذج، إذا ثبت أنه مفيد، يمكن حفظه وإعادة استخدامه لاحقًا لمشاكل مشابهة.
أنواع التعلم التحويلي
بشكل عام، هناك نوعان من التعلم التحويلي: تطوير نموذج من الصفر واستخدام نموذج مدرب مسبقًا.
عندما تطور نموذجًا من الصفر، ستحتاج إلى إنشاء بنية نموذجية قادرة على تفسير بياناتك واستخراج الأنماط منها. بعد تدريب النموذج لأول مرة، ستحتاج على الأرجح إلى إجراء تعديلات عليه لتحقيق الأداء الأمثل للنموذج. يمكنك тогда حفظ بنية النموذج واستخدامها كنقطة بداية لنموذج سيتم استخدامه لمهمة مشابهة.
في الحالة الثانية – استخدام نموذج مدرب مسبقًا – عليك ببساطة اختيار نموذج مدرب للاستخدام. غالبًا ما تقوم الجامعات والفرق البحثية بنشر مواصفات نموذجها للجميع. يمكن تحميل بنية النموذج مع الأوزان.
عند إجراء التعلم التحويلي، يمكن استخدام بنية النموذج وأوزانه بالكامل للمهمة، أو استخدام أجزاء معينة من النموذج. استخدام جزء من النموذج المدرب وتدريب الجزء الآخر من النموذج يسمى التعديل الدقيق.
تعديل الشبكة
يعرف تعديل الشبكة عملية تدريب بعض طبقات الشبكة. إذا كانت مجموعة بيانات التدريب الجديدة مشابهة لمجموعة البيانات المستخدمة لتدريب النموذج الأصلي، يمكن استخدام العديد من الأوزان نفسها.
يجب أن يتوسع عدد الطبقات في الشبكة التي يجب إلغاء تجميدها وإعادة تدريبها وفقًا لحجم مجموعة البيانات الجديدة. إذا كانت مجموعة البيانات التي يتم تدريبها عليها صغيرة، فمن الأفضل الحفاظ على معظم الطبقات كما هي وتدريب الطبقات القليلة الأخيرة فقط. هذا لمنع الشبكة من التأثر السلبي. بديلًا، يمكن إزالة الطبقات النهائية من الشبكة المدربة مسبقًا وإضافة طبقات جديدة، والتي يتم تدريبها بعد ذلك. في المقابل، إذا كانت مجموعة البيانات كبيرة، قد تكون أكبر من مجموعة البيانات الأصلية، فيجب إعادة تدريب الشبكة بالكامل. لاستخدام الشبكة كـ مستخرج ميزات ثابت، يمكن استخدام معظم الشبكة لاستخراج الميزات بينما يتم إلغاء تجميد الطبقة النهائية فقط وتدريبها.
عندما تقوم بتعديل الشبكة، تذكر فقط أن الطبقات الأولى من الشبكة هي التي تحتوي على المعلومات التي تمثل الميزات الأكثر عمومية للصور. هذه هي الميزات مثل الحواف والألوان. في المقابل، تحتوي الطبقات الأخيرة من الشبكة على التفاصيل الأكثر تحديدًا للفئات الفردية الموجودة في مجموعة البيانات التي تم تدريب النموذج عليها في البداية. إذا كنت تقوم بتدريب نموذج على مجموعة بيانات مختلفة جدًا عن مجموعة البيانات الأصلية، فمن المحتمل أن تريد استخدام الطبقات الأولى من النموذج لاستخراج الميزات وتركيب باقي النموذج.
أمثلة على التعلم التحويلي
الأمثلة الأكثر شيوعًا لاستخدام التعلم التحويلي هي تلك التي تستخدم بيانات الصور كمدخلات. غالبًا ما تكون هذه مهام التنبؤ أو التصنيف. الطريقة التي تفسّر شبكات النيوورك التلافيفية بيانات الصور تسهل إعادة استخدام جوانب النماذج، حيث أن الطبقات التلافيفية غالبًا ما تميز ميزات متشابهة جدًا. أحد الأمثلة الشائعة على مشكلة التعلم التحويلي هي مهمة ImageNet 1000، وهي مجموعة بيانات ضخمة تحتوي على 1000 فئة مختلفة من الكائنات. الشركات التي تطور نماذج تحقق أداء عالي على هذه المجموعة البيانات غالبًا ما تنشر نماذجها تحت رخص تسمح للآخرين بإعادة استخدامها. بعض النماذج التي نتجت عن هذا العملية تشمل نموذج Microsoft ResNet ونموذج Oxford VGG ونموذج Google Inception.








