Connect with us

التعلم الإشرافي مقابل التعلم غير الإشرافي

الذكاء الاصطناعي 101

التعلم الإشرافي مقابل التعلم غير الإشرافي

mm

في تعلم الآلة، يمكن تصنيف معظم المهام بسهولة إلى واحدة من فئتين مختلفتين: مشاكل التعلم الإشرافي أو مشاكل التعلم غير الإشرافي. في التعلم الإشرافي، يتم إضافة تسميات أو فئات إلى البيانات، بينما في حالة التعلم غير الإشرافي تكون البيانات غير محددة. لنلق نظرة متعمقة على لماذا هذا التمييز مهم وننظر إلى بعض الخوارزميات المرتبطة بنوع كل تعلم.

التعلم الإشرافي مقابل التعلم غير الإشرافي

معظم مهام تعلم الآلة تقع في نطاق التعلم الإشرافي. في خوارزميات التعلم الإشرافي، يتم تعيين فئة أو تسمية إلى كل حالة/نقطة بيانات في مجموعة البيانات. هذا يعني أن نموذج تعلم الآلة يمكن أن يتعلم التمييز بين السمات المرتبطة بفئة معينة وأن مهندس تعلم الآلة يمكن التحقق من أداء النموذج من خلال رؤية عدد الحالات التي تم تصنيفها بشكل صحيح. يمكن استخدام خوارزميات التصنيف لاكتشاف العديد من الأنماط المعقدة، طالما أن البيانات تمت إضافتها إلى الفئات المناسبة. على سبيل المثال، يمكن لخوارزمية تعلم الآلة تعلم التمييز بين الحيوانات المختلفة بناءً على سمات مثل “الذيل”، “الذيل”، “الأظافر”، إلخ.
على عكس التعلم الإشرافي، ي涉ك التعلم غير الإشرافي في إنشاء نموذج يمكنه استخراج الأنماط من البيانات غير المحددة. وبعبارة أخرى، يقوم الكمبيوتر بتحليل سمات الإدخال ويتحديد بنفسه السمات والأنماط الأكثر أهمية. يحاول التعلم غير الإشرافي العثور على التشابهات المتأصلة بين الحالات المختلفة. إذا كان الهدف من خوارزمية التعلم الإشرافي هو وضع نقاط البيانات في فئات معروفة، فإن خوارزميات التعلم غير الإشرافي ستفحص السمات المشتركة بين مثيلات الكائنات وتضعها في مجموعات بناءً على هذه السمات، مما يخلق في الأساس فئاتها الخاصة.
أمثلة على خوارزميات التعلم الإشرافي هي الانحدار الخطي، والانحدار اللوجستي، وأقرب جيران، والشجرة القرارية، وآلة دعم المتجه.
في حين أن بعض الأمثلة على خوارزميات التعلم غير الإشرافي هي تحليل المكونات الرئيسية وتركيب K-Means.

خوارزمية التعلم الإشرافي

الانحدار الخطي هو خوارزمية تأخذ سمة وترسم العلاقة بينهما. يستخدم الانحدار الخطي للتنبؤ بالقيم العددية فيما يتعلق bằng متغيرات عددية أخرى. الانحدار الخطي له معادلة Y = a + bX، حيث b هو منحدر الخط و a هو حيث يتقاطع y مع محور X.
الانحدار اللوجستي هو خوارزمية تصنيف ثنائي. يفحص الخوارزمية العلاقة بين السمات العددية ويعثر على احتمال أن يتم تصنيف الحالة في واحدة من فئتين مختلفتين. يتم ضغط قيم الاحتمال نحو 0 أو 1. بعبارة أخرى، الاحتمالات القوية ستقترب من 0.99 بينما الاحتمالات الضعيفة ستقترب من 0.
أقرب جيران يخصص فئة إلى نقاط بيانات جديدة بناءً على الفئات المحددة لبعض الجيران المحددة في مجموعة التدريب. عدد الجيران الذين يأخذهم الخوارزمية في الاعتبار مهم، ويمكن أن تؤدي الجيران القليلة أو الكثيرة إلى سوء تصنيف النقاط.
الشجرة القرارية هي نوع من خوارزميات التصنيف والانحدار. تعمل شجرة القرار عن طريق تقسيم مجموعة البيانات إلى أقسام أصغر وأصغر حتى لا يمكن تقسيم الأقسام بشكل أكبر، وينتج عن ذلك شجرة مع عقد وورق. العقد هي حيث يتم اتخاذ القرارات حول نقاط البيانات باستخدام معايير تصفية مختلفة، بينما الأوراق هي الحالات التي تم تعيينها بعض التسمية (نقطة بيانات تم تصنيفها). يمكن لخوارزميات شجرة القرار التعامل مع البيانات العددية والفئوية. يتم إجراء الانقسامات في الشجرة على متغيرات/سمات محددة.
آلة دعم المتجه هي خوارزمية تصنيف تعمل عن طريق رسم هيبر بلين، أو خطوط الفصل، بين نقاط البيانات. يتم فصل نقاط البيانات إلى فئات بناءً على جانب هيبر بلين الذي تقع عليه. يمكن رسم هيبر بلين متعددة عبر مستوى، مقسمة مجموعة البيانات إلى فئات متعددة. ستحاول المصنفة تحسين المسافة بين هيبر بلين الفاصل ونقاط على جانبي المستوى، وكلما زادت المسافة بين الخط والنقاط، زادت ثقة المصنف.

خوارزميات التعلم غير الإشرافي

تحليل المكونات الرئيسية هو تقنية تستخدم لتقليل الأبعاد، مما يعني أن تعقيد البيانات يتم تمثيله بطريقة أبسط. يجد خوارزمية تحليل المكونات الرئيسية أبعادًا جديدة للبيانات التي تكون متعامدة. بينما يتم تقليل أبعاد البيانات، يجب الحفاظ على التباين بين البيانات قدر الإمكان. هذا يعني في المصطلحات العملية أن يتم استخلاص السمات في مجموعة البيانات وتخفيضها إلى سمات أقل تمثل معظم البيانات.
تركيب K-Means هو خوارزمية تجمع تلقائيًا نقاط البيانات إلى مجموعات بناءً على سمات متشابهة. يتم تحليل الأنماط داخل مجموعة البيانات وتنقسم نقاط البيانات إلى مجموعات بناءً على هذه الأنماط. في الأساس، يخلق K-Means فئاته الخاصة من البيانات غير المحددة. تعمل خوارزمية K-Means عن طريق تعيين مراكز للمجموعات، أو المراكز، وتنقل المراكز حتى يتم العثور على الموقع الأمثل للمراكز. الموقع الأمثل سيكون واحدًا حيث يتم تقليل المسافة بين المراكز ونقاط البيانات المحيطة بهم داخل الفئة. يشير “K” في تركيب K-Means إلى عدد المراكز المحددة.

ملخص

لإغلاق، دعونا نلقي نظرة سريعة على الفروق الرئيسية بين التعلم الإشرافي والتعلم غير الإشرافي.
كما ناقشنا من قبل، في مهام التعلم الإشرافي تكون البيانات الإدخالية محددة والفئات معروفة. في حين أن البيانات الإدخالية غير محددة وعدد الفئات غير معروف في حالات التعلم غير الإشرافي. يميل التعلم غير الإشرافي إلى أن يكون أقل تعقيدًا حسابيًا، بينما يميل التعلم الإشرافي إلى أن يكون أكثر تعقيدًا حسابيًا. بينما تميل نتائج التعلم الإشرافي إلى أن تكون دقيقة جدًا، تميل نتائج التعلم غير الإشرافي إلى أن تكون أقل دقة / دقة معقولة.

مدون وبرمجي متخصص في مواضيع Machine Learning و Deep Learning. يأمل دانيال في مساعدة الآخرين على استخدام قوة الذكاء الاصطناعي من أجل الخير الاجتماعي.