رطم نماذج التعلم الآلي التوليدية مقابل نماذج التعلم الآلي التمييزية - Unite.AI
اتصل بنا للحصول على مزيد من المعلومات
دروس متقدمة في الذكاء الاصطناعي:

منظمة العفو الدولية 101

نماذج التعلم الآلي التوليدية مقابل نماذج التعلم الآلي التمييزية

mm
تحديث on

تنتمي بعض نماذج التعلم الآلي إلى فئات النماذج "التوليدية" أو "التمييزية". بعد ما هو الفرق بين هاتين الفئتين من النماذج؟ ماذا يعني أن يكون النموذج تمييزيًا أو مُنتجًا؟

الإجابة المختصرة هي أن النماذج التوليدية هي تلك التي تتضمن توزيع مجموعة البيانات ، وإرجاع احتمالية لمثال معين. غالبًا ما تُستخدم النماذج التوليدية للتنبؤ بما يحدث بعد ذلك في التسلسل. وفي الوقت نفسه ، يتم استخدام النماذج التمييزية إما للتصنيف أو الانحدار وإرجاع التنبؤ على أساس الشرطي احتمالا. دعنا نستكشف الاختلافات بين النماذج التوليدية والتمييزية بمزيد من التفصيل ، حتى نتمكن من فهم ما يفصل بين نوعي النماذج ومتى يجب استخدام كل نوع حقًا.

النماذج التوليدية مقابل النماذج التمييزية

هناك عدة طرق لتصنيف نموذج التعلم الآلي. يمكن تصنيف النموذج على أنه ينتمي إلى فئات مختلفة مثل: النماذج التوليدية ، والنماذج التمييزية ، والنماذج المعلمية ، والنماذج غير المعلمية ، والنماذج المستندة إلى الأشجار ، والنماذج غير المستندة إلى الأشجار.

ستركز هذه المقالة على الاختلافات بين النماذج التوليدية والنماذج التمييزية. سنبدأ بتحديد كل من النماذج التوليدية والتمييزية ، ثم سنستكشف بعض الأمثلة لكل نوع من النماذج.

نماذج مولدة

النماذج التوليدية هي تلك التي تركز على توزيع الفئات داخل مجموعة البيانات. عادةً ما تقوم خوارزميات التعلم الآلي بنمذجة توزيع نقاط البيانات. تعتمد النماذج التوليدية على إيجاد الاحتمال المشترك. إنشاء نقاط حيث توجد ميزة إدخال معينة والمخرج / التسمية المرغوبة بشكل متزامن.

تُستخدم النماذج التوليدية عادةً لتقدير الاحتمالات والاحتمالات ونمذجة نقاط البيانات والتمييز بين الفئات بناءً على هذه الاحتمالات. نظرًا لأن النموذج يتعلم توزيع احتمالية لمجموعة البيانات ، فيمكنه الرجوع إلى توزيع الاحتمالات هذا لإنشاء مثيلات بيانات جديدة. غالبًا ما تعتمد النماذج التوليدية على مبرهنة بايز لإيجاد الاحتمال المشترك ، إيجاد p (x، y). بشكل أساسي ، تقوم النماذج التوليدية بنمذجة كيفية إنشاء البيانات ، والإجابة على السؤال التالي:

"ما هو احتمال أن تكون هذه الفئة أو فئة أخرى قد ولّدت نقطة / مثيل البيانات هذه؟"

تتضمن أمثلة نماذج التعلم الآلي التوليدية التحليل الخطي التمييزي (LDA) ونماذج Hidden Markov وشبكات Bayesian مثل Naive Bayes.

النماذج التمييزية

بينما تتعرف النماذج التوليدية على توزيع مجموعة البيانات ، النماذج التمييزية تعرف على الحد الفاصل بين الفئات داخل مجموعة البيانات. مع النماذج التمييزية ، الهدف هو التحديد حدود القرار بين الفئات لتطبيق تسميات فئة موثوقة على حالات البيانات. تفصل النماذج التمييزية الفئات في مجموعة البيانات باستخدام الاحتمال الشرطي ، دون وضع أي افتراضات حول نقاط البيانات الفردية.

وضعت النماذج التمييزية للإجابة على السؤال التالي:

"في أي جانب من حدود القرار يوجد هذا المثال؟"

تتضمن أمثلة النماذج التمييزية في التعلم الآلي آلات المتجهات الداعمة، والانحدار اللوجستي، وأشجار القرار، والغابات العشوائية.

الاختلافات بين التوليدية والتمييزية

فيما يلي ملخص سريع للاختلافات الرئيسية بين النماذج التوليدية والتمييزية.

النماذج التوليدية:

  • تهدف النماذج التوليدية إلى التقاط التوزيع الفعلي للفئات في مجموعة البيانات.
  • تتنبأ النماذج التوليدية بتوزيع الاحتمالات المشترك – p(x,y) – باستخدام نظرية بايز.
  • النماذج التوليدية باهظة الثمن من الناحية الحسابية مقارنة بالنماذج التمييزية.
  • تعد النماذج التوليدية مفيدة لمهام التعلم الآلي غير الخاضعة للإشراف.
  • تتأثر النماذج التوليدية بوجود القيم المتطرفة أكثر من النماذج التمييزية.

النماذج التمييزية:

  • تشكل النماذج التمييزية نموذجًا لحد القرار لفئات مجموعة البيانات.
  • تتعلم النماذج التمييزية الاحتمال الشرطي - p (y | x).
  • النماذج التمييزية رخيصة من الناحية الحسابية مقارنة بالنماذج التوليدية.
  • النماذج التمييزية مفيدة لمهام التعلم الآلي الخاضعة للإشراف.
  • تتميز النماذج التمييزية بأنها أكثر قوة بالنسبة للقيم المتطرفة ، على عكس النماذج التوليدية.
  • تعتبر النماذج التمييزية أكثر قوة بالنسبة للقيم المتطرفة مقارنة بالنماذج التوليدية.

سنستكشف الآن بإيجاز بعض الأمثلة المختلفة لنماذج التعلم الآلي التوليدية والتمييزية.

أمثلة على النماذج التوليدية

تحليل التمييز الخطي (LDA)

نماذج LDA تعمل عن طريق تقدير التباين ومتوسط ​​البيانات لكل فئة في مجموعة البيانات. بعد حساب المتوسط ​​والفروق لكل فئة ، يمكن إجراء تنبؤات عن طريق تقدير احتمال أن تنتمي مجموعة معينة من المدخلات إلى فئة معينة.

نماذج ماركوف المخفية

سلاسل ماركوف يمكن اعتبارها رسوم بيانية ذات احتمالات تشير إلى مدى احتمالية انتقالنا من نقطة واحدة في السلسلة ، "حالة" ، إلى حالة أخرى. تُستخدم سلاسل ماركوف لتحديد احتمال الانتقال من الحالة j إلى الحالة i ، والتي يمكن الإشارة إليها بالرمز p (i ، j). هذا هو مجرد الاحتمال المشترك المذكور أعلاه. نموذج ماركوف المخفي هو المكان الذي تستخدم فيه سلسلة ماركوف غير المرئية وغير المرئية. يتم إعطاء مدخلات البيانات إلى النموذج ويتم استخدام احتمالات الحالة الحالية والحالة التي تسبقه مباشرة لحساب النتيجة الأكثر احتمالاً.

شبكات بايزي

شبكات بايزي هي نوع من النماذج الرسومية الاحتمالية. إنها تمثل التبعيات الشرطية بين المتغيرات ، كما يمثلها الرسم البياني المباشر الموجه. في شبكة بايز ، تمثل كل حافة الرسم البياني تبعية مشروطة ، وكل عقدة تتوافق مع متغير فريد. يمكن استخدام الاستقلال الشرطي للعلاقات الفريدة في الرسم البياني لتحديد التوزيع المشترك للمتغيرات وحساب الاحتمال المشترك. بمعنى آخر ، تلتقط شبكة Bayesian مجموعة فرعية من العلاقات المستقلة في توزيع احتمالي مشترك محدد.

بمجرد إنشاء شبكة بايز وتعريفها بشكل صحيح ، مع معرفة المتغيرات العشوائية والعلاقات الشرطية والتوزيعات الاحتمالية ، يمكن استخدامها لتقدير احتمالية الأحداث أو النتائج.

يعد نموذج Naive Bayes أحد أكثر أنواع شبكات Bayesian استخدامًا. يتعامل نموذج Naive Bayes مع التحدي المتمثل في حساب الاحتمالية لمجموعات البيانات مع العديد من المعلمات / المتغيرات من خلال التعامل مع جميع الميزات على أنها مستقلة عن بعضها البعض.

أمثلة على النماذج التمييزية

دعم آلات مكافحة ناقلات

دعم ناقلات الآلات تعمل عن طريق رسم حدود القرار بين نقاط البيانات ، وإيجاد حدود القرار التي تفصل بشكل أفضل الفئات المختلفة في مجموعة البيانات. ترسم خوارزمية SVM إما خطوطًا أو خطوطًا مفرطة تفصل النقاط ، للمسافات ثنائية الأبعاد والمسافات ثلاثية الأبعاد على التوالي. يحاول SVM العثور على الخط / المستوى الفائق الذي يفصل بين الفئات بشكل أفضل من خلال محاولة تعظيم الهامش ، أو المسافة بين الخط / المستوى الفائق لأقرب نقطة. يمكن أيضًا استخدام نماذج SVM في مجموعات البيانات التي لا يمكن فصلها خطيًا باستخدام "خدعة kernel" لتحديد حدود القرار غير الخطية.

الانحدار اللوجستي

الانحدار اللوجستي هي خوارزمية تستخدم دالة logit (log-odds) لتحديد احتمالية وجود أحد المدخلات في إحدى الحالتين. يتم استخدام الدالة السينية "لسحق" الاحتمال نحو 0 أو 1 ، صواب أو خطأ. يُفترض أن تكون الاحتمالات الأكبر من 0.50 من الفئة 1 ، بينما يُفترض أن تكون الاحتمالات 0.49 أو أقل هي 0. ولهذا السبب ، يُستخدم الانحدار اللوجستي عادةً في مشاكل التصنيف الثنائي. ومع ذلك ، يمكن تطبيق الانحدار اللوجستي على المشكلات متعددة الفئات باستخدام نهج واحد مقابل الكل ، وإنشاء نموذج تصنيف ثنائي لكل فئة وتحديد احتمال أن يكون المثال فئة مستهدفة أو فئة أخرى في مجموعة البيانات.

شجرة القرار

A شجرة القرار يعمل النموذج عن طريق تقسيم مجموعة البيانات إلى أجزاء أصغر وأصغر ، وبمجرد أن يتعذر تقسيم المجموعات الفرعية ، تكون النتيجة شجرة بها عقد وأوراق. العقد في شجرة القرار هي المكان الذي يتم فيه اتخاذ القرارات المتعلقة بنقاط البيانات باستخدام معايير تصفية مختلفة. الأوراق في شجرة القرار هي نقاط البيانات التي تم تصنيفها. يمكن لخوارزميات شجرة القرار التعامل مع كل من البيانات العددية والفئوية ، وتعتمد الانقسامات في الشجرة على متغيرات / ميزات محددة.

غابات عشوائية

A نموذج الغابة العشوائية هي في الأساس مجرد مجموعة من أشجار القرار حيث يتم حساب متوسط ​​تنبؤات الأشجار الفردية للوصول إلى قرار نهائي. تختار خوارزمية الغابة العشوائية الملاحظات والميزات بشكل عشوائي ، وتبني الأشجار الفردية بناءً على هذه التحديدات.

سوف تستكشف هذه المقالة التعليمية كيفية إنشاء Box Plot في Matplotlib. تُستخدم مخططات الصندوق لتصور إحصاءات موجزة لمجموعة بيانات ، وعرض سمات التوزيع مثل نطاق البيانات وتوزيعها.

Blogger والمبرمج مع تخصصات في تعلم آلة و تعلم عميق المواضيع. يأمل دانيال في مساعدة الآخرين على استخدام قوة الذكاء الاصطناعي من أجل الصالح الاجتماعي.