الذكاء الاصطناعي 101
النماذج التوليدية مقابل النماذج التمييزية في تعلم الآلة

تنتمي بعض نماذج تعلم الآلة إلى فئتين رئيسيتين: النماذج التوليدية أو النماذج التمييزية. ولكن ما هي الفرق بين هاتين الفئتين من النماذج؟ ماذا يعني أن يكون نموذج توليدي أو تمييزي؟
الجواب القصير هو أن النماذج التوليدية هي تلك التي تشمل توزيع البيانات، وتعيد احتمالية معينة لمثال معين. غالبًا ما تستخدم النماذج التوليدية للتنبؤ بما يحدث بعد ذلك في تسلسل. في حين أن النماذج التمييزية تستخدم للتصنيف أو الانحدار، وتعيد تنبؤًا بناءً على الاحتمالية المشروطة. دعونا نستكشف الفرق بين النماذج التوليدية والتمييزية بشكل أكثر تفصيلًا، حتى ن理解 جيدًا ما يفصل بين هاتين الفئتين من النماذج ومتى يجب استخدام كل نوع.
النماذج التوليدية مقابل النماذج التمييزية
هناك العديد من الطرق لتصنيف نموذج تعلم آلة. يمكن تصنيف النموذج على أنه ينتمي إلى فئات مثل: النماذج التوليدية، النماذج التمييزية، النماذج المعلمية، النماذج غير المعلمية، النماذج القائمة على الشجرة، النماذج غير القائمة على الشجرة.
سي集中 هذا المقال على الفرق بين النماذج التوليدية والنمازج التمييزية. سنبدأ بتعريف كلا النموذجين التوليدي والتمييزي، ثم سنستكشف بعض الأمثلة على كل نوع من النماذج.
النماذج التوليدية
النماذج التوليدية هي تلك التي تركز على توزيع الفئات داخل مجموعة البيانات. تعتمد خوارزميات تعلم الآلة بشكل عام على نمذجة توزيع النقاط البيانية. تعتمد النماذج التوليدية على العثور على الاحتمالية المشتركة. إنشاء نقاط حيث توجد سمة 입력 معينة وطابع مُراد أو علامة موجودة بشكل متزامن.
تستخدم النماذج التوليدية بشكل عام لتقدير الاحتمالات والاحتمال، ونمذجة النقاط البيانية والتمييز بين الفئات بناءً على هذه الاحتمالات. نظرًا لأن النموذج يتعلم توزيعًا احتماليًا لمجموعة البيانات، يمكنه الرجوع إلى هذا التوزيع لإنشاء مثيلات بيانات جديدة. تعتمد النماذج التوليدية غالبًا على مبرهنة بايز للعثور على الاحتمالية المشتركة، وfinding p(x,y). في الأساس، النماذج التوليدية تنمذج كيف تم إنشاء البيانات، وتجيب على السؤال التالي:
“ما هو الاحتمال أن هذه الفئة أو فئة أخرى أنتجت هذه النقطة البيانية / المثال”؟
تتضمن الأمثلة على نماذج تعلم الآلة التوليدية تحليل التمييز الخطي (LDA)، ونماذج ماركوف المخفية، والشبكات البايزية مثل نماذج بايز البسيطة.
النماذج التمييزية
في حين أن النماذج التوليدية تتعلم عن توزيع مجموعة البيانات، تتعلم النماذج التمييزية عن الحدود بين الفئات داخل مجموعة البيانات. مع النماذج التمييزية، الهدف هو تحديد حدود القرار بين الفئات لتطبيق علامات فئات موثوقة على مثيلات البيانات. النماذج التمييزية تفصل الفئات في مجموعة البيانات باستخدام الاحتمالية المشروطة، دون افتراض أي شيء حول النقاط البيانية الفردية.
تسعى النماذج التمييزية إلى الإجابة على السؤال التالي:
“ما جانب من حدود القرار يوجد هذا المثال”؟
تتضمن الأمثلة على نماذج تعلم الآلة التمييزية آلات الدعم النوعي، والانحدار اللوجستي، والشجرات القرارية، والغابات العشوائية.
الفرق بين التوليدي والتمييزي
هنا ملخص سريع للفرق الرئيسي بين النماذج التوليدية والتمييزية.
النماذج التوليدية:
- النماذج التوليدية تهدف إلى التقاط التوزيع الفعلي للفئات في مجموعة البيانات.
- النماذج التوليدية تتنبأ بتوزيع الاحتمالية المشتركة – p(x,y) – باستخدام مبرهنة بايز.
- النماذج التوليدية مكلفة حسابيًا مقارنة بالنماذج التمييزية.
- النماذج التوليدية مفيدة ل_tasks تعلم الآلة غير الموجهة.
- النماذج التوليدية تتأثر بوجود القيم الشاذة أكثر من النماذج التمييزية.
النماذج التمييزية:
- النماذج التمييزية تنمذج حدود القرار للفئات في مجموعة البيانات.
- النماذج التمييزية تتعلم الاحتمالية المشروطة – p(y|x).
- النماذج التمييزية رخيصة حسابيًا مقارنة بالنماذج التوليدية.
- النماذج التمييزية مفيدة ل_tasks تعلم الآلة الموجهة.
- النماذج التمييزية أكثر متانة للقيم الشاذة مقارنة بالنماذج التوليدية.
- النماذج التمييزية أكثر متانة للقيم الشاذة مقارنة بالنماذج التوليدية.
سنستكشف الآن بعض الأمثلة المختلفة على النماذج التوليدية والتمييزية.
أمثلة على النماذج التوليدية
تحليل التمييز الخطي (LDA)
نماذج LDA تعمل عن طريق تقدير التباين ومتوسط البيانات لكل فئة في مجموعة البيانات. بعد حساب المتوسط والتباين لكل فئة، يمكن إجراء التنبؤات عن طريق تقدير الاحتمال أن مجموعة معينة من الإدخالات تنتمي إلى فئة معينة.
نماذج ماركوف المخفية
يمكن اعتبار سلاسل ماركوف على أنها رسوم بيانية مع احتمالات تشير إلى مدى احتمال الانتقال من نقطة إلى أخرى في السلسلة، أو “حالة” إلى حالة أخرى. تستخدم سلاسل ماركوف لتحديد احتمال الانتقال من حالة j إلى حالة i، والتي يمكن تمثيلها بواسطة p(i,j). هذا هو الاحتمال المشترك المذكور أعلاه. نموذج ماركوف الخفي هو حيث يتم استخدام سلسلة ماركوف غير مرئية وغير قابلة للرصد. يتم إعطاء إدخالات البيانات إلى النموذج، ويتم استخدام الاحتمالات للحالة الحالية والفترة السابقة لحساب النتيجة الأكثر احتمالا.
الشبكات البايزية
الشبكات البايزية هي نوع من النماذج البيانية الاحتمالية. إنها تمثل الاعتماد المشروط بين المتغيرات، كما تمثله граф موجه غير دوري. في شبكة بايزية، تمثل كل حافة في الرسم البياني اعتمادًا مشروطًا، ويتوافق كل عقد مع متغير فريد. يمكن استخدام الاستقلالية المشروطة للعلاقات الفريدة في الرسم البياني لتحديد توزيع مشترك للمتغيرات وحساب الاحتمال المشترك. وبعبارة أخرى، شبكة بايزية تلتقط مجموعة فرعية من العلاقات المستقلة في توزيع احتمالي مشترك.
مرة واحدة يتم إنشاء شبكة بايزية وتهيئتها بشكل صحيح، مع متغيرات عشوائية، علاقات مشروطة، وتوزيعات احتمالية معروفة، يمكن استخدامها لتقدير احتمال الأحداث أو النتائج.
أحد أنواع الشبكات البايزية الأكثر استخدامًا هو نموذج بايز البسيط. نموذج بايز البسيط يتعامل مع تحدي حساب الاحتمال لمجموعات بيانات تحتوي على العديد من المعاملات / المتغيرات عن طريق معامل جميع الميزات على أنها مستقلة عن بعضها البعض.
أمثلة على النماذج التمييزية
آلات الدعم النوعي
آلات الدعم النوعي تعمل عن طريق رسم حدود القرار بين النقاط البيانية، وfinding الحد الأقصى الذي يفصل أفضل الفئات في مجموعة البيانات. خوارزمية SVM ترسم خطوطًا أو гиперпلاينز تفصل النقاط، بالنسبة لمساحات ثنائية الأبعاد وثلاثية الأبعاد على التوالي. تسعى SVM إلى العثور على الخط / гиперпلاين الذي يفصل الفئات بشكل أفضل عن طريق محاولة تحقيق أقصى هامش، أو المسافة بين الخط / гиперпلاين والنقاط القريبة. يمكن أيضًا استخدام نماذج SVM على مجموعات بيانات غير قابلة للفصل خطيًا باستخدام “حيلة النواة” لتحديد حدود القرار غير الخطية.
الانحدار اللوجستي
الانحدار اللوجستي هو خوارزمية يستخدم دالة لوجستية (لوج-أودز) لتحديد احتمال أن يكون إدخال معين في واحدة من حالتين. يتم استخدام دالة سيجمويد “لضغط” الاحتمال نحو 0 أو 1، صحيح أو خطأ. الاحتمالات أكبر من 0.50 يُفترض أنها فئة 1، في حين أن الاحتمالات 0.49 أو أقل يُفترض أنها 0. لذلك، يتم استخدام الانحدار اللوجستي بشكل عام في مشاكل التصنيف الثنائية. ومع ذلك، يمكن تطبيق الانحدار اللوجستي على مشاكل التصنيف المتعددة عن طريق استخدام نهج “واحد مقابل جميع”، وإنشاء نموذج تصنيف ثنائي للفئة كلها وتحديد الاحتمال أن يكون مثال معين هو فئة هدف أو فئة أخرى في مجموعة البيانات.
شجرة القرار
يمكن اعتبار شجرة القرار على أنها تعمل عن طريق تقسيم مجموعة البيانات إلى أقسام أصغر وأصغر، وعندما لا يمكن تقسيم الأقسام إلى أقسام أصغر، النتيجة هي شجرة مع عقد وورقة. العقد في شجرة القرار هي حيث يتم اتخاذ القرارات حول النقاط البيانية باستخدام معايير تصفية مختلفة. الأوراق في شجرة القرار هي النقاط البيانية التي تم تصنيفها. يمكن للخوارزميات شجرة القرار التعامل مع البيانات العددية والفئوية، وتعتمد الانقسامات في الشجرة على متغيرات / ميزات معينة.
الغابات العشوائية
نموذج الغابات العشوائية هو في الأساس مجرد مجموعة من أشجار القرار حيث يتم ت平均 التنبؤات الفردية للأشجار لتحقيق قرار نهائي. يختار خوارزمية الغابات العشوائية الملاحظات والميزات بشكل عشوائي، وينشئ الأشجار الفردية بناءً على هذه الانتخابات.
هذا المقال التعليمي سوف يستكشف كيفية إنشاء مخطط صندوق في Matplotlib. مخططات الصندوق تستخدم لتمثيل إحصائيات ملخص لمجموعة بيانات، وعرض سمات التوزيع مثل مدى البيانات وتوزيعها.












