رطم ما هي آلات المتجهات الداعمة؟ - اتحدوا
اتصل بنا للحصول على مزيد من المعلومات
دروس متقدمة في الذكاء الاصطناعي:

منظمة العفو الدولية 101

ما هي آلات المتجهات الداعمة؟

mm
تحديث on

ما هي آلات المتجهات الداعمة؟

تعد آلات المتجهات الداعمة أحد أنواع مصنفات التعلم الآلي، ويمكن القول إنها أحد أكثر أنواع المصنفات شيوعًا. تعد أجهزة المتجهات الداعمة مفيدة بشكل خاص في مهام التنبؤ العددي والتصنيف والتعرف على الأنماط.

تعمل آلات ناقلات الدعم عن طريق رسم حدود القرار بين نقاط البيانات ، بهدف الوصول إلى حدود القرار التي تفصل نقاط البيانات بشكل أفضل إلى فئات (أو الأكثر قابلية للتعميم). الهدف عند استخدام آلة متجه الدعم هو أن تكون حدود القرار بين النقاط كبيرة بقدر الإمكان بحيث يتم تكبير المسافة بين أي نقطة بيانات معينة وخط الحدود. هذا شرح سريع لكيفية القيام بذلك دعم آلات المتجهات (SVMs) ولكن لنأخذ بعض الوقت للتعمق أكثر في كيفية عمل SVMs وفهم المنطق الكامن وراء عملها.

الهدف من دعم آلات المتجهات

تخيل رسمًا بيانيًا يحتوي على عدد من نقاط البيانات ، استنادًا إلى الميزات المحددة بواسطة محوري "س" و "ص". يمكن تقسيم نقاط البيانات على الرسم البياني بشكل فضفاض إلى مجموعتين مختلفتين ، وتشير المجموعة التي تنتمي إليها نقطة البيانات إلى فئة نقطة البيانات. افترض الآن أننا نريد رسم خط أسفل الرسم البياني الذي يفصل بين الفئتين عن بعضهما البعض ، مع وجود جميع نقاط البيانات في فئة واحدة على جانب واحد من الخط وجميع نقاط البيانات تنتمي إلى فئة أخرى موجودة على الجانب الآخر من الخط. يُعرف هذا الخط الفاصل بالمستوى الفائق.

يمكنك التفكير في آلة ناقلات الدعم على أنها إنشاء "طرق" في جميع أنحاء المدينة ، وفصل المدينة إلى أحياء على جانبي الطريق. تنتمي جميع المباني (نقاط البيانات) الموجودة على جانب واحد من الطريق إلى منطقة واحدة.

الهدف من آلة متجه الدعم ليس فقط رسم المخططات الفائقة وتقسيم نقاط البيانات ، ولكن لرسم المستوى الفائق نقاط البيانات الفاصلة مع أكبر هامش ، أو مع أكبر مساحة بين الخط الفاصل وأي نقطة بيانات معينة. بالعودة إلى استعارة "الطرق" ، إذا كان مخطط المدينة يرسم خططًا لطريق سريع ، فإنه لا يريد أن يكون الطريق السريع قريبًا جدًا من المنازل أو المباني الأخرى. كلما زاد الهامش بين الطريق السريع والمباني على كلا الجانبين ، كان ذلك أفضل. وكلما زاد هذا الهامش ، زادت "ثقة" المصنف في تنبؤاته. في حالة التصنيف الثنائي ، فإن رسم المستوى الفائق الصحيح يعني اختيار المستوى الفائق الموجود في منتصف الفئتين المختلفتين. إذا كانت حدود القرار / المستوى الفائق بعيدًا عن فئة واحدة ، فستكون أقرب إلى فئة أخرى. لذلك ، يجب أن توازن الطائرة الفائقة الهامش بين الفئتين المختلفتين.

حساب المستوى الفائق الفاصل

إذن ، كيف تحدد آلة متجه الدعم أفضل حدود الفصل بين المستوى الفائق / حدود القرار؟ يتم تحقيق ذلك عن طريق حساب المستويات الفائقة المحتملة باستخدام صيغة رياضية. لن نغطي صيغة حساب المستويات الفائقة بتفصيل شديد، ولكن الخط محسوب بصيغة الميل / الخط الشهيرة:

ص = الفأس + ب

وفي الوقت نفسه ، تتكون الخطوط من نقاط ، مما يعني أنه يمكن وصف أي مستوى فائق على النحو التالي: مجموعة النقاط التي تعمل بالتوازي مع المستوى الفائق المقترح ، على النحو الذي تحدده أوزان النموذج التي تحدد مجموعة الميزات المعدلة بواسطة إزاحة / انحياز محدد ("د").

ترسم SVMs العديد من المخططات الفوقية. على سبيل المثال ، يعتبر خط الحدود مستويًا مفرطًا واحدًا ، لكن نقاط البيانات التي يعتبرها المصنف موجودة أيضًا على المستويات الفائقة. يتم تحديد قيم x بناءً على الميزات الموجودة في مجموعة البيانات. على سبيل المثال ، إذا كانت لديك مجموعة بيانات بارتفاعات وأوزان العديد من الأشخاص ، فستكون ميزتا "الطول" و "الوزن" هي السمات المستخدمة لحساب "X". تُحسب الهوامش بين المستوي الفائق المقترح ومختلف "نواقل الدعم" (نقاط البيانات) الموجودة على جانبي المستوى الفائق الفاصل بالصيغة التالية:

W * X - ب

بينما يمكنك قراءة المزيد عن الرياضيات الكامنة وراء SVMs ، إذا كنت تبحث عن فهم أكثر سهولة لها ، فاعلم فقط أن الهدف هو زيادة المسافة بين الخط الفائق / الحد الفاصل المقترح والطبقات الفائقة الأخرى التي تعمل بالتوازي معها ( والتي توجد عليها نقاط البيانات).

الصورة: ZackWeinberg عبر Wikimedia Commons، CC BY SA 3.0 (https://commons.wikimedia.org/wiki/File:Svm_separating_hyperplanes_(SVG).svg)

تصنيف متعدد الطبقات

تنطبق العملية الموضحة حتى الآن على مهام التصنيف الثنائي. ومع ذلك ، يمكن أيضًا استخدام مصنفات SVM لمهام التصنيف غير الثنائية. عند إجراء تصنيف SVM على مجموعة بيانات تحتوي على ثلاثة فئات أو أكثر ، يتم استخدام المزيد من خطوط الحدود. على سبيل المثال ، إذا كانت مهمة التصنيف تحتوي على ثلاث فئات بدلاً من اثنين ، فسيتم استخدام خطين فاصلين لتقسيم نقاط البيانات إلى فئات وستقع المنطقة التي تتكون من فئة واحدة بين خطين فاصلين بدلاً من خط واحد. بدلاً من مجرد حساب المسافة بين فئتين فقط وحدود القرار ، يجب على المصنف الآن أن يأخذ في الاعتبار الهوامش بين حدود القرار والفئات المتعددة داخل مجموعة البيانات.

الفصل غير الخطي

تنطبق العملية الموضحة أعلاه على الحالات التي تكون فيها البيانات قابلة للفصل خطيًا. لاحظ أنه ، في الواقع ، لا يمكن فصل مجموعات البيانات بشكل خطي تمامًا ، مما يعني أنه عند استخدام مصنف SVM ، ستحتاج غالبًا إلى استخدامه طريقتان مختلفتان: الهامش الناعم وحيل النواة. ضع في اعتبارك موقفًا يتم فيه خلط نقاط البيانات من فئات مختلفة معًا ، مع وجود بعض الحالات التي تنتمي إلى فئة واحدة في "مجموعة" فئة أخرى. كيف يمكنك جعل المصنف يتعامل مع هذه الحالات؟

أحد الأساليب التي يمكن استخدامها للتعامل مع مجموعات البيانات غير القابلة للفصل خطيًا هو تطبيق مصنف SVM "الهامش الناعم". يعمل مصنف الهامش الناعم عن طريق قبول بعض نقاط البيانات المصنفة بشكل خاطئ. سيحاول رسم خط يفصل بشكل أفضل مجموعات نقاط البيانات عن بعضها البعض ، لأنها تحتوي على غالبية المثيلات التي تنتمي إلى الفئات الخاصة بكل منها. يحاول مصنف SVM ذو الهامش الناعم إنشاء خط فاصل يوازن بين مطلب المصنف: الدقة والهامش. سيحاول تقليل سوء التصنيف مع تعظيم الهامش أيضًا.

يمكن ضبط تفاوت SVM للخطأ من خلال معالجة معلمة تشعبية تسمى "C". ضوابط القيمة C كم عدد نواقل الدعم التي يأخذها المصنف في الاعتبار عند رسم حدود القرار. قيمة C هي عقوبة يتم تطبيقها على أخطاء التصنيف ، مما يعني أنه كلما زادت قيمة C كلما قل عدد متجهات الدعم التي يأخذها المصنف في الاعتبار وكان الهامش أضيق.

تخدع النواة البيانات وتحولها بطريقة غير خطية. الصورة: Shiyu Ju عبر Wikmedia Commons، CC BY SA 4.0 (https://commons.wikimedia.org/wiki/File:Kernel_trick_idea.svg)

تعمل Kernel Trick من خلال تطبيق تحويلات غير خطية على الميزات الموجودة في مجموعة البيانات. تأخذ Kernel Trick الميزات الموجودة في مجموعة البيانات وتنشئ ميزات جديدة من خلال تطبيق الوظائف الرياضية غير الخطية. ما ينتج عن تطبيق هذه التحولات غير الخطية هو حدود قرار غير خطية. نظرًا لأن مصنف SVM لم يعد مقيدًا برسم حدود القرار الخطي ، فيمكنه البدء في رسم حدود قرار منحنية تغلف بشكل أفضل التوزيع الحقيقي لمتجهات الدعم وتقليل التصنيفات الخاطئة إلى الحد الأدنى. اثنان من أكثر نواة SVM غير الخطية شيوعًا هما Radial Basis Function و Polynomial. تُنشئ وظيفة كثير الحدود مجموعات متعددة الحدود لجميع الميزات الموجودة ، بينما تنشئ وظيفة Radial Basis ميزات جديدة عن طريق قياس المسافة بين نقطة مركزية / نقاط لجميع النقاط الأخرى.

Blogger والمبرمج مع تخصصات في تعلم آلة و تعلم عميق المواضيع. يأمل دانيال في مساعدة الآخرين على استخدام قوة الذكاء الاصطناعي من أجل الصالح الاجتماعي.