رطم ما هي مصفوفة الارتباك؟ - اتحدوا
اتصل بنا للحصول على مزيد من المعلومات
دروس متقدمة في الذكاء الاصطناعي:

منظمة العفو الدولية 101

ما هي مصفوفة الارتباك؟

mm
تحديث on

واحدة من أقوى الأدوات التحليلية في التعلم الآلي وعلوم البيانات في مصفوفة الارتباك. مصفوفة الارتباك قادرة على إعطاء الباحثين معلومات مفصلة حول كيفية أداء مصنف التعلم الآلي فيما يتعلق بالفئات المستهدفة في مجموعة البيانات. ستوضح مصفوفة الارتباك أمثلة العرض التي تم تصنيفها بشكل صحيح مقابل الأمثلة المصنفة بشكل خاطئ. دعونا نلقي نظرة أعمق على كيفية بناء مصفوفة الارتباك وكيف يمكن تفسيرها.

ما هي مصفوفة الارتباك؟

لنبدأ بإعطاء تعريف بسيط لمصفوفة الارتباك. مصفوفة الارتباك هي أداة تحليلات تنبؤية. على وجه التحديد ، هو جدول يعرض القيم الفعلية ويقارنها مع القيم المتوقعة للنموذج. في سياق التعلم الآلي ، يتم استخدام مصفوفة الارتباك كمقياس لتحليل كيفية أداء مصنف التعلم الآلي على مجموعة البيانات. تنشئ مصفوفة الارتباك تصورًا لمقاييس مثل الدقة والدقة والنوعية والتذكر.

السبب في أن مصفوفة الارتباك مفيدة بشكل خاص هو أنه على عكس الأنواع الأخرى من مقاييس التصنيف مثل الدقة البسيطة ، فإن مصفوفة الارتباك تولد صورة أكثر اكتمالاً عن كيفية أداء النموذج. يمكن أن يؤدي استخدام مقياس مثل الدقة فقط إلى حالة يكون فيها النموذج يخطئ في تحديد فئة واحدة بشكل كامل ومتسق ، ولكنه يمر دون أن يلاحظه أحد لأن الأداء في المتوسط ​​جيد. وفي الوقت نفسه ، مصفوفة الارتباك يعطي مقارنة بين القيم المختلفة مثل السلبيات الكاذبة والسلبيات الحقيقية والإيجابيات الكاذبة والإيجابيات الحقيقية.

دعنا نحدد المقاييس المختلفة التي تمثلها مصفوفة الارتباك.

أذكر في مصفوفة الارتباك

التذكر هو عدد الأمثلة الإيجابية حقًا مقسومًا على عدد الأمثلة السلبية الكاذبة وإجمالي الأمثلة الإيجابية. بمعنى آخر ، يمثل الاستدعاء نسبة الأمثلة الإيجابية الحقيقية التي صنفها نموذج التعلم الآلي. يتم تقديم الاستدعاء كنسبة مئوية من الأمثلة الإيجابية التي تمكن النموذج من تصنيفها من بين جميع الأمثلة الإيجابية الموجودة في مجموعة البيانات. يمكن أيضًا الإشارة إلى هذه القيمة باسم "معدل الوصول" ، والقيمة ذات الصلة هي "حساسية"، الذي يصف احتمالية الاسترجاع ، أو معدل التنبؤات الإيجابية الحقيقية.

دقة في مصفوفة الارتباك

مثل الاسترجاع ، الدقة هي القيمة التي تتبع أداء النموذج من حيث تصنيف المثال الإيجابي. على عكس الاسترجاع ، فإن الدقة معنية بعدد الأمثلة التي تم تصنيفها على أنها إيجابية كانت إيجابية حقًا. لحساب هذا ، يتم تقسيم عدد الأمثلة الإيجابية الحقيقية على عدد الأمثلة الإيجابية الخاطئة بالإضافة إلى الإيجابيات الحقيقية.

للتمييز بين استدعاء ودقة أوضح، تهدف الدقة إلى معرفة النسبة المئوية لجميع الأمثلة التي تم تصنيفها إيجابية والتي كانت إيجابية حقًا ، بينما يتتبع الاسترجاع النسبة المئوية لجميع الأمثلة الإيجابية الحقيقية التي يمكن أن يتعرف عليها النموذج.

النوعية في مصفوفة الارتباك

في حين أن الاسترجاع والدقة هما قيمتان تتبعان الأمثلة الإيجابية والمعدل الإيجابي الحقيقي ، النوعية يحدد المعدل السلبي الحقيقي أو عدد الأمثلة التي حددها النموذج على أنها سلبية والتي كانت سلبية حقًا. يتم حساب ذلك بأخذ عدد من الأمثلة المصنفة على أنها سلبية وقسمتها على عدد الأمثلة الإيجابية الكاذبة جنبًا إلى جنب مع الأمثلة السلبية الحقيقية.

جعل الشعور بمصفوفة الارتباك

الصورة: Jackverr via Wikimedia Commons، (https://commons.wikimedia.org/wiki/File:ConfusionMatrix.png)، CC BY SA 3.0

مثال على مصفوفة الارتباك

بعد تحديد المصطلحات الضرورية مثل الدقة والتذكر والحساسية والخصوصية ، يمكننا فحص كيفية تمثيل هذه القيم المختلفة داخل مصفوفة الارتباك. يتم إنشاء مصفوفة الارتباك في حالات التصنيف ، والتي تنطبق عندما يكون هناك فئتان أو أكثر. يمكن أن تكون مصفوفة الارتباك التي تم إنشاؤها طويلة وواسعة كما هو ضروري ، مع الاحتفاظ بأي عدد مرغوب من الفئات ، ولكن لأغراض البساطة ، سنقوم بفحص مصفوفة تشويش 2 × 2 لمهمة تصنيف ثنائي.

كمثال ، افترض أنه يتم استخدام المصنف لتحديد ما إذا كان المريض يعاني من مرض أم لا. سيتم إدخال الميزات في المصنف ، وسيرجع المصنف أحد تصنيفين مختلفين - إما أن المريض ليس مصابًا بالمرض أو أنه مصاب به.

لنبدأ بالجانب الأيسر من المصفوفة. يمثل الجانب الأيسر من مصفوفة الارتباك التوقعات التي قدمها المصنف للفئات الفردية. سيكون لمهمة التصنيف الثنائي صفان هنا. فيما يتعلق بالجزء العلوي من المصفوفة ، فإنه يتتبع القيم الحقيقية ، تسميات الفئة الفعلية ، لمثيلات البيانات.

يمكن تفسير مصفوفة الارتباك عن طريق فحص مكان تقاطع الصفوف والأعمدة. تحقق من تنبؤات النموذج مقابل الملصقات الحقيقية للنموذج. في هذه الحالة ، توجد قيم الإيجابيات الحقيقية ، وهي عدد التنبؤات الإيجابية الصحيحة ، في الزاوية اليسرى العليا. تم العثور على الإيجابيات الخاطئة في الزاوية اليمنى العليا ، حيث تكون الأمثلة سلبية بالفعل ولكن المصنف أشار إليها على أنها إيجابية.

تعرض الزاوية اليسرى السفلية للشبكة الحالات التي قام المصنف بوضع علامة عليها على أنها سلبية ولكنها كانت إيجابية حقًا. أخيرًا ، الزاوية اليمنى السفلية من مصفوفة الارتباك هي المكان الذي توجد فيه القيم السلبية الحقيقية ، أو حيث توجد الأمثلة الخاطئة حقًا.

عندما تحتوي مجموعة البيانات على أكثر من فئتين ، فإن المصفوفة تنمو حسب تلك الفئات العديدة. على سبيل المثال ، إذا كانت هناك ثلاث فئات ، فإن المصفوفة ستكون مصفوفة 3 × 3. بغض النظر عن حجم مصفوفة الارتباك ، فإن طريقة تفسيرها هي نفسها تمامًا. يحتوي الجانب الأيسر على القيم المتوقعة ويتم تشغيل تسميات الفئات الفعلية عبر الجزء العلوي. الحالات التي تنبأ بها المصنف بشكل صحيح تعمل بشكل قطري من أعلى اليسار إلى أسفل اليمين. من خلال النظر إلى المصفوفة ، يمكنك تمييز المقاييس التنبؤية الأربعة التي تمت مناقشتها أعلاه.

على سبيل المثال ، يمكنك حساب الاسترجاع عن طريق أخذ الإيجابيات الحقيقية والسلبيات الخاطئة ، وإضافتها معًا ، وتقسيمها على عدد الأمثلة الإيجابية الحقيقية. وفي الوقت نفسه ، يمكن حساب الدقة من خلال الجمع بين الإيجابيات الخاطئة والإيجابيات الحقيقية ، ثم قسمة القيمة على العدد الإجمالي للإيجابيات الحقيقية.

بينما يمكن للمرء قضاء بعض الوقت في حساب المقاييس يدويًا مثل الدقة والتذكر والخصوصية ، فإن هذه المقاييس شائعة الاستخدام لدرجة أن معظم مكتبات التعلم الآلي لديها طرق لعرضها. على سبيل المثال ، لدى Scikit-Learn for Python وظيفة تنشئ مصفوفة ارتباك.

Blogger والمبرمج مع تخصصات في تعلم آلة و تعلم عميق المواضيع. يأمل دانيال في مساعدة الآخرين على استخدام قوة الذكاء الاصطناعي من أجل الصالح الاجتماعي.