Connect with us

ما هو مصفوفة الارتباك؟

الذكاء الاصطناعي 101

ما هو مصفوفة الارتباك؟

mm

واحدة من أكثر الأدوات التحليلية قوة في تعلم الآلة وعلوم البيانات هي مصفوفة الارتباك.能够 تقديم معلومات مفصلة للباحثين حول أداء مصنف تعلم الآلة مع respecto إلى الفئات المستهدفة في مجموعة البيانات. ستظهر مصفوفة الارتباك أمثلة تم تصنيفها بشكل صحيح مقابل الأمثلة التي تم تصنيفها بشكل خاطئ. دعونا نلقي نظرة أعمق على كيفية بناء مصفوفة الارتباك وكيف يمكن تفسيرها.

ما هي مصفوفة الارتباك؟

دعونا نبدأ بتقديم تعريف بسيط لمصفوفة الارتباك. مصفوفة الارتباك هي أداة تحليلية للتنبؤ. تحديداً، هي جدول يعرض ويقارن القيم الفعلية مع القيم المتوقعة للنموذج. في سياق تعلم الآلة، يتم استخدام مصفوفة الارتباك كمعيار لتحليل أداء مصنف تعلم الآلة على مجموعة البيانات. تنتج مصفوفة الارتباك تمثيلاً لتقدير مقاييس مثل الدقة والprecision وال特يفية والاستدعاء.

السبب في أن مصفوفة الارتباك مفيدة بشكل خاص هو أنها، على عكس مقاييس التصنيف الأخرى مثل الدقة البسيطة، تنتج صورة أكثر كمالاً لأداء النموذج. استخدام مقياس مثل الدقة يمكن أن يؤدي إلى وضع حيث يتم تصنيف النموذج بشكل كامل ومستمر لفئة واحدة، ولكنها لا يتم ملاحظتها لأن الأداء العام جيد. في حين أن مصفوفة الارتباك تقدم مقارنة لقيم مختلفة مثل السلبيات الكاذبة والإيجابيات الكاذبة والسلبيات الصحيحة والإيجابيات الصحيحة.

دعونا نحدد المقاييس المختلفة التي تمثلها مصفوفة الارتباك.

الاستدعاء في مصفوفة الارتباك

الاستدعاء هو عدد الأمثلة الإيجابية الحقيقية مقسومًا على عدد الأمثلة السلبية الكاذبة والأمثلة الإيجابية الكلية. بعبارة أخرى، الاستدعاء يمثل نسبة الأمثلة الإيجابية الصحيحة التي صنفها نموذج تعلم الآلة. يتم تقديم الاستدعاء كنسبة مئوية للأمثلة الإيجابية التي كان نموذج تعلم الآلة قادرًا على تصنيفها من بين جميع الأمثلة الإيجابية الموجودة في مجموعة البيانات. قد يُطلق على هذه القيمة أيضًا اسم “معدل الضربة”، ويُطلق على قيمة ذات صلة “الحساسية”، والتي تصف احتمال الاستدعاء أو معدل التنبؤات الإيجابية الحقيقية.

الدقة في مصفوفة الارتباك

مثل الاستدعاء، الدقة هي قيمة تتبع أداء النموذج فيما يتعلق بتصنيف الأمثلة الإيجابية. على عكس الاستدعاء، الدقة تهتم بكم عدد الأمثلة التي صنفها النموذج على أنها إيجابية كانت في الواقع إيجابية. Чтобы حساب هذا، يتم تقسيم عدد الأمثلة الإيجابية الصحيحة على عدد الأمثلة الكاذبة الإيجابية بالإضافة إلى الأمثلة الإيجابية الصحيحة.

Để جعل الفرق بين الاستدعاء والدقة أوضح، الدقة تهدف إلى تحديد نسبة جميع الأمثلة التي تم تصنيفها على أنها إيجابية كانت في الواقع إيجابية، بينما يتبع الاستدعاء نسبة جميع الأمثلة الإيجابية الصحيحة التي كان نموذج تعلم الآلة قادرًا على التعرف عليها.

ال特يفية في مصفوفة الارتباك

في حين أن الاستدعاء والدقة هما قيمتان تتبعان الأمثلة الإيجابية ومعدل الإيجابيات الصحيح، ال特يفية تقيس معدل السلبيات الصحيح أو عدد الأمثلة التي صنفها النموذج على أنها سلبية كانت في الواقع سلبية. يتم حساب هذا من خلال أخذ عدد الأمثلة المصنفة على أنها سلبية وقسمته على عدد الأمثلة الكاذبة الإيجابية بالإضافة إلى الأمثلة السلبية الصحيحة.

فهم مصفوفة الارتباك

Photo: Jackverr via Wikimedia Commons, (https://commons.wikimedia.org/wiki/File:ConfusionMatrix.png), CC BY SA 3.0

مثال على مصفوفة الارتباك

بعد تعريف المصطلحات الضرورية مثل الدقة والاستدعاء والحساسية وال特يفية، يمكننا التحقق من كيفية تمثيل هذه القيم المختلفة في مصفوفة الارتباك. يتم إنشاء مصفوفة الارتباك في حالات التصنيف، عندما يكون هناك فئتان أو أكثر. يمكن أن يكون ارتفاع و عرض مصفوفة الارتباك حسب الرغبة، ويحمل أي عدد من الفئات المرغوب فيها، ولكن لأغراض البساطة، سننظر إلى مصفوفة الارتباك 2 × 2 لمهمة التصنيف الثنائي.

كما مثال، افترض أن مصنفًا يتم استخدامه لتحديد ما إذا كان المريض مصابًا بالمرض. ستتم تغذية الميزات إلى المصنف، وسيعيد المصنف واحدًا من两ي تصنيف مختلف – إما أن المريض لا يعاني من المرض أو يعاني منه.

دعونا نبدأ من الجانب الأيسر من المصفوفة. الجانب الأيسر من مصفوفة الارتباك يمثل التوقعات التي قدمها المصنف للفئات الفردية. مهمة التصنيف الثنائي سيكون لها صفان هنا. فيما يتعلق بالجزء العلوي من المصفوفة، فإنه يتبع القيم الحقيقية، العلامات الفعلية للفئات، لمثيلات البيانات.

يمكن تفسير مصفوفة الارتباك عن طريق فحص حيث تقاطع الصفوف والأعمدة. تحقق من توقعات النموذج مقابل العلامات الفعلية للنموذج. في هذه الحالة، تقع قيم الإيجابيات الصحيحة، أو عدد التنبؤات الإيجابية الصحيحة، في الزاوية العلوية اليسرى. يتم العثور على الإيجابيات الكاذبة في الزاوية العلوية اليمنى، حيث تكون الأمثلة في الواقع سلبية ولكن المصنف علقها بالعلامة الإيجابية.

الزاوية السفلية اليسرى من الشبكة تعرض الحالات التي علقها المصنف بالسلبية ولكنها كانت في الواقع إيجابية. أخيرًا، الزاوية السفلية اليمنى من مصفوفة الارتباك هي حيث تقع قيم السلبيات الصحيحة، أو حيث تكون الأمثلة السلبية الحقيقية.

عندما تحتوي مجموعة البيانات على أكثر من فئتين، تزيد المصفوفة بحجم هذه الفئات. على سبيل المثال، إذا كانت هناك ثلاث فئات، تكون المصفوفة مصفوفة 3 × 3. بغض النظر عن حجم مصفوفة الارتباك، طريقة تفسيرها هي نفسها تمامًا. يحتوي الجانب الأيسر على القيم المتوقعة، وتجري العلامات الفعلية للفئات عبر الجزء العلوي. تقع الحالات التي تنبأ بها المصنف بشكل صحيح بشكل قطري من الزاوية العلوية اليسرى إلى الزاوية السفلية اليمنى. من خلال النظر إلى المصفوفة يمكنك التمييز بين مقاييس التنبؤ الأربعة المذكورة أعلاه.

على سبيل المثال، يمكنك حساب الاستدعاء عن طريق أخذ الإيجابيات الصحيحة والسلبيات الكاذبة، وإضافتها معًا، وقسمتهما على عدد الإيجابيات الصحيحة. في حين يمكن حساب الدقة عن طريق الجمع بين الإيجابيات الكاذبة والإيجابيات الصحيحة، ثم قسمة القيمة على إجمالي عدد الإيجابيات الصحيحة.

في حين يمكن قضاء الوقت في حساب مقاييس مثل الدقة والاستدعاء وال特يفية يدوياً، هذه المقاييس شائعة الاستخدام لدرجة أن معظم مكتبات تعلم الآلة لديها طرق لعرضها. على سبيل المثال، يحتوي Scikit-learn على Python على وظيفة تنتج مصفوفة الارتباك.

مدون وبرمجي متخصص في مواضيع Machine Learning و Deep Learning. يأمل دانيال في مساعدة الآخرين على استخدام قوة الذكاء الاصطناعي من أجل الخير الاجتماعي.