ต้นขั้ว เมทริกซ์ความสับสนคืออะไร? - Unite.AI
เชื่อมต่อกับเรา
มาสเตอร์คลาส AI:

AI 101

เมทริกซ์ความสับสนคืออะไร?

mm
วันที่อัพเดท on

หนึ่งในเครื่องมือวิเคราะห์ที่ทรงพลังที่สุดในการเรียนรู้ของเครื่องและวิทยาศาสตร์ข้อมูล เมทริกซ์ความสับสน. เมทริกซ์ความสับสนสามารถให้ข้อมูลโดยละเอียดแก่นักวิจัยเกี่ยวกับการทำงานของตัวแยกประเภทการเรียนรู้ของเครื่องเทียบกับคลาสเป้าหมายในชุดข้อมูล เมทริกซ์ความสับสนจะแสดงตัวอย่างการแสดงผลที่ได้รับการจำแนกอย่างเหมาะสมกับตัวอย่างที่จัดประเภทไม่ถูกต้อง เรามาดูรายละเอียดเชิงลึกว่าเมทริกซ์ความสับสนมีโครงสร้างอย่างไร และจะตีความได้อย่างไร

เมทริกซ์ความสับสนคืออะไร?

เริ่มต้นด้วยการให้คำจำกัดความง่ายๆ ของเมทริกซ์ความสับสน เมทริกซ์ความสับสนเป็นเครื่องมือวิเคราะห์เชิงทำนาย โดยเฉพาะอย่างยิ่ง เป็นตารางที่แสดงและเปรียบเทียบค่าจริงกับค่าที่คาดการณ์ของแบบจำลอง ภายในบริบทของแมชชีนเลิร์นนิง เมทริกซ์ความสับสนถูกใช้เป็นเมตริกเพื่อวิเคราะห์ว่าตัวแยกประเภทแมชชีนเลิร์นนิงทำงานอย่างไรในชุดข้อมูล เมทริกซ์ความสับสนสร้างการแสดงภาพเมตริกต่างๆ เช่น ความแม่นยำ ความแม่นยำ ความเฉพาะเจาะจง และการเรียกคืน

เหตุผลที่เมทริกซ์ความสับสนมีประโยชน์อย่างยิ่งคือเมทริกซ์ความสับสนสร้างภาพที่สมบูรณ์ยิ่งขึ้นของวิธีการทำงานของแบบจำลอง ซึ่งแตกต่างจากเมตริกการจัดหมวดหมู่ประเภทอื่นๆ เช่น ความแม่นยำอย่างง่าย การใช้เมตริกเช่นความแม่นยำเท่านั้นที่สามารถนำไปสู่สถานการณ์ที่แบบจำลองระบุคลาสหนึ่งผิดอย่างสมบูรณ์และสม่ำเสมอ แต่ไม่มีใครสังเกตเห็นเพราะประสิทธิภาพโดยเฉลี่ยอยู่ในเกณฑ์ดี ในขณะเดียวกัน เมทริกซ์ความสับสน ให้การเปรียบเทียบค่าต่างๆ เช่น False Negatives True Negatives False Positives และ True Positives

มากำหนดเมตริกต่างๆ ที่เมทริกซ์ความสับสนเป็นตัวแทนกัน

เรียกคืนในเมทริกซ์ความสับสน

การเรียกคืนคือจำนวนตัวอย่างที่เป็นบวกอย่างแท้จริง หารด้วยจำนวนตัวอย่างที่เป็นเท็จ-เป็นลบ และตัวอย่างที่เป็นบวกทั้งหมด กล่าวอีกนัยหนึ่ง การเรียกคืนเป็นตัวแทนของสัดส่วนตัวอย่างเชิงบวกที่แท้จริงที่โมเดลแมชชีนเลิร์นนิงจัดประเภทไว้ การเรียกคืนจะได้รับเป็นเปอร์เซ็นต์ของตัวอย่างเชิงบวกที่โมเดลสามารถจำแนกได้จากตัวอย่างเชิงบวกทั้งหมดที่มีอยู่ในชุดข้อมูล ค่านี้อาจเรียกว่า "อัตราการเข้าชม" และค่าที่เกี่ยวข้องคือ "ความไว” ซึ่งอธิบายถึงความเป็นไปได้ในการเรียกคืนหรืออัตราการคาดการณ์ในเชิงบวกอย่างแท้จริง

ความแม่นยำ ในเมทริกซ์ความสับสน

เช่นเดียวกับการเรียกคืน ความแม่นยำคือค่าที่ติดตามประสิทธิภาพของแบบจำลองในแง่ของการจัดประเภทตัวอย่างเชิงบวก ซึ่งแตกต่างจากการเรียกคืน ความแม่นยำนั้นเกี่ยวข้องกับจำนวนตัวอย่างที่โมเดลระบุว่าเป็นบวกนั้นเป็นบวกอย่างแท้จริง ในการคำนวณนี้ จำนวนตัวอย่างผลบวกจริงจะถูกหารด้วยจำนวนตัวอย่างผลบวกลวงบวกผลบวกจริง

เพื่อสร้างความแตกต่างระหว่าง การเรียกคืนและความแม่นยำที่ชัดเจนยิ่งขึ้นความแม่นยำมีจุดมุ่งหมายเพื่อหาเปอร์เซ็นต์ของตัวอย่างทั้งหมดที่ระบุว่าเป็นบวกซึ่งเป็นผลบวกอย่างแท้จริง ในขณะที่การเรียกคืนจะติดตามเปอร์เซ็นต์ของตัวอย่างที่เป็นบวกจริงทั้งหมดที่แบบจำลองสามารถจดจำได้

ความจำเพาะ ในเมทริกซ์ความสับสน

ในขณะที่การเรียกคืนและความแม่นยำเป็นค่าที่ติดตามตัวอย่างที่เป็นบวกและอัตราที่เป็นบวกจริง ความจำเพาะ ระบุจำนวนอัตราเชิงลบจริงหรือจำนวนตัวอย่างที่แบบจำลองกำหนดให้เป็นค่าลบที่เป็นค่าลบจริง ซึ่งคำนวณโดยนำจำนวนตัวอย่างที่จัดว่าเป็นค่าลบและหารด้วยจำนวนตัวอย่างที่บวกเท็จรวมกับตัวอย่างที่เป็นค่าลบจริง

สร้างความรู้สึกของเมทริกซ์ความสับสน

รูปภาพ: Jackverr ผ่าน Wikimedia Commons, (https://commons.wikimedia.org/wiki/File:ConfusionMatrix.png), CC BY SA 3.0

ตัวอย่างของเมทริกซ์ความสับสน

หลังจากนิยามคำศัพท์ที่จำเป็น เช่น ความแม่นยำ การเรียกคืน ความไว และความเฉพาะเจาะจงแล้ว เราสามารถตรวจสอบได้ว่าค่าต่างๆ เหล่านี้แสดงอยู่ในเมทริกซ์ความสับสนได้อย่างไร เมทริกซ์ความสับสนถูกสร้างขึ้นในกรณีของการจัดประเภท ใช้ได้เมื่อมีสองคลาสขึ้นไป เมทริกซ์ความสับสนที่สร้างขึ้นสามารถสูงและกว้างเท่าที่จำเป็น โดยมีจำนวนคลาสเท่าใดก็ได้ตามต้องการ แต่เพื่อความง่าย เราจะตรวจสอบเมทริกซ์ความสับสนแบบ 2 x 2 สำหรับงานจำแนกประเภทไบนารี

ตัวอย่างเช่น สมมติว่ามีการใช้ตัวแยกประเภทเพื่อระบุว่าผู้ป่วยมีโรคหรือไม่ คุณลักษณะต่างๆ จะถูกป้อนเข้าในลักษณนาม และลักษณนามจะส่งคืนการจำแนกประเภทหนึ่งจากสองประเภทที่แตกต่างกัน ไม่ว่าผู้ป่วยจะไม่เป็นโรคหรือไม่เป็นโรคก็ตาม

เริ่มจากด้านซ้ายมือของเมทริกซ์ ด้านซ้ายของเมทริกซ์ความสับสนแสดงถึงการคาดคะเนที่ลักษณนามทำขึ้นสำหรับแต่ละชั้นเรียน งานการจัดประเภทไบนารีจะมีสองแถวที่นี่ ส่วนด้านบนสุดของเมทริกซ์ จะติดตามค่าจริง ป้ายกำกับคลาสจริง ของอินสแตนซ์ข้อมูล

การตีความเมทริกซ์ความสับสนสามารถทำได้โดยการตรวจสอบว่าแถวและคอลัมน์ตัดกันที่ใด ตรวจสอบการคาดคะเนของโมเดลกับป้ายกำกับที่แท้จริงของโมเดล ในกรณีนี้ ค่า True Positives ซึ่งเป็นจำนวนของการคาดการณ์เชิงบวกที่ถูกต้องจะอยู่ที่มุมซ้ายบน พบผลบวกปลอมที่มุมบนขวา ซึ่งตัวอย่างเป็นจริงเป็นค่าลบ แต่ตัวแยกประเภทแท็กว่าเป็นค่าบวก

มุมล่างซ้ายของตารางแสดงตัวอย่างที่ตัวแยกประเภทได้แท็กเป็นค่าลบแต่เป็นค่าบวกอย่างแท้จริง สุดท้าย มุมขวาล่างของเมทริกซ์ความสับสนคือตำแหน่งที่พบค่า True Negative หรือตัวอย่างที่เป็นเท็จอย่างแท้จริง

เมื่อชุดข้อมูลมีคลาสมากกว่าสองคลาส เมทริกซ์จะเติบโตตามคลาสจำนวนมากนั้น ตัวอย่างเช่น ถ้ามี 3 คลาส เมทริกซ์จะเป็นเมทริกซ์ 3 x XNUMX โดยไม่คำนึงถึงขนาดของเมทริกซ์ความสับสน วิธีการตีความจะเหมือนกันทุกประการ ด้านซ้ายประกอบด้วยค่าที่คาดการณ์ไว้และป้ายชื่อคลาสจริงจะอยู่ด้านบนสุด กรณีที่ลักษณนามทำนายได้ถูกต้องจะทำงานในแนวทแยงมุมจากซ้ายบนไปขวาล่าง เมื่อดูที่เมทริกซ์ คุณจะแยกแยะเมตริกการคาดการณ์สี่รายการที่กล่าวถึงข้างต้นได้

ตัวอย่างเช่น คุณสามารถคำนวณการเรียกคืนได้โดยนำค่าบวกจริงและค่าลบเท็จมาบวกกันแล้วหารด้วยจำนวนตัวอย่างค่าบวกจริง ในขณะเดียวกัน ความแม่นยำสามารถคำนวณได้โดยการรวมผลบวกลวงเข้ากับผลบวกจริง จากนั้นหารค่าดังกล่าวเป็นจำนวนผลบวกจริงทั้งหมด

แม้ว่าเราอาจใช้เวลาในการคำนวณเมตริกต่างๆ ด้วยตนเอง เช่น ความแม่นยำ การเรียกคืน และความเฉพาะเจาะจง แต่เมตริกเหล่านี้มักจะใช้กันมากจนทำให้ไลบรารีการเรียนรู้ของเครื่องส่วนใหญ่มีวิธีการแสดงข้อมูลเหล่านี้ ตัวอย่างเช่น Scikit-learn สำหรับ Python มีฟังก์ชันสร้างเมทริกซ์ความสับสน

บล็อกเกอร์และโปรแกรมเมอร์ที่มีความเชี่ยวชาญด้าน เครื่องเรียนรู้ และ การเรียนรู้ลึก ๆ หัวข้อ Daniel หวังว่าจะช่วยให้ผู้อื่นใช้พลังของ AI เพื่อประโยชน์ทางสังคม