- คำศัพท์ (A ถึง D)
- การควบคุมความสามารถของ AI
- AIOps
- อัลบั้ม
- ประสิทธิภาพของสินทรัพย์
- ตัวเข้ารหัสอัตโนมัติ
- การขยายพันธุ์หลัง
- ทฤษฎีบทเบย์
- ข้อมูลขนาดใหญ่
- Chatbot: คู่มือสำหรับผู้เริ่มต้น
- การคิดเชิงคำนวณ
- วิสัยทัศน์คอมพิวเตอร์
- เมทริกซ์ความสับสน
- เครือข่ายประสาทเทียม
- cybersecurity
- ผ้าข้อมูล
- การเล่าเรื่องข้อมูล
- ข้อมูลวิทยาศาสตร์
- คลังข้อมูล
- ต้นไม้ตัดสินใจ
- Deepfakes
- การเรียนรู้ลึก ๆ
- การเรียนรู้การเสริมแรงเชิงลึก
- devops
- DevSecOps
- แบบจำลองการแพร่กระจาย
- ดิจิตอลแฝด
- การลดขนาด
- คำศัพท์ (E ถึง K)
- เอดจ์ไอ
- อารมณ์ AI
- การเรียนรู้ทั้งมวล
- การแฮ็กอย่างมีจริยธรรม
- ETL
- AI ที่อธิบายได้
- สหพันธ์การเรียนรู้
- ฟินอ๊อฟ
- กำเนิด AI
- เครือข่ายผู้ให้กำเนิด
- กำเนิดเทียบกับการเลือกปฏิบัติ
- ไล่โทนสี
- โคตรไล่ระดับ
- การเรียนรู้ไม่กี่ช็อต
- การจำแนกรูปภาพ
- การดำเนินงานด้านไอที (ITOps)
- ระบบอัตโนมัติของเหตุการณ์
- วิศวกรรมอิทธิพล
- K-หมายถึงการจัดกลุ่ม
- K-เพื่อนบ้านที่ใกล้ที่สุด
- คำศัพท์ (L ถึง Q)
- คำศัพท์ (R ถึง Z)
- การเรียนรู้เสริมแรง
- AI ที่มีความรับผิดชอบ
- อาร์แอลเอชเอฟ
- ระบบอัตโนมัติของกระบวนการหุ่นยนต์
- มีโครงสร้าง vs ไม่มีโครงสร้าง
- การวิเคราะห์ความเชื่อมั่น
- อยู่ภายใต้การดูแล vs ไม่ได้รับการดูแล
- สนับสนุนเครื่องเวกเตอร์
- ข้อมูลสังเคราะห์
- สื่อสังเคราะห์
- การจัดประเภทข้อความ
- TinyML
- ถ่ายทอดการเรียนรู้
- เครือข่ายประสาทหม้อแปลง
- การทดสอบของทัวริง
- การค้นหาความคล้ายคลึงกันของเวกเตอร์
AI 101
เมทริกซ์ความสับสนคืออะไร?
สารบัญ
หนึ่งในเครื่องมือวิเคราะห์ที่ทรงพลังที่สุดในการเรียนรู้ของเครื่องและวิทยาศาสตร์ข้อมูล เมทริกซ์ความสับสน. เมทริกซ์ความสับสนสามารถให้ข้อมูลโดยละเอียดแก่นักวิจัยเกี่ยวกับการทำงานของตัวแยกประเภทการเรียนรู้ของเครื่องเทียบกับคลาสเป้าหมายในชุดข้อมูล เมทริกซ์ความสับสนจะแสดงตัวอย่างการแสดงผลที่ได้รับการจำแนกอย่างเหมาะสมกับตัวอย่างที่จัดประเภทไม่ถูกต้อง เรามาดูรายละเอียดเชิงลึกว่าเมทริกซ์ความสับสนมีโครงสร้างอย่างไร และจะตีความได้อย่างไร
เมทริกซ์ความสับสนคืออะไร?
เริ่มต้นด้วยการให้คำจำกัดความง่ายๆ ของเมทริกซ์ความสับสน เมทริกซ์ความสับสนเป็นเครื่องมือวิเคราะห์เชิงทำนาย โดยเฉพาะอย่างยิ่ง เป็นตารางที่แสดงและเปรียบเทียบค่าจริงกับค่าที่คาดการณ์ของแบบจำลอง ภายในบริบทของแมชชีนเลิร์นนิง เมทริกซ์ความสับสนถูกใช้เป็นเมตริกเพื่อวิเคราะห์ว่าตัวแยกประเภทแมชชีนเลิร์นนิงทำงานอย่างไรในชุดข้อมูล เมทริกซ์ความสับสนสร้างการแสดงภาพเมตริกต่างๆ เช่น ความแม่นยำ ความแม่นยำ ความเฉพาะเจาะจง และการเรียกคืน
เหตุผลที่เมทริกซ์ความสับสนมีประโยชน์อย่างยิ่งคือเมทริกซ์ความสับสนสร้างภาพที่สมบูรณ์ยิ่งขึ้นของวิธีการทำงานของแบบจำลอง ซึ่งแตกต่างจากเมตริกการจัดหมวดหมู่ประเภทอื่นๆ เช่น ความแม่นยำอย่างง่าย การใช้เมตริกเช่นความแม่นยำเท่านั้นที่สามารถนำไปสู่สถานการณ์ที่แบบจำลองระบุคลาสหนึ่งผิดอย่างสมบูรณ์และสม่ำเสมอ แต่ไม่มีใครสังเกตเห็นเพราะประสิทธิภาพโดยเฉลี่ยอยู่ในเกณฑ์ดี ในขณะเดียวกัน เมทริกซ์ความสับสน ให้การเปรียบเทียบค่าต่างๆ เช่น False Negatives True Negatives False Positives และ True Positives
มากำหนดเมตริกต่างๆ ที่เมทริกซ์ความสับสนเป็นตัวแทนกัน
เรียกคืนในเมทริกซ์ความสับสน
การเรียกคืนคือจำนวนตัวอย่างที่เป็นบวกอย่างแท้จริง หารด้วยจำนวนตัวอย่างที่เป็นเท็จ-เป็นลบ และตัวอย่างที่เป็นบวกทั้งหมด กล่าวอีกนัยหนึ่ง การเรียกคืนเป็นตัวแทนของสัดส่วนตัวอย่างเชิงบวกที่แท้จริงที่โมเดลแมชชีนเลิร์นนิงจัดประเภทไว้ การเรียกคืนจะได้รับเป็นเปอร์เซ็นต์ของตัวอย่างเชิงบวกที่โมเดลสามารถจำแนกได้จากตัวอย่างเชิงบวกทั้งหมดที่มีอยู่ในชุดข้อมูล ค่านี้อาจเรียกว่า "อัตราการเข้าชม" และค่าที่เกี่ยวข้องคือ "ความไว” ซึ่งอธิบายถึงความเป็นไปได้ในการเรียกคืนหรืออัตราการคาดการณ์ในเชิงบวกอย่างแท้จริง
ความแม่นยำ ในเมทริกซ์ความสับสน
เช่นเดียวกับการเรียกคืน ความแม่นยำคือค่าที่ติดตามประสิทธิภาพของแบบจำลองในแง่ของการจัดประเภทตัวอย่างเชิงบวก ซึ่งแตกต่างจากการเรียกคืน ความแม่นยำนั้นเกี่ยวข้องกับจำนวนตัวอย่างที่โมเดลระบุว่าเป็นบวกนั้นเป็นบวกอย่างแท้จริง ในการคำนวณนี้ จำนวนตัวอย่างผลบวกจริงจะถูกหารด้วยจำนวนตัวอย่างผลบวกลวงบวกผลบวกจริง
เพื่อสร้างความแตกต่างระหว่าง การเรียกคืนและความแม่นยำที่ชัดเจนยิ่งขึ้นความแม่นยำมีจุดมุ่งหมายเพื่อหาเปอร์เซ็นต์ของตัวอย่างทั้งหมดที่ระบุว่าเป็นบวกซึ่งเป็นผลบวกอย่างแท้จริง ในขณะที่การเรียกคืนจะติดตามเปอร์เซ็นต์ของตัวอย่างที่เป็นบวกจริงทั้งหมดที่แบบจำลองสามารถจดจำได้
ความจำเพาะ ในเมทริกซ์ความสับสน
ในขณะที่การเรียกคืนและความแม่นยำเป็นค่าที่ติดตามตัวอย่างที่เป็นบวกและอัตราที่เป็นบวกจริง ความจำเพาะ ระบุจำนวนอัตราเชิงลบจริงหรือจำนวนตัวอย่างที่แบบจำลองกำหนดให้เป็นค่าลบที่เป็นค่าลบจริง ซึ่งคำนวณโดยนำจำนวนตัวอย่างที่จัดว่าเป็นค่าลบและหารด้วยจำนวนตัวอย่างที่บวกเท็จรวมกับตัวอย่างที่เป็นค่าลบจริง
สร้างความรู้สึกของเมทริกซ์ความสับสน
ตัวอย่างของเมทริกซ์ความสับสน
หลังจากนิยามคำศัพท์ที่จำเป็น เช่น ความแม่นยำ การเรียกคืน ความไว และความเฉพาะเจาะจงแล้ว เราสามารถตรวจสอบได้ว่าค่าต่างๆ เหล่านี้แสดงอยู่ในเมทริกซ์ความสับสนได้อย่างไร เมทริกซ์ความสับสนถูกสร้างขึ้นในกรณีของการจัดประเภท ใช้ได้เมื่อมีสองคลาสขึ้นไป เมทริกซ์ความสับสนที่สร้างขึ้นสามารถสูงและกว้างเท่าที่จำเป็น โดยมีจำนวนคลาสเท่าใดก็ได้ตามต้องการ แต่เพื่อความง่าย เราจะตรวจสอบเมทริกซ์ความสับสนแบบ 2 x 2 สำหรับงานจำแนกประเภทไบนารี
ตัวอย่างเช่น สมมติว่ามีการใช้ตัวแยกประเภทเพื่อระบุว่าผู้ป่วยมีโรคหรือไม่ คุณลักษณะต่างๆ จะถูกป้อนเข้าในลักษณนาม และลักษณนามจะส่งคืนการจำแนกประเภทหนึ่งจากสองประเภทที่แตกต่างกัน ไม่ว่าผู้ป่วยจะไม่เป็นโรคหรือไม่เป็นโรคก็ตาม
เริ่มจากด้านซ้ายมือของเมทริกซ์ ด้านซ้ายของเมทริกซ์ความสับสนแสดงถึงการคาดคะเนที่ลักษณนามทำขึ้นสำหรับแต่ละชั้นเรียน งานการจัดประเภทไบนารีจะมีสองแถวที่นี่ ส่วนด้านบนสุดของเมทริกซ์ จะติดตามค่าจริง ป้ายกำกับคลาสจริง ของอินสแตนซ์ข้อมูล
การตีความเมทริกซ์ความสับสนสามารถทำได้โดยการตรวจสอบว่าแถวและคอลัมน์ตัดกันที่ใด ตรวจสอบการคาดคะเนของโมเดลกับป้ายกำกับที่แท้จริงของโมเดล ในกรณีนี้ ค่า True Positives ซึ่งเป็นจำนวนของการคาดการณ์เชิงบวกที่ถูกต้องจะอยู่ที่มุมซ้ายบน พบผลบวกปลอมที่มุมบนขวา ซึ่งตัวอย่างเป็นจริงเป็นค่าลบ แต่ตัวแยกประเภทแท็กว่าเป็นค่าบวก
มุมล่างซ้ายของตารางแสดงตัวอย่างที่ตัวแยกประเภทได้แท็กเป็นค่าลบแต่เป็นค่าบวกอย่างแท้จริง สุดท้าย มุมขวาล่างของเมทริกซ์ความสับสนคือตำแหน่งที่พบค่า True Negative หรือตัวอย่างที่เป็นเท็จอย่างแท้จริง
เมื่อชุดข้อมูลมีคลาสมากกว่าสองคลาส เมทริกซ์จะเติบโตตามคลาสจำนวนมากนั้น ตัวอย่างเช่น ถ้ามี 3 คลาส เมทริกซ์จะเป็นเมทริกซ์ 3 x XNUMX โดยไม่คำนึงถึงขนาดของเมทริกซ์ความสับสน วิธีการตีความจะเหมือนกันทุกประการ ด้านซ้ายประกอบด้วยค่าที่คาดการณ์ไว้และป้ายชื่อคลาสจริงจะอยู่ด้านบนสุด กรณีที่ลักษณนามทำนายได้ถูกต้องจะทำงานในแนวทแยงมุมจากซ้ายบนไปขวาล่าง เมื่อดูที่เมทริกซ์ คุณจะแยกแยะเมตริกการคาดการณ์สี่รายการที่กล่าวถึงข้างต้นได้
ตัวอย่างเช่น คุณสามารถคำนวณการเรียกคืนได้โดยนำค่าบวกจริงและค่าลบเท็จมาบวกกันแล้วหารด้วยจำนวนตัวอย่างค่าบวกจริง ในขณะเดียวกัน ความแม่นยำสามารถคำนวณได้โดยการรวมผลบวกลวงเข้ากับผลบวกจริง จากนั้นหารค่าดังกล่าวเป็นจำนวนผลบวกจริงทั้งหมด
แม้ว่าเราอาจใช้เวลาในการคำนวณเมตริกต่างๆ ด้วยตนเอง เช่น ความแม่นยำ การเรียกคืน และความเฉพาะเจาะจง แต่เมตริกเหล่านี้มักจะใช้กันมากจนทำให้ไลบรารีการเรียนรู้ของเครื่องส่วนใหญ่มีวิธีการแสดงข้อมูลเหล่านี้ ตัวอย่างเช่น Scikit-learn สำหรับ Python มีฟังก์ชันสร้างเมทริกซ์ความสับสน
บล็อกเกอร์และโปรแกรมเมอร์ที่มีความเชี่ยวชาญด้าน เครื่องเรียนรู้ และ การเรียนรู้ลึก ๆ หัวข้อ Daniel หวังว่าจะช่วยให้ผู้อื่นใช้พลังของ AI เพื่อประโยชน์ทางสังคม