სტუბი რა არის გაუგებრობის მატრიცა? - გაერთიანდი.აი
დაკავშირება ჩვენთან ერთად
AI მასტერკლასი:

AI 101

რა არის გაუგებრობის მატრიცა?

mm
განახლებულია on

ერთ-ერთი ყველაზე ძლიერი ანალიტიკური ინსტრუმენტი მანქანათმცოდნეობის და მონაცემთა მეცნიერების სფეროში დაბნეულობის მატრიცა. დაბნეულობის მატრიცას შეუძლია მკვლევარებს მიაწოდოს დეტალური ინფორმაცია იმის შესახებ, თუ როგორ მუშაობს მანქანური სწავლების კლასიფიკატორი მონაცემთა ნაკრების სამიზნე კლასებთან მიმართებაში. დაბნეულობის მატრიცა აჩვენებს მაგალითებს, რომლებიც სწორად იყო კლასიფიცირებული არასწორი კლასიფიცირებული მაგალითების წინააღმდეგ. მოდით უფრო ღრმად შევხედოთ, თუ როგორ არის აგებული დაბნეულობის მატრიცა და როგორ შეიძლება მისი ინტერპრეტაცია.

რა არის გაუგებრობის მატრიცა?

დავიწყოთ დაბნეულობის მატრიცის მარტივი განმარტებით. დაბნეულობის მატრიცა არის პროგნოზირებადი ანალიტიკური ინსტრუმენტი. კერძოდ, ეს არის ცხრილი, რომელიც აჩვენებს და ადარებს რეალურ მნიშვნელობებს მოდელის პროგნოზირებულ მნიშვნელობებთან. მანქანათმცოდნეობის კონტექსტში, დაბნეულობის მატრიცა გამოიყენება როგორც მეტრიკა იმის გასაანალიზებლად, თუ როგორ მუშაობს მანქანური სწავლების კლასიფიკატორი მონაცემთა ბაზაზე. დაბნეულობის მატრიცა წარმოქმნის ისეთი მეტრიკის ვიზუალიზაციას, როგორიცაა სიზუსტე, სიზუსტე, სპეციფიკა და გახსენება.

მიზეზი იმისა, რომ დაბნეულობის მატრიცა განსაკუთრებით სასარგებლოა, არის ის, რომ სხვა ტიპის კლასიფიკაციის მეტრიკებისგან განსხვავებით, როგორიცაა მარტივი სიზუსტე, დაბნეულობის მატრიცა წარმოქმნის უფრო სრულ სურათს იმის შესახებ, თუ როგორ შესრულდა მოდელი. მხოლოდ სიზუსტის მსგავსი მეტრიკის გამოყენებამ შეიძლება გამოიწვიოს სიტუაცია, როდესაც მოდელი მთლიანად და თანმიმდევრულად არასწორ იდენტიფიცირებს ერთ კლასს, მაგრამ ეს შეუმჩნეველი რჩება, რადგან საშუალო შესრულება კარგია. იმავდროულად, დაბნეულობის მატრიცა იძლევა სხვადასხვა მნიშვნელობების შედარებას როგორიცაა ცრუ ნეგატივი, ჭეშმარიტი ნეგატივი, ცრუ პოზიტივი და ჭეშმარიტი პოზიტივი.

მოდით განვსაზღვროთ სხვადასხვა მეტრიკა, რომელსაც წარმოადგენს დაბნეულობის მატრიცა.

გავიხსენოთ დაბნეულობის მატრიცაში

გახსენება არის ჭეშმარიტად დადებითი მაგალითების რაოდენობა გაყოფილი ცრუ-უარყოფითი მაგალითების რაოდენობაზე და მთლიან პოზიტიურ მაგალითებზე. სხვა სიტყვებით რომ ვთქვათ, გახსენება წარმოადგენს ჭეშმარიტი პოზიტიური მაგალითების პროპორციას, რომელიც კლასიფიცირებულია მანქანათმცოდნეობის მოდელმა. შეხსენება მოცემულია, როგორც დადებითი მაგალითების პროცენტული მაჩვენებელი, რომელიც მოდელმა შეძლო კლასიფიცირება ყველა პოზიტიური მაგალითიდან, რომელიც შეიცავს მონაცემთა ბაზას. ამ მნიშვნელობას ასევე შეიძლება ეწოდოს „ჰიტის მაჩვენებელი“ და შესაბამისი მნიშვნელობა არის „მგრძობიარობა”, რომელიც აღწერს გახსენების ალბათობას ან ჭეშმარიტი პოზიტიური პროგნოზების მაჩვენებელს.

სიზუსტე დაბნეულობის მატრიცაში

გახსენების მსგავსად, სიზუსტე არის მნიშვნელობა, რომელიც აკონტროლებს მოდელის მუშაობას დადებითი მაგალითის კლასიფიკაციის თვალსაზრისით. თუმცა, გახსენებისგან განსხვავებით, სიზუსტე ეხება იმ მაგალითებიდან, თუ რამდენი მაგალითია მოდელზე დასახელებული დადებითი იყო ნამდვილად დადებითი. ამის გამოსათვლელად, ჭეშმარიტი დადებითი მაგალითების რაოდენობა იყოფა ცრუ-დადებითი მაგალითების რაოდენობაზე პლუს ჭეშმარიტი დადებითი მაგალითები.

შორის განსხვავება გახსენება და სიზუსტე უფრო ნათელი, სიზუსტე მიზნად ისახავს გაერკვია პოზიტიური ყველა მაგალითის პროცენტი, რომელიც იყო ნამდვილად დადებითი, ხოლო გახსენება აკონტროლებს ყველა ჭეშმარიტი პოზიტიური მაგალითის პროცენტს, რომლის ამოცნობაც მოდელმა შეძლო.

სპეციფიკა დაბნეულობის მატრიცაში

მიუხედავად იმისა, რომ გახსენება და სიზუსტე არის მნიშვნელობები, რომლებიც აკონტროლებენ პოზიტიურ მაგალითებს და ნამდვილ პოზიტიურ მაჩვენებელს, სპეციფიკა რაოდენობრივად ასახავს ჭეშმარიტ ნეგატიურ მაჩვენებელს ან იმ მაგალითების რაოდენობას, რომლებიც მოდელიმ განსაზღვრა, როგორც უარყოფითი, რომლებიც ნამდვილად უარყოფითი იყო. ეს გამოითვლება უარყოფითად კლასიფიცირებული მაგალითების რაოდენობის აღებით და მათი გაყოფით ცრუ-დადებითი მაგალითების რაოდენობაზე, ჭეშმარიტ უარყოფით მაგალითებთან ერთად.

დაბნეულობის მატრიცის გაგება

ფოტო: Jackverr via Wikimedia Commons, (https://commons.wikimedia.org/wiki/File:ConfusionMatrix.png), CC BY SA 3.0

დაბნეულობის მატრიცის მაგალითი

აუცილებელი ტერმინების განსაზღვრის შემდეგ, როგორიცაა სიზუსტე, გახსენება, მგრძნობელობა და სპეციფიკა, ჩვენ შეგვიძლია გამოვიკვლიოთ, როგორ არის წარმოდგენილი ეს განსხვავებული მნიშვნელობები დაბნეულობის მატრიცაში. დაბნეულობის მატრიცა წარმოიქმნება კლასიფიკაციის შემთხვევაში, რომელიც გამოიყენება, როდესაც არსებობს ორი ან მეტი კლასი. დაბნეულობის მატრიცა, რომელიც გენერირებულია, შეიძლება იყოს ისეთივე მაღალი და ფართო, რამდენიც საჭიროა, და შეიცავს კლასების ნებისმიერ სასურველ რაოდენობას, მაგრამ სიმარტივის მიზნით, ჩვენ განვიხილავთ 2 x 2 გაუგებრობის მატრიცას ბინარული კლასიფიკაციის ამოცანისთვის.

მაგალითად, დავუშვათ, რომ კლასიფიკატორი გამოიყენება იმის დასადგენად, აქვს თუ არა პაციენტს დაავადება. მახასიათებლები შეიტანება კლასიფიკატორში და კლასიფიკატორი დააბრუნებს ორ სხვადასხვა კლასიფიკაციიდან ერთს - ან პაციენტს არ აქვს დაავადება, ან აქვს.

დავიწყოთ მატრიცის მარცხენა მხრიდან. დაბნეულობის მატრიცის მარცხენა მხარე წარმოადგენს პროგნოზებს, რომლებიც კლასიფიკატორმა გააკეთა ცალკეული კლასებისთვის. ორობითი კლასიფიკაციის ამოცანას ექნება ორი მწკრივი აქ. რაც შეეხება მატრიცის ზედა ნაწილს, ის აკონტროლებს მონაცემთა ინსტანციების ნამდვილ მნიშვნელობებს, რეალურ კლასის ეტიკეტებს.

დაბნეულობის მატრიცის ინტერპრეტაცია შეიძლება განხორციელდეს სტრიქონების და სვეტების გადაკვეთის ადგილის შემოწმებით. შეამოწმეთ მოდელის პროგნოზები მოდელის ნამდვილი ეტიკეტების წინააღმდეგ. ამ შემთხვევაში, True Positives მნიშვნელობები, სწორი დადებითი პროგნოზების რაოდენობა, მდებარეობს ზედა მარცხენა კუთხეში. ცრუ პოზიტივი გვხვდება ზედა მარჯვენა კუთხეში, სადაც მაგალითები რეალურად უარყოფითია, მაგრამ კლასიფიკატორმა მონიშნა ის, როგორც დადებითი.

ბადის ქვედა მარცხენა კუთხე აჩვენებს შემთხვევებს, რომლებიც კლასიფიკატორს აქვს მონიშნული, როგორც უარყოფითი, მაგრამ იყო ჭეშმარიტად დადებითი. დაბოლოს, დაბნეულობის მატრიცის ქვედა მარჯვენა კუთხე არის ის, სადაც არის ჭეშმარიტი უარყოფითი მნიშვნელობები, ან სადაც არის ჭეშმარიტად მცდარი მაგალითები.

როდესაც მონაცემთა ნაკრები შეიცავს ორზე მეტ კლასს, მატრიცა იზრდება ამდენი კლასით. მაგალითად, თუ სამი კლასია, მატრიცა იქნება 3 x 3 მატრიცა. დაბნეულობის მატრიცის ზომის მიუხედავად, მათი ინტერპრეტაციის მეთოდი ზუსტად იგივეა. მარცხენა მხარე შეიცავს პროგნოზირებულ მნიშვნელობებს და ფაქტობრივი კლასის ეტიკეტები გადის ზევით. შემთხვევები, რომლებიც კლასიფიკატორმა სწორად იწინასწარმეტყველა, დიაგონალზე გადის ზემოდან მარცხნიდან ქვედა მარჯვნივ. მატრიცის დათვალიერებით თქვენ შეგიძლიათ გაარკვიოთ ზემოთ განხილული ოთხი პროგნოზირებადი მეტრიკა.

მაგალითად, თქვენ შეგიძლიათ გამოთვალოთ გახსენება ჭეშმარიტი პოზიტიური და ცრუ უარყოფითის აღებით, მათი შეკრებით და ჭეშმარიტი დადებითი მაგალითების რაოდენობაზე გაყოფით. იმავდროულად, სიზუსტე შეიძლება გამოითვალოს ცრუ პოზიტივის ჭეშმარიტ პოზიტივთან შერწყმით, შემდეგ მნიშვნელობის დაყოფით ჭეშმარიტ პოზიტიურთა საერთო რაოდენობაზე.

მიუხედავად იმისა, რომ შეიძლება დრო დახარჯოს ისეთი მეტრიკის ხელით გამოთვლაზე, როგორიცაა სიზუსტე, გახსენება და სპეციფიკა, ეს მეტრიკა იმდენად ხშირად გამოიყენება, რომ მანქანათმცოდნეობის ბიბლიოთეკების უმეტესობას აქვს მათი ჩვენების მეთოდები. მაგალითად, Python-ისთვის Scikit-learn-ს აქვს ფუნქცია, რომელიც ქმნის დაბნეულობის მატრიცას.

ბლოგერი და პროგრამისტი სპეციალობით მანქანა სწავლა მდე ღრმა სწავლება თემები. დანიელი იმედოვნებს, რომ დაეხმარება სხვებს გამოიყენონ ხელოვნური ინტელექტის ძალა სოციალური სიკეთისთვის.