ဆောင်းပါးတို Confusion Matrix ဆိုတာဘာလဲ။ - Unite.AI
ကြှနျုပျတို့နှငျ့အတူချိတ်ဆက်ပါ
AI Masterclass-

AI ၅၀

Confusion Matrix ဆိုတာဘာလဲ။

mm
နောက်ဆုံးရေးသားချိန် on

စက်သင်ယူမှုနှင့် ဒေတာသိပ္ပံအတွက် အစွမ်းထက်ဆုံး ခွဲခြမ်းစိတ်ဖြာမှုကိရိယာများထဲမှ တစ်ခုဖြစ်သည်။ ရှုပ်ထွေးမှု matrix. ရှုပ်ထွေးသော matrix သည် dataset အတွင်းရှိ ပစ်မှတ်အတန်းများနှင့် စပ်လျဉ်းပြီး machine learning classifier ၏ လုပ်ဆောင်ပုံအကြောင်း အသေးစိတ်အချက်အလက်များကို သုတေသီများအား ပေးစွမ်းနိုင်သည်။ ရှုပ်ထွေးသော matrix တစ်ခုသည် မှားယွင်းသော အမျိုးအစားခွဲထားသော ဥပမာများနှင့် မှန်ကန်စွာ အမျိုးအစားခွဲထားသော နမူနာများကို သရုပ်ပြပါမည်။ ရှုပ်ထွေးသောမက်ထရစ်ကို မည်သို့ဖွဲ့စည်းပုံနှင့် ၎င်းကို မည်သို့အဓိပ္ပာယ်ပြန်ဆိုနိုင်သည်ကို လေးနက်စွာ လေ့လာကြည့်ကြပါစို့။

Confusion Matrix ဆိုတာဘာလဲ။

confuse matrix ၏ ရိုးရှင်းသော အဓိပ္ပါယ်ဖွင့်ဆိုချက်ဖြင့် စတင်ကြပါစို့။ ရှုပ်ထွေးမှုမက်ထရစ်သည် ကြိုတင်ခန့်မှန်းနိုင်သော ခွဲခြမ်းစိတ်ဖြာမှုကိရိယာတစ်ခုဖြစ်သည်။ အထူးသဖြင့်၊ ၎င်းသည် မော်ဒယ်၏ ခန့်မှန်းတန်ဖိုးများနှင့် အမှန်တကယ်တန်ဖိုးများကို ပြသပြီး နှိုင်းယှဉ်သည့်ဇယားဖြစ်သည်။ စက်သင်ယူမှု၏အခြေအနေတွင်၊ ရှုပ်ထွေးသောမက်ထရစ်ကို မက်ထရစ်တစ်ခုအဖြစ် အသုံးပြုကာ ဒေတာအတွဲတစ်ခုပေါ်တွင် စက်သင်ယူမှုအမျိုးအစားခွဲခြားသတ်မှတ်မှုလုပ်ဆောင်ပုံကို ပိုင်းခြားစိတ်ဖြာရန်ဖြစ်သည်။ ရှုပ်ထွေးသော matrix သည် တိကျမှု၊ တိကျမှု၊ တိကျမှုနှင့် ပြန်လည်သိမ်းဆည်းခြင်းကဲ့သို့သော မက်ထရစ်များကို မြင်သာအောင်ဖန်တီးပေးသည်။

ရှုပ်ထွေးမှုမက်ထရစ်သည် အထူးအသုံးဝင်သည့် အကြောင်းရင်းမှာ ရိုးရှင်းတိကျမှုကဲ့သို့သော အခြားအမျိုးအစားခွဲခြားမှုမက်ထရစ်များနှင့်မတူဘဲ၊ ရှုပ်ထွေးမှုမက်ထရစ်သည် မော်ဒယ်တစ်ခုလုပ်ဆောင်ပုံ၏ ပိုမိုပြည့်စုံသောရုပ်ပုံလွှာကိုထုတ်ပေးသောကြောင့်ဖြစ်သည်။ တိကျမှုကဲ့သို့ မက်ထရစ်ကို အသုံးပြုမှသာ မော်ဒယ်သည် အတန်းတစ်ခုကို အမျိုးအစားတစ်ခုကို လုံးလုံးနှင့် တသမတ်တည်း လွဲမှားစွာ ခွဲခြားသတ်မှတ်နိုင်သည့် အခြေအနေသို့ ဦးတည်နိုင်သော်လည်း ပျမ်းမျှစွမ်းဆောင်ရည်မှာ ကောင်းမွန်သောကြောင့် ၎င်းကို သတိမပြုမိပါ။ ဤအတောအတွင်း, ရှုပ်ထွေးမှုများ matrix မတူညီသောတန်ဖိုးများကို နှိုင်းယှဉ်ပေးသည်။ မှားယွင်းသော အဆိုးမြင်မှုများ၊ True Negatives၊ False Positives နှင့် True Positives များကဲ့သို့။

ရှုပ်ထွေးမှုမက်ထရစ်ကို ကိုယ်စားပြုသည့် မတူညီသောမက်ထရစ်များကို သတ်မှတ်ကြပါစို့။

Confusion Matrix တွင် ပြန်လည်သိမ်းဆည်းပါ။

ပြန်လည်ခေါ်ယူခြင်းဆိုသည်မှာ မှားယွင်းသော-အနုတ်လက္ခဏာနမူနာများနှင့် စုစုပေါင်းအပြုသဘောဆောင်သောဥပမာများဖြင့် ပိုင်းခြားထားသော စစ်မှန်သောအပြုသဘောနမူနာများအရေအတွက်ဖြစ်သည်။ တစ်နည်းဆိုရသော် စက်သင်ယူမှုပုံစံဖြင့် ခွဲခြားထားသော စစ်မှန်သော အပြုသဘောဆောင်သော ဥပမာများ၏ အချိုးအစားကို ပြန်လည်ခေါ်ယူခြင်းသည် ကိုယ်စားပြုပါသည်။ ဒေတာအတွဲအတွင်းပါရှိသော အပြုသဘောဆောင်သော နမူနာများအားလုံးကို မော်ဒယ်မှ ခွဲခြားနိုင်ခဲ့သည့် အပြုသဘောနမူနာများ၏ ရာခိုင်နှုန်းအဖြစ် ပြန်လည်ခေါ်ယူခြင်းကို ပေးပါသည်။ ဤတန်ဖိုးကို “ထိမှန်နှုန်း” ဟုလည်း ရည်ညွှန်းနိုင်ပြီး ဆက်စပ်တန်ဖိုးမှာ “အာရုံများကိုထိခိုက်လွယ်ခြင်းပြန်လည်ခေါ်ယူနိုင်ခြေ သို့မဟုတ် စစ်မှန်သော အပြုသဘောဆောင်သော ခန့်မှန်းချက်နှုန်းကို ဖော်ပြသည့်၊

စေ့စပ်သေချာခြင်း Confusion Matrix တွင်

ပြန်လည်သိမ်းဆည်းခြင်းကဲ့သို့ပင်၊ တိကျမှုသည် မော်ဒယ်တစ်ခု၏ စွမ်းဆောင်ရည်ကို အပြုသဘောဆောင်သော သာဓက အမျိုးအစားခွဲခြားခြင်းဆိုင်ရာ သတ်မှတ်ချက်များတွင် ခြေရာခံသည့် တန်ဖိုးတစ်ခုဖြစ်သည်။ ပြန်လည်သိမ်းဆည်းခြင်းနှင့်မတူဘဲ၊ တိကျမှုမှာ အပြုသဘောဟု တံဆိပ်တပ်ထားသော နမူနာအရေအတွက်သည် အမှန်တကယ်အပြုသဘောဖြစ်ကြောင်း တိကျမှုနှင့် သက်ဆိုင်ပါသည်။ ၎င်းကို တွက်ချက်ရန်အတွက်၊ အစစ်အမှန်အပြုသဘောနမူနာများ၏ အရေအတွက်ကို မှားယွင်းသောအပြုသဘောနမူနာများ နှင့် စစ်မှန်သောအပြုသဘောဆောင်သည့် အရေအတွက်ဖြင့် ပိုင်းခြားထားသည်။

ခြားနားမှုဖြစ်စေရန် ပြန်လည်သိမ်းဆည်းခြင်းနှင့် တိကျမှုပိုမိုရှင်းလင်းသည်။၊ တိကျမှုသည် အမှန်တကယ် အပြုသဘောဆောင်သော အညွှန်းတပ်ထားသော နမူနာအားလုံး၏ ရာခိုင်နှုန်းကို တွက်ဆရန် ရည်ရွယ်ပြီး ပြန်လည်သိမ်းဆည်းခြင်းသည် မော်ဒယ်အသိအမှတ်ပြုနိုင်သည့် စစ်မှန်သော အပြုသဘောနမူနာအားလုံး၏ ရာခိုင်နှုန်းကို ခြေရာခံသည်။

တိကျတဲ့ Confusion Matrix တွင်

ပြန်လည်သိမ်းဆည်းခြင်းနှင့် တိကျမှုတို့သည် အပြုသဘောဆောင်သော နမူနာများနှင့် စစ်မှန်သော အပြုသဘောနှုန်းကို ခြေရာခံသည့် တန်ဖိုးများဖြစ်သော်လည်း၊ သတ်သတ်မှတ်မှတ် အမှန်အနုတ်နှုန်း သို့မဟုတ် အမှန်အနုတ်လက္ခဏာအဖြစ် သတ်မှတ်ထားသော နမူနာအရေအတွက်ကို တွက်ချက်သည်။ ၎င်းကို အနုတ်လက္ခဏာအဖြစ် ခွဲခြားထားသော နမူနာအရေအတွက်ကိုယူပြီး စစ်မှန်သော အနုတ်လက္ခဏာနမူနာများနှင့် ပေါင်းစပ်ထားသော မှားယွင်းသော အပြုသဘောနမူနာများ အရေအတွက်ဖြင့် ပိုင်းခြားခြင်းဖြင့် တွက်ချက်သည်။

Confusion Matrix ကို အဓိပ္ပာယ်ဖွင့်ဆိုခြင်း။

ဓာတ်ပုံ- Wikimedia Commons မှတဆင့် Jackverr၊ (https://commons.wikimedia.org/wiki/File:ConfusionMatrix.png), CC BY SA 3.0

Confusion Matrix ၏ ဥပမာ

တိကျမှု၊ ပြန်လည်သိမ်းဆည်းမှု၊ အာရုံခံစားနိုင်မှုနှင့် တိကျမှုကဲ့သို့သော လိုအပ်သော ဝေါဟာရများကို သတ်မှတ်ပြီးနောက်၊ ဤကွဲပြားသောတန်ဖိုးများကို ရှုပ်ထွေးမှုမက်ထရစ်တစ်ခုအတွင်း မည်သို့ကိုယ်စားပြုကြောင်း ဆန်းစစ်နိုင်ပါသည်။ အမျိုးအစား နှစ်မျိုး သို့မဟုတ် ထို့ထက်ပိုသော အတန်းများရှိသောအခါတွင် ရှုပ်ထွေးမှုများ မက်ထရစ်ကို ထုတ်ပေးပါသည်။ ထုတ်လုပ်လိုက်သော ရှုပ်ထွေးမှုမက်ထရစ်သည် လိုအပ်သလောက် အရပ်ရှည်ပြီး ကျယ်ပြန့်နိုင်ပြီး လိုချင်သောအတန်းအရေအတွက်ကို ကိုင်ဆောင်ထားနိုင်သော်လည်း ရိုးရှင်းစေရန်အတွက် binary အမျိုးအစားခွဲခြားခြင်းလုပ်ငန်းအတွက် 2 x 2 ရှုပ်ထွေးမှုမက်ထရစ်ကို ကျွန်ုပ်တို့ စစ်ဆေးပါမည်။

ဥပမာအနေဖြင့်၊ လူနာတစ်ဦးတွင် ရောဂါရှိ/မရှိ ဆုံးဖြတ်ရန် အမျိုးအစားခွဲကိရိယာကို အသုံးပြုနေသည်ဟု ယူဆပါ။ အင်္ဂါရပ်များကို အမျိုးအစားခွဲခွဲခြားမှုတွင် ထည့်သွင်းမည်ဖြစ်ပြီး၊ အမျိုးအစားခွဲခွဲခြားသူသည် မတူညီသော အမျိုးအစားနှစ်မျိုးထဲမှ တစ်ခုကို ပြန်ပေးလိမ့်မည်- လူနာတွင် ရောဂါမရှိသည်ဖြစ်စေ ၎င်းတို့တွင်ဖြစ်စေ ၎င်းတို့ကို ပြန်ပေးမည်ဖြစ်သည်။

matrix ၏ ဘယ်ဘက်ခြမ်းဖြင့် စကြပါစို့။ ရှုပ်ထွေးမှုမက်ထရစ်၏ ဘယ်ဘက်ခြမ်းသည် အတန်းတစ်ခုချင်းစီအတွက် အမျိုးအစားခွဲသည့် ခန့်မှန်းချက်များကို ကိုယ်စားပြုသည်။ ဒွိအမျိုးအစားခွဲခြားခြင်းလုပ်ငန်းသည် ဤနေရာတွင် အတန်းနှစ်တန်းရှိပါမည်။ matrix ၏ထိပ်ပိုင်းအပိုင်းနှင့်ပတ်သက်၍၊ ၎င်းသည် စစ်မှန်သောတန်ဖိုးများ၊ အမှန်တကယ်အတန်းတံဆိပ်များ၊ data instances များကိုခြေရာခံသည်။

ရှုပ်ထွေးသော matrix ကို အတန်းများနှင့် ကော်လံများ ဖြတ်သည့်နေရာကို ဆန်းစစ်ခြင်းဖြင့် လုပ်ဆောင်နိုင်သည်။ မော်ဒယ်၏ မှန်ကန်သော အညွှန်းများနှင့် ဆန့်ကျင်ဘက် မော်ဒယ်၏ ခန့်မှန်းချက်များကို စစ်ဆေးပါ။ ဤကိစ္စတွင်၊ True Positives တန်ဖိုးများ၊ မှန်ကန်သော အပြုသဘောဆောင်သော ခန့်မှန်းချက်များ အရေအတွက်သည် ဘယ်ဘက်အပေါ်ထောင့်တွင် တည်ရှိသည်။ မှားယွင်းသော အပြုသဘောများကို ညာဘက်အပေါ်ထောင့်တွင် တွေ့ရပြီး ဥပမာများသည် အမှန်တကယ် အနုတ်လက္ခဏာဖြစ်သော်လည်း အမျိုးအစားခွဲသူက ၎င်းအား အပြုသဘောအဖြစ် တဂ်လုပ်ထားသည်။

ဇယားကွက်၏ ဘယ်ဘက်အောက်ထောင့်တွင် အမျိုးအစားခွဲခွဲကိရိယာသည် အနုတ်လက္ခဏာအဖြစ် တဂ်လုပ်ထားသော်လည်း အမှန်တကယ် အပြုသဘောဆောင်သည့် ဖြစ်ရပ်များကို ပြသသည်။ နောက်ဆုံးတွင်၊ ရှုပ်ထွေးမှုမက်ထရစ်၏ ညာဘက်အောက်ထောင့်သည် စစ်မှန်သောအနုတ်လက္ခဏာတန်ဖိုးများကို တွေ့ရှိသည့်နေရာ သို့မဟုတ် စစ်မှန်သောအတုအယောင်ဥပမာများရှိသည့်နေရာဖြစ်သည်။

ဒေတာအတွဲတွင် အတန်းအစား နှစ်ခုထက်ပိုသော အခါ၊ matrix သည် ထိုအတန်းများစွာဖြင့် ကြီးထွားလာသည်။ ဥပမာအားဖြင့်၊ class သုံးခုရှိလျှင် matrix သည် 3 x 3 matrix ဖြစ်လိမ့်မည်။ ရှုပ်ထွေးသော matrix ၏အရွယ်အစား မည်သို့ပင်ရှိစေကာမူ၊ ၎င်းတို့ကို ဘာသာပြန်သည့်နည်းလမ်းသည် အတိအကျတူညီပါသည်။ ဘယ်ဘက်အခြမ်းတွင် ခန့်မှန်းတန်ဖိုးများ ပါ၀င်ပြီး အမှန်တကယ် အတန်းအစား အညွှန်းများသည် ထိပ်ဆုံးတွင် လည်ပတ်နေသည်။ အမျိုးအစားခွဲခြားသူ မှန်ကန်စွာ ခန့်မှန်းထားသည့် သာဓကများသည် အပေါ်-လက်ဝဲမှ အောက်-ညာဘက်သို့ ထောင့်ဖြတ်ပြေးသည်။ မက်ထရစ်ကိုကြည့်ခြင်းဖြင့် အထက်တွင်ဖော်ပြထားသော ခန့်မှန်းတွက်ချက်မှုလေးခုကို ပိုင်းခြားနိုင်ပါသည်။

ဥပမာအားဖြင့်၊ စစ်မှန်သော အပြုသဘောဆောင်မှုနှင့် မှားယွင်းသော အနုတ်လက္ခဏာများကို ပေါင်းထည့်ကာ ၎င်းတို့ကို စစ်မှန်သော အပြုသဘောနမူနာများ အရေအတွက်ဖြင့် ပိုင်းခြားခြင်းဖြင့် ပြန်လည်သိမ်းဆည်းမှုကို တွက်ချက်နိုင်သည်။ တစ်ချိန်တည်းတွင်၊ မှားယွင်းသော positives များကို true positives နှင့် ပေါင်းစပ်ပြီး value ကို true positives စုစုပေါင်းအရေအတွက်သို့ ပိုင်းခြားခြင်းဖြင့် တိကျစွာတွက်ချက်နိုင်ပါသည်။

တိကျမှု၊ ပြန်လည်သိမ်းဆည်းမှုနှင့် တိကျမှုစသည့် မက်ထရစ်များကို ကိုယ်တိုင်တွက်ချက်ကာ အချိန်ဖြုန်းနိုင်သော်လည်း၊ ဤမက်ထရစ်များကို စက်သင်ယူမှုစာကြည့်တိုက်အများစုတွင် ၎င်းတို့ကိုပြသသည့်နည်းလမ်းများ ရှိသောကြောင့် အသုံးများပါသည်။ ဥပမာအားဖြင့်၊ Python အတွက် Scikit-learn တွင် confuse matrix ကိုထုတ်ပေးသည့် function တစ်ခုရှိသည်။

ဘလော့ဂါနှင့် ပရိုဂရမ်မာများအတွက် အထူးပြုပါ။ စက်သင်ယူ နှင့် နက်ရှိုင်းသောသင်ယူခြင်း အကြောင်းအရာများ လူမှုဆက်ဆံရေးကောင်းမွန်ရန်အတွက် AI ၏စွမ်းအားကို အခြားသူများအား ကူညီပေးနိုင်ရန် Daniel က မျှော်လင့်ထားသည်။