ဆောင်းပါးတို Transfer Learning ဆိုတာဘာလဲ။ - Unite.AI
ကြှနျုပျတို့နှငျ့အတူချိတ်ဆက်ပါ
AI Masterclass-

AI ၅၀

Transfer Learning ဆိုတာဘာလဲ။

mm
နောက်ဆုံးရေးသားချိန် on

Transfer Learning ဆိုတာဘာလဲ။

စက်သင်ယူမှုကို လေ့ကျင့်သောအခါ၊ မော်ဒယ်တစ်ခုကို လေ့ကျင့်ရာတွင် အချိန်ကြာမြင့်နိုင်သည်။ မော်ဒယ်ဗိသုကာတစ်ခုကို အစမှအဆုံး ဖန်တီးခြင်း၊ မော်ဒယ်ကို လေ့ကျင့်ပေးခြင်း၊ ထို့နောက် မော်ဒယ်ကို ပြုပြင်ပြောင်းလဲခြင်းသည် အချိန်နှင့် ကြိုးစားအားထုတ်မှု များပြားလှပါသည်။ စက်သင်ယူမှုပုံစံကို လေ့ကျင့်ရန် ပိုမိုထိရောက်သောနည်းလမ်းမှာ တွက်ချက်ထားပြီးဖြစ်သည့် အလေးများဖြင့် သတ်မှတ်သတ်မှတ်ထားပြီးဖြစ်သည့် ဗိသုကာပညာကို အသုံးပြုခြင်းဖြစ်သည်။ ဒါက နောက်ကွယ်က အဓိက အယူအဆပါ။ လွှဲပြောင်းသင်ယူမှုအသုံးပြုပြီးသော မော်ဒယ်ကိုယူပြီး အလုပ်အသစ်အတွက် ၎င်းကို ပြန်လည်အသုံးပြုပါ။

လွှဲပြောင်းသင်ယူမှုကို အသုံးပြုနိုင်သည့် မတူညီသောနည်းလမ်းများကို စူးစမ်းလေ့လာခြင်းမပြုမီ၊ လွှဲပြောင်းသင်ယူခြင်းသည် အဘယ်ကြောင့် ဤမျှအစွမ်းထက်ပြီး အသုံးဝင်သည့်နည်းစနစ်ဖြစ်ကြောင်း နားလည်ရန် အချိန်အနည်းငယ်ယူလိုက်ကြပါစို့။

Deep Learning Problem ကို ဖြေရှင်းခြင်း။

ရုပ်ပုံအမျိုးအစားခွဲစက်တည်ဆောက်ခြင်းကဲ့သို့ နက်နဲသောသင်ယူမှုပြဿနာကို ဖြေရှင်းရန်ကြိုးစားနေချိန်တွင်၊ သင်သည် မော်ဒယ်ဗိသုကာတစ်ခုဖန်တီးပြီး သင်၏ဒေတာပေါ်ရှိ မော်ဒယ်ကို လေ့ကျင့်ပေးရပါမည်။ မော်ဒယ်အမျိုးအစားခွဲခြားခြင်းကို လေ့ကျင့်ပေးခြင်းသည် မော်ဒယ်နှင့် ဒေတာအတွဲနှစ်ခုလုံး၏ ရှုပ်ထွေးမှုပေါ်မူတည်၍ နာရီ သို့မဟုတ် နေ့ရက်များစွာကြာနိုင်သည့် ကွန်ရက်၏အလေးချိန်များကို ချိန်ညှိခြင်းပါဝင်ပါသည်။ သင်တန်းအချိန်သည် ဒေတာအတွဲ၏ အရွယ်အစားနှင့် မော်ဒယ်ဗိသုကာ၏ ရှုပ်ထွေးမှုနှင့်အညီ အတိုင်းအတာကို တိုင်းတာမည်ဖြစ်သည်။

မော်ဒယ်သည် အလုပ်အတွက် လိုအပ်သော တိကျမှုမျိုး မရရှိပါက၊ မော်ဒယ်ကို ပြုပြင်ပြောင်းလဲရန် လိုအပ်ပြီး မော်ဒယ်ကို ပြန်လည်လေ့ကျင့်ရန် လိုအပ်မည်ဖြစ်သည်။ ဆိုလိုသည်မှာ အကောင်းဆုံးဗိသုကာပညာ၊ လေ့ကျင့်မှုကြာချိန်နှင့် ဒေတာအတွဲအပိုင်းခွဲကို ရှာမတွေ့မချင်း လေ့ကျင့်ချိန်နာရီများ ပိုပေးနိုင်သည်။ အမျိုးအစားခွဲတစ်ခုအား အသုံးဝင်စေရန်အတွက် ကိန်းရှင်အရေအတွက်မည်မျှကို တစ်ခုနှင့်တစ်ခု ချိန်ညှိရမည်ကို သင်စဉ်းစားသောအခါ၊ စက်သင်ယူမှုအင်ဂျင်နီယာများသည် မော်ဒယ်များကို လေ့ကျင့်ရန်နှင့် အကောင်အထည်ဖေါ်ရန် ပိုမိုလွယ်ကူပြီး ထိရောက်သောနည်းလမ်းများကို အမြဲရှာဖွေနေသည်ဟု အဓိပ္ပါယ်ရသည်။ ထို့ကြောင့် လွှဲပြောင်းသင်ကြားရေးနည်းပညာကို ဖန်တီးခဲ့သည်။

မော်ဒယ်ကို ဒီဇိုင်းဆွဲပြီး စမ်းသပ်ပြီးနောက်၊ မော်ဒယ်သည် အသုံးဝင်ကြောင်း သက်သေပြခဲ့လျှင် ၎င်းကို သိမ်းဆည်းပြီး နောက်ပိုင်းတွင် အလားတူပြဿနာများအတွက် ပြန်လည်အသုံးပြုနိုင်ပါသည်။

လွှဲပြောင်းသင်ယူမှုအမျိုးအစားများ

ယေဘူယျအားဖြင့် မတူညီသော နှစ်မျိုးရှိပါသည်။ လွှဲပြောင်းသင်ယူမှုအမျိုးအစားများ: မော်ဒယ်ကို အစမှအဆုံး ဖန်တီးပြီး အကြိုလေ့ကျင့်ထားသော မော်ဒယ်ကို အသုံးပြုခြင်း။

မော်ဒယ်တစ်ခုကို အစမှအဆုံး ဖန်တီးသည့်အခါတွင် သင်၏လေ့ကျင့်ရေးဒေတာကို အဓိပ္ပာယ်ပြန်ဆိုနိုင်ပြီး ၎င်းမှ ပုံစံများကို ထုတ်ယူနိုင်သည့် မော်ဒယ်ဗိသုကာတစ်ခု ဖန်တီးရန် လိုအပ်မည်ဖြစ်သည်။ မော်ဒယ်ကို ပထမဆုံးအကြိမ် လေ့ကျင့်သင်ကြားပြီးနောက်၊ မော်ဒယ်၏ အကောင်းဆုံးစွမ်းဆောင်ရည်ကို ရရှိရန်အတွက် ၎င်းကို ပြောင်းလဲရန် လိုအပ်ပေမည်။ ထို့နောက် သင်သည် မော်ဒယ်ဗိသုကာကို သိမ်းဆည်းနိုင်ပြီး အလားတူလုပ်ဆောင်မှုတစ်ခုတွင် အသုံးပြုမည့် မော်ဒယ်အတွက် အစမှတ်အဖြစ် အသုံးပြုနိုင်သည်။

ဒုတိယအခြေအနေတွင် - ကြိုတင်လေ့ကျင့်ထားသောမော်ဒယ်ကိုအသုံးပြုခြင်း - သင်အသုံးပြုရန်အတွက်ကြိုတင်လေ့ကျင့်ထားသောမော်ဒယ်ကိုရွေးချယ်ရန်သာလိုအပ်သည်။ များစွာသော တက္ကသိုလ်များနှင့် သုတေသနအဖွဲ့များသည် ၎င်းတို့၏ မော်ဒယ်၏ သတ်မှတ်ချက်များကို ယေဘူယျအသုံးပြုရန်အတွက် ရရှိစေမည်ဖြစ်သည်။ မော်ဒယ်၏ တည်ဆောက်ပုံအား အလေးများနှင့်အတူ ဒေါင်းလုဒ်လုပ်နိုင်ပါသည်။

လွှဲပြောင်းသင်ယူမှုကို လုပ်ဆောင်သည့်အခါ၊ မော်ဒယ်ဗိသုကာနှင့် အလေးများကို လက်ထဲတွင်ရှိသော အလုပ်အတွက် အသုံးပြုနိုင်ပြီး၊ သို့မဟုတ် မော်ဒယ်၏ အချို့သောအပိုင်း/အလွှာများကိုသာ အသုံးပြုနိုင်သည်။ ကြိုတင်လေ့ကျင့်ထားသော မော်ဒယ်အချို့ကိုသာ အသုံးပြု၍ လေ့ကျင့်မှုတွင် ကျန်မော်ဒယ်ကို ချိန်ညှိခြင်းဟု ခေါ်ဆိုပါသည်။

ကွန်ရက်တစ်ခုအား ပြင်ဆင်ခြင်း။

ကွန်ရက်တစ်ခုအား ပြင်ဆင်ခြင်းသည် ကွန်ရက်တစ်ခုရှိ အလွှာအချို့တွင် လေ့ကျင့်ရေးလုပ်ငန်းစဉ်ကို ဖော်ပြသည်။ လေ့ကျင့်ရေးဒေတာအတွဲအသစ်သည် မူရင်းမော်ဒယ်ကိုလေ့ကျင့်ရန်အသုံးပြုသည့်ဒေတာအတွဲနှင့်တူပါက၊ တူညီသောအလေးချိန်အများအပြားကို အသုံးပြုနိုင်သည်။

အေးခဲပြီး ပြန်လေ့ကျင့်ထားသင့်သော ကွန်ရက်ရှိ အလွှာအရေအတွက်သည် ဒေတာအတွဲအသစ်၏ အရွယ်အစားနှင့်အညီ အတိုင်းအတာဖြစ်သင့်သည်။ လေ့ကျင့်သင်ကြားနေသော ဒေတာအစုံသည် သေးငယ်ပါက၊ အလွှာအများစုကို ၎င်းတို့ကဲ့သို့ ထိန်းထားရန်နှင့် နောက်ဆုံးအလွှာအနည်းငယ်ကိုသာ လေ့ကျင့်ရန် ပိုမိုကောင်းမွန်ပါသည်။ ဤအရာသည် ကွန်ရက်ကို အလွန်အကျွံမဖြစ်အောင် ကာကွယ်ရန်ဖြစ်သည်။ တနည်းအားဖြင့် လေ့ကျင့်သင်ကြားထားသည့် ကွန်ရက်၏ နောက်ဆုံးအလွှာများကို ဖယ်ရှားနိုင်ပြီး လေ့ကျင့်ပြီးသည့် အလွှာအသစ်များကို ထပ်ထည့်နိုင်သည်။ ဆန့်ကျင်ဘက်အနေနှင့်၊ ဒေတာအတွဲသည် ကြီးမားသောဒေတာအတွဲဖြစ်ပြီး မူလဒေတာအတွဲထက် ပိုကြီးနိုင်လျှင် ကွန်ရက်တစ်ခုလုံးကို ပြန်လည်လေ့ကျင့်ပေးသင့်သည်။ ကွန်ရက်အဖြစ် အသုံးပြုရန် ပုံသေအင်္ဂါရပ်ထုတ်ယူသူကွန်ရက်၏ အများစုကို အင်္ဂါရပ်များကို ထုတ်ယူရန် အသုံးပြုနိုင်ပြီး ကွန်ရက်၏ နောက်ဆုံးအလွှာကို အေးခဲပြီး လေ့ကျင့်ပေးနိုင်ပါသည်။

သင်သည် ကွန်ရက်တစ်ခုကို အလှဆင်နေချိန်တွင်၊ ConvNet ၏ အစောပိုင်းအလွှာများသည် ရုပ်ပုံများ၏ ယေဘူယျအင်္ဂါရပ်များကို ကိုယ်စားပြုသည့် အချက်အလက်များပါ၀င်ကြောင်း သတိရပါ။ ဤအရာများသည် အစွန်းများနှင့် အရောင်များကဲ့သို့ အင်္ဂါရပ်များဖြစ်သည်။ ဆန့်ကျင်ဘက်အားဖြင့်၊ ConvNet ၏ နောက်ပိုင်းအလွှာများသည် မော်ဒယ်တွင် ကနဦးလေ့ကျင့်သင်ကြားထားသည့် ဒေတာအတွဲအတွင်း ကျင်းပသည့် ဒေတာအတွဲတစ်ခုချင်းစီအတွက် ပိုမိုတိကျသော အသေးစိတ်အချက်အလက်များကို ကိုင်ဆောင်ထားသည်။ မူလဒေတာအတွဲနှင့် အတော်လေးကွာခြားသည့် ဒေတာအတွဲတစ်ခုတွင် မော်ဒယ်တစ်ခုကို လေ့ကျင့်သင်ကြားနေပါက၊ အင်္ဂါရပ်များကို ထုတ်ယူရန် မော်ဒယ်၏ ကနဦးအလွှာများကို အသုံးပြုပြီး ကျန်မော်ဒယ်လ်ကို ပြန်လည်လေ့ကျင့်ရန် လိုပေမည်။

လွှဲပြောင်းသင်ယူမှု နမူနာများ

လွှဲပြောင်းသင်ယူခြင်း၏ အသုံးအများဆုံး application များသည် ပုံဒေတာကို ထည့်သွင်းမှုများအဖြစ် အသုံးပြုသည့်အရာများ ဖြစ်နိုင်သည်။ ၎င်းတို့သည် မကြာခဏ ခန့်မှန်းခြင်း/ အမျိုးအစားခွဲခြားခြင်း အလုပ်များဖြစ်သည်။ ထိုလမ်း Convolutional အာရုံကြောကွန်ယက်များ convolutional layers များသည် အလွန်ဆင်တူသော အင်္ဂါရပ်များကို မကြာခဏ ခွဲခြားထားသောကြောင့် ရုပ်ပုံဒေတာကို ဘာသာပြန်ဆိုခြင်းသည် မော်ဒယ်များ၏ ရှုထောင့်များကို ပြန်လည်အသုံးပြုခြင်းသို့ ချေးငှားပါသည်။ ဘုံလွှဲပြောင်းသင်ယူမှုပြဿနာတစ်ခု၏ ဥပမာတစ်ခုမှာ အရာဝတ္ထုအမျိုးအစား 1000 နှင့် ပြည့်နေသည့် ImageNet 1000 အလုပ်၊ ကြီးမားသောဒေတာအတွဲဖြစ်သည်။ ဤဒေတာအတွဲတွင် စွမ်းဆောင်ရည်မြင့်မားသော မော်ဒယ်များကို တီထွင်သည့်ကုမ္ပဏီများသည် ၎င်းတို့ကို အခြားသူများအား ပြန်လည်အသုံးပြုခွင့်ပေးသည့် လိုင်စင်များအောက်တွင် ၎င်းတို့၏မော်ဒယ်များကို မကြာခဏ ထုတ်လွှတ်လေ့ရှိသည်။ ဤလုပ်ငန်းစဉ်မှ ထွက်ပေါ်လာသော မော်ဒယ်အချို့ ပါဝင်သည်။ Microsoft ResNet မော်ဒယ်Google Inception Model နှင့် အောက်စဖို့ဒ် VGG မော်ဒယ် အုပ်စုတစု။

ဘလော့ဂါနှင့် ပရိုဂရမ်မာများအတွက် အထူးပြုပါ။ စက်သင်ယူ နှင့် နက်ရှိုင်းသောသင်ယူခြင်း အကြောင်းအရာများ လူမှုဆက်ဆံရေးကောင်းမွန်ရန်အတွက် AI ၏စွမ်းအားကို အခြားသူများအား ကူညီပေးနိုင်ရန် Daniel က မျှော်လင့်ထားသည်။