ဆောင်းပါးတို Autoencoder ဆိုတာဘာလဲ။ - Unite.AI
ကြှနျုပျတို့နှငျ့အတူချိတ်ဆက်ပါ
AI Masterclass-

AI ၅၀

Autoencoder ဆိုတာဘာလဲ။

mm
နောက်ဆုံးရေးသားချိန် on

အရင်က ကြီးကြပ်မရတဲ့ သင်ကြားရေးနည်းပညာတွေအကြောင်း ဖတ်ဖူးရင်၊ ""autoencode” Autoencoders များသည် ကြီးကြပ်မထားသော သင်ယူမှုပုံစံများကို တီထွင်သည့် အဓိကနည်းလမ်းများထဲမှ တစ်ခုဖြစ်သည်။ သို့သော် autoencoder ဆိုတာ အတိအကျဘာလဲ။

အတိုချုပ်အားဖြင့်၊ autoencoders များသည် ဒေတာကိုရယူခြင်း၊ ဒေတာကိုချုံ့ပြီး ကုဒ်သွင်းခြင်း၊ ထို့နောက် ကုဒ်ဖော်ပြခြင်းမှ ဒေတာကို ပြန်လည်တည်ဆောက်ခြင်းဖြင့် လုပ်ဆောင်သည်။ မော်ဒယ်ကို ဆုံးရှုံးမှုအနည်းဆုံးဖြစ်အောင် လေ့ကျင့်ထားပြီး ဒေတာကို တတ်နိုင်သမျှ အနီးကပ် ပြန်ထုတ်ပေးပါသည်။ ဤလုပ်ငန်းစဉ်မှတဆင့်၊ autoencoder သည် data ၏အရေးကြီးသောအင်္ဂါရပ်များကိုလေ့လာနိုင်သည်။ ၎င်းသည် autoencoder ၏ လျင်မြန်သော အဓိပ္ပါယ်ဖွင့်ဆိုချက်ဖြစ်သော်လည်း၊ autoencoders များကို အနီးကပ်ကြည့်ရှုပြီး ၎င်းတို့လုပ်ဆောင်ပုံကို ပိုမိုနားလည်လာစေရန်အတွက် အကျိုးရှိမည်ဖြစ်သည်။ ဤဆောင်းပါးသည် autoencoders များကို demystify လုပ်ရန် ကြိုးစားမည်ဖြစ်ပြီး၊ autoencoders များ၏ တည်ဆောက်ပုံနှင့် ၎င်းတို့၏ application များကို ရှင်းပြပါမည်။

Autoencoder ဆိုတာဘာလဲ။

အော်တိုကုဒ်များ အာရုံကြော ကွန်ရက်များ ဖြစ်ကြပါသည်။ အာရုံကြောကွန်ရက်များသည် အလွှာများစွာဖြင့် ဖွဲ့စည်းထားပြီး autoencoder တစ်ခု၏ အဓိပ္ပါယ်ဖွင့်ဆိုချက်မှာ input layers တွင် output layer ကဲ့သို့ အချက်အလက်များစွာ အတိအကျပါဝင်နေခြင်းဖြစ်သည်။ အဝင်အထွက်အလွှာနှင့် အထွက်အလွှာတွင် ယူနစ်အရေအတွက်အတိအကျတူညီသောကြောင့် autoencoder သည် input data ကိုပုံတူပွားရန်ရည်ရွယ်သောကြောင့်ဖြစ်သည်။ ၎င်းကို ခွဲခြမ်းစိတ်ဖြာပြီး ကြီးကြပ်မှုကင်းသော ပုံစံဖြင့် ပြန်လည်တည်ဆောက်ပြီးနောက် ဒေတာမိတ္တူကို ထုတ်ပေးသည်။

autoencoder မှတဆင့် ရွေ့လျားသော ဒေတာသည် input မှ output သို့ တိုက်ရိုက် ပုံဖော်ထားရုံမျှမက၊ ဆိုလိုသည်မှာ ကွန်ရက်သည် input data ကို ကူးယူရုံသာ မဟုတ်ပါ။ autoencoder တစ်ခုတွင် အစိတ်အပိုင်း သုံးခု ရှိသည်- ဒေတာကို ချုံ့ပေးသော ကုဒ်သွင်းမှု (အဝင်) အပိုင်း၊ ဖိသိပ်ထားသော ဒေတာ (သို့မဟုတ် ကန့်လန့်ဖြတ်) ကို ကိုင်တွယ်သည့် အစိတ်အပိုင်း နှင့် ဒီကုဒ်ဒါ (အထွက်) အပိုင်း။ ဒေတာကို autoencoder ထဲသို့ ဖြည့်သွင်းသောအခါ၊ ၎င်းကို ကုဒ်သွင်းပြီး သေးငယ်သောအရွယ်အစားသို့ ချုံ့သွားပါသည်။ ထို့နောက် ကွန်ရက်သည် ကုဒ်လုပ်ထားသော/ချုံ့ထားသော ဒေတာကို လေ့ကျင့်သင်ကြားပြီး ၎င်းသည် ထိုဒေတာ၏ အပန်းဖြေမှုကို ထုတ်ပေးသည်။

ဒါဆို ကွန်ရက်တစ်ခုက ပေးထားတဲ့ ဒေတာကို ပြန်လည်တည်ဆောက်ဖို့ ဘာကြောင့် လေ့ကျင့်ချင်တာလဲ။ အကြောင်းရင်းမှာ ကွန်ရက်သည် “အနှစ်သာရ” သို့မဟုတ် ထည့်သွင်းဒေတာ၏ အရေးကြီးဆုံးအင်္ဂါရပ်များကို လေ့လာသောကြောင့်ဖြစ်သည်။ ကွန်ရက်ကို လေ့ကျင့်သင်ကြားပြီးနောက်၊ အချို့သော ပစ်မှတ်အင်္ဂါရပ်များ၏ ပေါင်းထည့်ခြင်း သို့မဟုတ် နုတ်ခြင်းတို့ဖြင့် အလားတူဒေတာကို ပေါင်းစပ်နိုင်သော ပုံစံတစ်ခုကို ဖန်တီးနိုင်သည်။ ဥပမာအားဖြင့်၊ သင်သည် စပါးလင်ပုံများပေါ်တွင် အော်တိုကုဒ်ဒါကို လေ့ကျင့်နိုင်ပြီး ရုပ်ပုံမှ စပါးလင်/ဆူညံသံများကို ဖယ်ရှားရန် လေ့ကျင့်ထားသော မော်ဒယ်ကို အသုံးပြုနိုင်သည်။

Autoencoder ဗိသုကာ

ကြည့်ကြရအောင် autoencoder ၏တည်ဆောက်ပုံ။ ဤနေရာတွင် autoencoder ၏ အဓိက တည်ဆောက်ပုံကို ဆွေးနွေးပါမည်။ အောက်ဖော်ပြပါကဏ္ဍတွင် ကျွန်ုပ်တို့ဆွေးနွေးမည့် ဤအထွေထွေဗိသုကာဆိုင်ရာ ကွဲပြားမှုများရှိသည်။

ဓာတ်ပုံ- Michela Massi မှတဆင့် Wikimedia Commons၊(https://commons.wikimedia.org/wiki/File:Autoencoder_schema.png)

ယခင်က ဖော်ပြခဲ့သည့်အတိုင်း autoencoder သည် အခြေခံအားဖြင့် ကုဒ်နံပါတ်၊ တစ်ဆို့နှင့် ဒီကုဒ်ဒါကို မတူညီသော အစိတ်အပိုင်းသုံးမျိုးဖြင့် ပိုင်းခြားနိုင်သည်။

autoencoder ၏ ကုဒ်ပြောင်းသည့်အပိုင်းသည် ပုံမှန်အားဖြင့် feedforward၊ ချိတ်ဆက်ထားသော ကွန်ရက်တစ်ခုဖြစ်သည်။ ကုဒ်ပြောင်းသည့်အလွှာများ၏ ရည်ရွယ်ချက်မှာ ထည့်သွင်းဒေတာကို ယူကာ ၎င်းကို ငုပ်လျှိုးနေသော အာကာသကိုယ်စားပြုမှုအဖြစ် ချုံ့ကာ၊ အတိုင်းအတာကို လျှော့ချပေးသည့် ဒေတာကိုယ်စားပြုမှုအသစ်ကို ဖန်တီးရန်ဖြစ်သည်။

ကုဒ်အလွှာများ သို့မဟုတ် ပိတ်ဆို့မှုများသည် ဒေတာ၏ ဖိသိပ်ထားသော ကိုယ်စားပြုမှုကို ကိုင်တွယ်ဖြေရှင်းသည်။ ပိတ်ဆို့ခြင်းကုဒ်သည် စောင့်ကြည့်လေ့လာထားသည့်ဒေတာ၏ အသက်ဆိုင်ဆုံးအပိုင်းများကို ဆုံးဖြတ်ရန် သို့မဟုတ် ဒေတာပြန်လည်တည်ဆောက်မှုအတွက် အရေးကြီးဆုံးဖြစ်သည့် ဒေတာ၏အခြားနည်းလမ်းကို ထည့်သွင်းရန် ဂရုတစိုက်ဒီဇိုင်းပြုလုပ်ထားသည်။ ဤနေရာတွင် ရည်မှန်းချက်မှာ ဒေတာ၏ အသွင်အပြင်များကို ထိန်းသိမ်းထားရန် လိုအပ်ပြီး မည်သည့်အရာအား စွန့်ပစ်နိုင်သည်ကို ဆုံးဖြတ်ရန်ဖြစ်သည်။ ကန့်လန့်ဖြတ်ကုဒ်သည် မတူညီသော ထည့်သွင်းစဉ်းစားမှုနှစ်ခုကို ချိန်ညှိရန် လိုအပ်သည်- ကိုယ်စားပြုမှုအရွယ်အစား (ကိုယ်စားပြုမှု မည်မျှသေးငယ်သည်) နှင့် ပြောင်းလဲနိုင်သော/အင်္ဂါရပ်ဆိုင်ရာ ဆက်စပ်မှု။ ပိတ်ဆို့မှုသည် ကွန်ရက်၏ အလေးများနှင့် ဘက်လိုက်မှုများတွင် အစိတ်အပိုင်းအလိုက် တက်ကြွမှုကို လုပ်ဆောင်သည်။ လည်ပင်းအလွှာကို တစ်ခါတစ်ရံ ငုပ်လျှိုးနေသော ကိုယ်စားပြုမှု သို့မဟုတ် ငုပ်လျှိုးနေသော ကိန်းရှင်များဟုလည်း ခေါ်သည်။

ဒီကုဒ်ဒါအလွှာသည် ချုံ့ထားသောဒေတာကိုယူကာ မူလ၊ ပြောင်းလဲမထားသောဒေတာကဲ့သို့ တူညီသောအတိုင်းအတာဖြင့် ကိုယ်စားပြုမှုအဖြစ်သို့ ပြန်ပြောင်းရန်အတွက် တာဝန်ရှိသည်။ ကုဒ်ပြောင်းကိရိယာမှ ဖန်တီးထားသည့် ငုပ်လျှိုးနေသောနေရာ ကိုယ်စားပြုမှုဖြင့် ပြောင်းလဲခြင်းကို လုပ်ဆောင်ပါသည်။

autoencoder ၏အခြေခံအကျဆုံးတည်ဆောက်ပုံသည် multilayer perceptrons များတွင်အသုံးပြုသော single layer perceptron ကဲ့သို့ဖွဲ့စည်းပုံနှင့်အတူ feed-forward ဗိသုကာတစ်ခုဖြစ်သည်။ ပုံမှန် feed-forward neural ကွန်ရက်များကဲ့သို့ပင်၊ အလိုအလျောက် ကုဒ်ပြောင်းခြင်းအား backpropagation ကိုအသုံးပြုခြင်းအားဖြင့် လေ့ကျင့်သင်ကြားပေးပါသည်။

Autoencoder ၏ အရည်အချင်းများ

autoencoders အမျိုးအစား အမျိုးမျိုးရှိသော်လည်း ၎င်းတို့အားလုံးတွင် ၎င်းတို့ကို ပေါင်းစည်းနိုင်သော အချို့သော ဂုဏ်သတ္တိများရှိသည်။

Autoencoders များသည် အလိုအလျောက် လေ့လာနိုင်သည်။ ၎င်းတို့သည် အညွှန်းများမလိုအပ်ပါ၊ ဒေတာအလုံအလောက်ပေးထားပါက တိကျသောထည့်သွင်းဒေတာအမျိုးအစားတစ်ခုတွင် မြင့်မားသောစွမ်းဆောင်ရည်ရောက်ရှိရန် အော်တိုကုဒ်ဒါတစ်ခုရရှိရန် လွယ်ကူပါသည်။

Autoencoders များသည် ဒေတာသီးသန့်ဖြစ်သည်။ ဆိုလိုသည်မှာ ၎င်းတို့သည် autoencoder လေ့ကျင့်ထားပြီးသော ဒေတာများနှင့် အလွန်ဆင်တူသည့် ဒေတာများကိုသာ ချုံ့နိုင်သည်ဟု ဆိုလိုသည်။ Autoencoders များသည်လည်း ဆုံးရှုံးမှုများဖြစ်ပြီး၊ ဆိုလိုသည်မှာ မော်ဒယ်၏ output များသည် input data နှင့် နှိုင်းယှဉ်လျှင် ကျဆင်းသွားမည်ဖြစ်သည်။

autoencoder တစ်ခုကို ဒီဇိုင်းဆွဲသည့်အခါ၊ စက်သင်ယူမှုအင်ဂျင်နီယာများသည် မတူညီသော မော်ဒယ် hyperparameters လေးခုကို အာရုံစိုက်ရန် လိုအပ်သည်- ကုဒ်အရွယ်အစား၊ အလွှာနံပါတ်၊ အလွှာတစ်ခုစီမှ nodes နှင့် ဆုံးရှုံးမှုလုပ်ဆောင်ချက်။

ကုဒ်အရွယ်အစားသည် ကွန်ရက်၏ အလယ်အပိုင်းကို မည်မျှအထိ node မည်မျှအစပြုသည်ကို ဆုံးဖြတ်ပေးသည်၊ နှင့် အနည်းငယ်သော nodes များသည် ဒေတာကို ပိုမိုချုံ့နိုင်သည် ။ နက်ရှိုင်းသော autoencoder တွင်၊ အလွှာများ၏ အရေအတွက်သည် အင်ဂျင်နီယာက သင့်လျော်သည်ဟု ယူဆသည့် မည်သည့်နံပါတ်မဆို ဖြစ်နိုင်သော်လည်း၊ ကုဒ်ဒါသည် ဆက်လက်လုပ်ဆောင်သည်နှင့်အမျှ အလွှာတစ်ခုရှိ node အရေအတွက် လျော့နည်းသွားမည်ဖြစ်သည်။ ဤအတောအတွင်း၊ ဆန့်ကျင်ဘက်သည် ကုဒ်ဒါစနစ်တွင် အမှန်ဖြစ်သည်၊ ဆိုလိုသည်မှာ ဒီကုဒ်ဒါအလွှာများသည် နောက်ဆုံးအလွှာသို့ ချဉ်းကပ်လာသည်နှင့်အမျှ အလွှာတစ်ခုစီတွင် node အရေအတွက် တိုးလာသင့်သည်။ နောက်ဆုံးတွင်၊ autoencoder တစ်ခု၏ ဆုံးရှုံးမှုလုပ်ဆောင်ချက်သည် ပုံမှန်အားဖြင့် binary cross-entropy သို့မဟုတ် mean squared error ဖြစ်သည်။ Binary cross-entropy သည် 0 – 1 အကွာအဝေးအတွင်း ဒေတာ၏ ထည့်သွင်းမှုတန်ဖိုးများရှိသည့် ဥပမာများအတွက် သင့်လျော်သည်။

Autoencoder အမျိုးအစားများ

အထက်တွင်ဖော်ပြခဲ့သည့်အတိုင်း၊ ဂန္ထဝင် အော်တိုအင်တာကုဒ်ဒါဗိသုကာတွင် ကွဲလွဲမှုများ ရှိနေပါသည်။ မတူညီသော autoencoder ဗိသုကာများကို လေ့လာကြည့်ကြပါစို့။

ရံဖန်ရံခါ

ဓာတ်ပုံ- Michela Massi မှတဆင့် Wikimedia Commons, CC BY SA 4.0 (https://commons.wikimedia.org/wiki/File:Autoencoder_sparso.png)

autoencoders များတွင် ပုံမှန်အားဖြင့် node များကို လျှော့ချခြင်းဖြင့် data များကို compresses ပြုလုပ်သော ပိတ်ဆို့မှုတစ်ခုရှိသော်လည်း၊ autoencoder ကျဲs သည် ထိုပုံမှန်လည်ပတ်မှုပုံစံ၏ အခြားရွေးချယ်စရာတစ်ခုဖြစ်သည်။ သေးငယ်သောကွန်ရက်တွင်၊ ဝှက်ထားသောအလွှာများသည် ကုဒ်ဒါနှင့် ဒီကုဒ်ဒါအလွှာများကဲ့သို့ တူညီသောအရွယ်အစားကို ထိန်းသိမ်းထားသည်။ ယင်းအစား၊ ပေးထားသည့် အလွှာတစ်ခုအတွင်းရှိ လှုပ်ရှားဆောင်ရွက်မှုများကို အပြစ်ပေးခံရပြီး ၎င်းကို ချိန်ညှိခြင်းဖြင့် ဆုံးရှုံးမှုလုပ်ဆောင်ချက်သည် ထည့်သွင်းဒေတာ၏ ကိန်းဂဏန်းဆိုင်ရာ အင်္ဂါရပ်များကို ပိုမိုကောင်းမွန်စွာ ဖမ်းယူနိုင်မည်ဖြစ်သည်။ အခြားနည်းဖြင့်ပြောရလျှင်၊ ကျဲပါးသော autoencoder ၏ လျှို့ဝှက်အလွှာများသည် သမားရိုးကျ autoencoder ထက် ယူနစ်များ ပိုများနေသော်လည်း ၎င်းတို့ထဲမှ အချို့သော ရာခိုင်နှုန်းသည် သတ်မှတ်ထားသည့်အချိန်တိုင်းတွင်သာ လုပ်ဆောင်နေပါသည်။ အထိရောက်ဆုံးသော အသက်သွင်းခြင်းလုပ်ဆောင်ချက်များကို ထိန်းသိမ်းထားပြီး အခြားအရာများကို လျစ်လျူရှုထားကာ ဤကန့်သတ်ချက်သည် ကွန်ရက်သည် ထည့်သွင်းဒေတာ၏ အထူးခြားဆုံးအင်္ဂါရပ်များကို ဆုံးဖြတ်ရန် ကူညီပေးသည်။

စာချုပ်စာတမ်း

စာချုပ်ပါ autoencoders ဒေတာ၏ တစ်သမတ်တည်း ကိုယ်စားပြုမှုကို ထိန်းသိမ်းထားခြင်းဖြင့် သေးငယ်သော ကွဲပြားမှုများကို ခံနိုင်ရည်ရှိစေရန် ဒီဇိုင်းထုတ်ထားပါသည်။ ဆုံးရှုံးမှုလုပ်ဆောင်ချက်အတွက် ပြစ်ဒဏ်ကို ကျင့်သုံးခြင်းဖြင့် ၎င်းကို ပြီးမြောက်စေသည်။ ဤပုံမှန်ပြုလုပ်ခြင်းနည်းလမ်းသည် သွင်းသွင်းကုဒ်သွင်းခြင်းလုပ်ဆောင်မှုများအတွက် Jacobian matrix ၏ Frobenius စံနှုန်းပေါ်တွင် အခြေခံထားသည်။ ဤပုံမှန်ပြုလုပ်ခြင်းနည်းပညာ၏ အကျိုးသက်ရောက်မှုသည် ပုံစံတူထည့်သွင်းမှုများတွင် အလားတူကုဒ်နံပါတ်များ ပါရှိသည့် ကုဒ်နံပါတ်တစ်ခုကို တည်ဆောက်ရန် ခိုင်းစေခြင်းပင်ဖြစ်သည်။

အပြောင်းအလဲ

Convolutional autoencoders များ ဒေတာကို အပိုင်းခွဲများအဖြစ် ပိုင်းခြားပြီး ဒေတာ၏ ကိုယ်စားပြုမှုအသစ်ကို ဖန်တီးရန် အတူတကွ ပေါင်းစပ်ထားသော ရိုးရှင်းသော အချက်ပြမှုများအဖြစ် ပြောင်းလဲခြင်းဖြင့် ဒေတာထည့်သွင်းမှုကို ကုဒ်နံပါတ်ဖြင့် ကုဒ်လုပ်ပါ။ convolution neural networks များနှင့်ဆင်တူသည်၊ convolutional autoencoder သည် image data များကိုလေ့လာရာတွင် အထူးပြုထားပြီး ၎င်းသည် image section တစ်ခုလုံးကို အပိုင်းလိုက်ရွှေ့ထားသော filter ကိုအသုံးပြုသည်။ ကုဒ်ပြောင်းသည့်အလွှာမှ ထုတ်ပေးသော ကုဒ်နံပါတ်များသည် ရုပ်ပုံကို ပြန်လည်တည်ဆောက်ရန်၊ ရုပ်ပုံပေါ်လွင်စေရန် သို့မဟုတ် ပုံ၏ ဂျီသြမေတြီကို မွမ်းမံရန်အတွက် အသုံးပြုနိုင်သည်။ ကွန်ရက်မှ စစ်ထုတ်မှုများကို လေ့လာပြီးသည်နှင့်၊ ၎င်းတို့ကို ပုံ၏အင်္ဂါရပ်များကို ထုတ်ယူရန် လုံလောက်သော အလားတူထည့်သွင်းမှုတစ်ခုခုတွင် ၎င်းတို့ကို အသုံးပြုနိုင်သည်။

နှိမ်နှင်းခြင်း။

ဓာတ်ပုံ- Wikimedia Commons မှတဆင့် MAL၊ CC BY SA 3.0 (https://en.wikipedia.org/wiki/File:ROF_Denoising_Example.png)

autoencoders များကို ငြင်းပယ်ခြင်း။ ကုဒ်ပြောင်းခြင်းသို့ ဆူညံသံကို ထည့်သွင်းပေးခြင်းဖြင့် မူလထည့်သွင်းဒေတာ၏ ပျက်စီးသွားသော ကုဒ်ပြောင်းသည့်ဗားရှင်းကို ဖြစ်ပေါ်စေသည်။ ဤပျက်စီးသွားသောဒေတာဗားရှင်းကို မော်ဒယ်လေ့ကျင့်ရန်အတွက် အသုံးပြုသော်လည်း ဆုံးရှုံးမှုလုပ်ဆောင်ချက်သည် အထွက်တန်ဖိုးများကို မူရင်းထည့်သွင်းမှုနှင့် နှိုင်းယှဉ်ကာ ပျက်စီးသွားသောထည့်သွင်းမှုမဟုတ်ပါ။ ရည်ရွယ်ချက်မှာ ကွန်ရက်သည် ရုပ်ပုံ၏မူရင်း၊ ပျက်စီးခြင်းမရှိသော ဗားရှင်းကို ပြန်လည်ထုတ်လုပ်နိုင်စေရန်ဖြစ်သည်။ ပျက်စီးနေသောဒေတာကို မူရင်းဒေတာနှင့် နှိုင်းယှဉ်ခြင်းဖြင့်၊ ကွန်ရက်သည် မည်သည့်ဒေတာ၏အင်္ဂါရပ်များ အရေးကြီးဆုံးဖြစ်ပြီး မည်သည့်အင်္ဂါရပ်များသည် အရေးမကြီးပါ/ ခြစားမှုဖြစ်ကြောင်း ကွန်ရက်မှ သိရှိပါသည်။ တစ်နည်းဆိုရသော် မော်ဒယ်တစ်ခုသည် ပျက်စီးနေသောပုံများကို ဖျောက်ဖျက်ရန်အတွက်၊ ရုပ်ပုံဒေတာ၏ အရေးကြီးသောအင်္ဂါရပ်များကို ထုတ်ယူရမည်ဖြစ်သည်။

ကွဲလွဲမှု

အမျိုးမျိုးသော အော်တိုကုဒ်နံပါတ်များ ဒေတာ၏ ငုပ်လျှိုးနေသော ကိန်းရှင်များကို မည်ကဲ့သို့ ဖြန့်ဝေကြောင်း ယူဆချက်များဖြင့် လုပ်ဆောင်သည်။ ကွဲပြားသော အော်တိုအင်တာကုဒ်ဒါသည် လေ့ကျင့်ရေးပုံရိပ်များ/ငုပ်လျှိုးနေသော အင်္ဂါရပ်များအတွက် ဖြစ်နိုင်ခြေ ဖြန့်ဖြူးမှုကို ထုတ်ပေးသည်။ လေ့ကျင့်သင်ကြားသည့်အခါ၊ ကုဒ်ပြောင်းကိရိယာသည် ထည့်သွင်းပုံများ၏ မတူညီသောအင်္ဂါရပ်များအတွက် ငုပ်လျှိုးနေသော ဖြန့်ဝေမှုများကို ဖန်တီးပေးသည်။

 

မော်ဒယ်သည် သီးခြားတန်ဖိုးများအစား Gaussian ဖြန့်ဝေမှုများအဖြစ် အင်္ဂါရပ်များ သို့မဟုတ် ရုပ်ပုံများကို လေ့လာသောကြောင့်၊ ၎င်းကို ပုံအသစ်များထုတ်လုပ်ရန် အသုံးပြုနိုင်သည်။ Gaussian ဖြန့်ချီမှုသည် နမူနာပုံတစ်ပုံအား ဤ vector ကိုအခြေခံ၍ ပုံတစ်ပုံကို တင်ဆက်ပေးသည့် ကုဒ်ဝှက်ကွန်ရက်ထဲသို့ ထည့်သွင်းသည့် vector တစ်ခုကို ဖန်တီးရန် နမူနာဖြစ်သည်။ အခြေခံအားဖြင့်၊ မော်ဒယ်သည် လေ့ကျင့်ရေးပုံရိပ်များ၏ ဘုံအင်္ဂါရပ်များကို လေ့လာပြီး ၎င်းတို့ဖြစ်ပေါ်လာမည့် ဖြစ်နိုင်ခြေအချို့ကို သတ်မှတ်ပေးသည်။ ထို့နောက် ဖြစ်နိုင်ခြေ ဖြန့်ဝေမှုကို ပုံတစ်ပုံအား အင်ဂျင်နီယာပြောင်းပြန်လှန်ရန်၊ မူရင်း၊ လေ့ကျင့်ရေးပုံများနှင့် ဆင်တူသော ပုံအသစ်များကို ဖန်တီးရန် အသုံးပြုနိုင်သည်။

ကွန်ရက်ကို လေ့ကျင့်ပေးသည့်အခါ၊ ကုဒ်လုပ်ထားသော ဒေတာကို ခွဲခြမ်းစိတ်ဖြာပြီး အသိအမှတ်ပြုမှုပုံစံသည် ပုံများ၏ ပျမ်းမျှနှင့် စံသွေဖည်မှုကို ဆွဲထုတ်ကာ vector နှစ်ခုကို ထုတ်ပေးသည်။ ဤတန်ဖိုးများကို အခြေခံ၍ ဖြန့်ဖြူးခြင်းကို ဖန်တီးပါသည်။ ၎င်းသည် မတူညီသော ငုပ်လျှိုးနေသော အခြေအနေများအတွက် လုပ်ဆောင်သည်။ ထို့နောက် ဒီကုဒ်ဒါသည် သက်ဆိုင်ရာ ဖြန့်ဖြူးမှုမှ ကျပန်းနမူနာများကို ယူကာ ကွန်ရက်သို့ ကနဦးထည့်သွင်းမှုများကို ပြန်လည်တည်ဆောက်ရန် ၎င်းတို့ကို အသုံးပြုသည်။

Autoencoder အပလီကေးရှင်းများ

Autoencoders များကို တွင်တွင်ကျယ်ကျယ် အသုံးပြုနိုင်ပါသည်။ လျှောက်လွှာမျိုးစုံသို့သော် ၎င်းတို့ကို အတိုင်းအတာ လျှော့ချခြင်း၊ ဒေတာ ပျက်ပြားစေခြင်း၊ အင်္ဂါရပ် ထုတ်ယူခြင်း၊ ရုပ်ပုံထုတ်လုပ်ခြင်း၊ အပိုင်းလိုက် ခန့်မှန်းခြင်း နှင့် အကြံပြုချက် စနစ်များ ကဲ့သို့သော အလုပ်များအတွက် ပုံမှန်အားဖြင့် ၎င်းတို့ကို အသုံးပြုပါသည်။

Data denoising သည် ရုပ်ပုံများမှ စပါး/ဆူညံသံများကို ဖယ်ထုတ်ရန် autoencoders များကို အသုံးပြုခြင်းဖြစ်သည်။ အလားတူ၊ မှုန်ဝါးသောပုံများ သို့မဟုတ် ပျောက်နေသောပုံများကဲ့သို့ အခြားရုပ်ပုံပျက်စီးမှုများကို ပြုပြင်ရန်အတွက် အော်တိုကုဒ်ကိရိယာများကို အသုံးပြုနိုင်သည်။ Dimensionality လျှော့ချခြင်းသည် စွမ်းရည်မြင့်ကွန်ရက်များသည် ရုပ်ပုံများ၏ အသုံးဝင်ပုံများကို လေ့လာရန် ကူညီပေးနိုင်ပြီး၊ ဆိုလိုသည်မှာ အော်တိုကုဒ်ဒါများကို အခြားသော အာရုံကြောကွန်ရက်အမျိုးအစားများ၏ လေ့ကျင့်မှုကို တိုးမြှင့်ရန်အတွက် အသုံးပြုနိုင်သည်။ အခြားသော မော်ဒယ်များကို လေ့ကျင့်ရန်အတွက် အခြားသော လေ့ကျင့်ရေးဒေတာအတွဲများ၏ အင်္ဂါရပ်များကို ခွဲခြားသတ်မှတ်ရန် autoencoders များကို အသုံးပြုထားနိုင်သောကြောင့် feature ထုတ်ယူရန်အတွက် autoencoders များကို အသုံးပြုခြင်းသည်လည်း မှန်ကန်ပါသည်။

ရုပ်ပုံထုတ်လုပ်ခြင်းနှင့်ပတ်သက်၍၊ မျက်နှာမှတ်သားမှုစနစ်များကို ဒီဇိုင်းထုတ်ခြင်း သို့မဟုတ် ကာတွန်းရုပ်ပုံသဏ္ဌာန်အချို့ကို အလိုအလျောက်လုပ်ဆောင်ရန် အပလီကေးရှင်းများပါရှိသော လူ့ပုံအတုများ သို့မဟုတ် ကာတွန်းဇာတ်ကောင်များကို ဖန်တီးရန်အတွက် အော်တိုကုဒ်ကိရိယာများကို အသုံးပြုနိုင်သည်။

တစ်ဆက်တည်းမှ တစ်ဆက်တည်း ခန့်မှန်းသည့် မော်ဒယ်များကို ဒေတာ၏ ယာယီဖွဲ့စည်းပုံအား ဆုံးဖြတ်ရန် အသုံးပြုနိုင်ပြီး၊ ဆိုလိုသည်မှာ ဆက်တိုက်တစ်ခုတွင်ပင် နောက်တစ်ခုအား ထုတ်လုပ်ရန်အတွက် အော်တိုကုဒ်ဒါကို အသုံးပြုနိုင်သည်။ ဤအကြောင်းကြောင့်၊ ဗီဒီယိုများထုတ်လုပ်ရန် အော်တိုကုဒ်ဒါကို အသုံးပြုနိုင်သည်။ နောက်ဆုံးတွင်၊ အသုံးပြုသူ၏ပါဝင်ပတ်သက်မှုဒေတာကို ခွဲခြမ်းစိတ်ဖြာပြီး ကုဒ်ဒါသည် အသုံးပြုသူ၏ပါဝင်ပတ်သက်မှုဒေတာကို ခွဲခြမ်းစိတ်ဖြာကာ ဒီကုဒ်ဒါသည် အသုံးပြုသူစိတ်ဝင်စားမှုနှင့်သက်ဆိုင်သည့်ပုံစံများကို ကောက်ယူခြင်းဖြင့် အကြံပြုချက်စနစ်များဖန်တီးရန် နက်ရှိုင်းသော အော်တိုကုဒ်ကိရိယာများကို အသုံးပြုနိုင်သည်။

ဘလော့ဂါနှင့် ပရိုဂရမ်မာများအတွက် အထူးပြုပါ။ စက်သင်ယူ နှင့် နက်ရှိုင်းသောသင်ယူခြင်း အကြောင်းအရာများ လူမှုဆက်ဆံရေးကောင်းမွန်ရန်အတွက် AI ၏စွမ်းအားကို အခြားသူများအား ကူညီပေးနိုင်ရန် Daniel က မျှော်လင့်ထားသည်။