ဆောင်းပါးတို 'ပျက်စီးနေသော' Synthetic Faces များသည် Facial Image Recognition ကို ပိုမိုကောင်းမွန်အောင် ကူညီပေးနိုင်သည် - Unite.AI
ကြှနျုပျတို့နှငျ့အတူချိတ်ဆက်ပါ

စောင့်ကြပ်ခြင်း

'ပျက်စီးနေသော' Synthetic Faces များသည် Facial Image Recognition ကို ပိုမိုကောင်းမွန်အောင် ကူညီပေးနိုင်သည်။

mm

Published

 on

Michigan State University မှ သုတေသီများသည် ရုပ်ပုံမှတ်သားမှုစနစ်များကို ပိုမိုတိကျစေရန် ကူညီပေးခြင်းဖြင့် deepfakes မြင်ကွင်းမှ အနားယူပြီး ကမ္ဘာပေါ်ရှိ အချို့သော ကောင်းကျိုးများကို လုပ်ဆောင်ရန် ပေါင်းစပ်ဖန်တီးထားသော မျက်နှာများအတွက် နည်းလမ်းတစ်ခုကို တီထွင်ခဲ့သည်။

ထိန်းချုပ်နိုင်သော မျက်နှာပေါင်းစပ်မှု မော်ဂျူး (CFSM) အသစ်သည် ထင်ရှားကျော်ကြားသူများ၏ လူကြိုက်များသော open source datasets များတွင် အသုံးပြုသည့် တူညီသော အရည်အသွေးမြင့်ပုံများကို အားကိုးခြင်းထက် လက်တွေ့ကမ္ဘာဗီဒီယို စောင့်ကြည့်ဗီဒီယိုပုံစံဖြင့် မျက်နှာများကို ပြန်လည်ထုတ်ပေးနိုင်စွမ်းရှိသည်။ မျက်နှာမှုန်ဝါးခြင်း၊ ကြည်လင်ပြတ်သားမှုနည်းခြင်းနှင့် အာရုံခံဆူညံသံများကဲ့သို့သော စစ်မှန်သော CCTV စနစ်များ၏ ချို့ယွင်းချက်များနှင့် ချို့ယွင်းချက်အားလုံးကို ထင်ဟပ်ခြင်းမရှိပါ - အသိအမှတ်ပြုမှု တိကျမှုကို ထိခိုက်စေနိုင်သော အချက်များ။

Controllable Face Synthesis Module (CFSM) အတွက် အယူအဆတည်ဆောက်မှု။ အရင်းအမြစ်- http://cvlab.cse.msu.edu/pdfs/Liu_Kim_Jain_Liu_ECCV2022.pdf

Controllable Face Synthesis Module (CFSM) အတွက် အယူအဆတည်ဆောက်မှု။ အရင်းအမြစ်- http://cvlab.cse.msu.edu/pdfs/Liu_Kim_Jain_Liu_ECCV2022.pdf

CFSM သည် deepfake စနစ်များ၏ ရည်ရွယ်ချက်ဖြစ်သည့် ဦးခေါင်းပုံသဏ္ဍာန်၊ အမူအရာများ သို့မဟုတ် အခြားသော ပုံမှန်စရိုက်လက္ခဏာများအားလုံးကို စစ်မှန်စွာ အတုယူရန် အတိအကျ ရည်ရွယ်ထားခြင်း မဟုတ်ဘဲ၊ ပစ်မှတ် အသိအမှတ်ပြုမှု စနစ်ပုံစံရှိ အခြားအခြားသော အမြင်များကို ဖန်တီးရန်၊ စတိုင်လွှဲပြောင်း.

စနစ်သည် ပစ်မှတ်စနစ်၏ စတိုင်ဒိုမိန်းကို အတုယူရန်နှင့် ယင်းရှိ 'eccentricities' ၏ ကြည်လင်ပြတ်သားမှုနှင့် အကွာအဝေးအလိုက် ၎င်း၏ output ကို လိုက်လျောညီထွေဖြစ်အောင် ဒီဇိုင်းထုတ်ထားသည်။ အသုံးပြုမှုတွင် ကုန်ကျစရိတ်ကြောင့် အဆင့်မြှင့်တင်ရန် မဖြစ်နိုင်သော အမွေအနှစ်စနစ်များ ပါ၀င်သော်လည်း တစ်ချိန်က ထိပ်တန်းဖြစ်နိုင်သည့် ထုတ်ကုန်အရည်အသွေး ညံ့ဖျင်းမှုကြောင့် မျိုးဆက်သစ် မျက်နှာမှတ်မိခြင်းနည်းပညာများကို လတ်တလောတွင် အနည်းငယ်သာ ပံ့ပိုးပေးနိုင်သည့် စနစ်များ ပါဝင်သည်။

ဤစနစ်ကို စမ်းသပ်ရာတွင် ဤဆူညံသံနှင့် အဆင့်နိမ့်ဒေတာကို ကိုင်တွယ်ဖြေရှင်းရမည့် ရုပ်ပုံမှတ်မိခြင်းစနစ်တွင် ထင်ရှားသော အကျိုးကျေးဇူးများ ရရှိခဲ့ကြောင်း သုတေသီများက တွေ့ရှိခဲ့သည်။

ပစ်မှတ်စနစ်များ၏ ကန့်သတ်ချက်များနှင့်အညီ လိုက်လျောညီထွေဖြစ်အောင် မျက်နှာမှတ်သားမှုပုံစံများကို လေ့ကျင့်သင်ကြားပေးခြင်း။ အရင်းအမြစ်- http://cvlab.cse.msu.edu/pdfs/Liu_Kim_Jain_Liu_ECCV2022_supp.pdf

ပစ်မှတ်စနစ်များ၏ ကန့်သတ်ချက်များနှင့်အညီ လိုက်လျောညီထွေဖြစ်အောင် မျက်နှာမှတ်သားမှုပုံစံများကို လေ့ကျင့်သင်ကြားပေးခြင်း။ အရင်းအမြစ်- http://cvlab.cse.msu.edu/pdfs/Liu_Kim_Jain_Liu_ECCV2022_supp.pdf

၎င်းတို့သည် လုပ်ငန်းစဉ်၏ အသုံးဝင်သော အကျိုးရလဒ်ကို ထပ်မံတွေ့ရှိခဲ့သည် - အဆိုပါ ပစ်မှတ်ဒေတာအတွဲများကို ယခုအခါ ခွဲခြားသတ်မှတ်နိုင်ကာ အချင်းချင်း နှိုင်းယှဉ်ကာ နှိုင်းယှဉ်ခြင်း၊ စံနှုန်းသတ်မှတ်ခြင်းနှင့် အနာဂတ်တွင် မတူညီသော CCTV စနစ်များအတွက် ပိုမိုလွယ်ကူစေသည့် ဒေတာအတွဲများကို တီထွင်ထုတ်လုပ်နိုင်စေခြင်းလည်းဖြစ်သည်။

ထို့အပြင် အဆိုပါနည်းလမ်းကို လက်ရှိ datasets များတွင် အသုံးပြုနိုင်ပြီး လုပ်ဆောင်နိုင်သည်။ က de facto ဒိုမိန်း လိုက်လျောညီထွေဖြစ်အောင် မျက်နှာမှတ်မိခြင်းစနစ်များအတွက် ၎င်းတို့ကို ပိုမိုသင့်လျော်စေသည်။

အဆိုပါ အသစ်သောစက္ကူ ခေါင်းစဉ်ဖြစ်ပါတယ် အတားအဆီးမဲ့ မျက်နှာကို အသိအမှတ်ပြုခြင်းအတွက် ထိန်းချုပ်နိုင်သော လမ်းညွှန်ထားသော မျက်နှာပေါင်းစပ်မှုအမေရိကန် အမျိုးသားထောက်လှမ်းရေး ညွှန်ကြားရေးမှူးရုံး (ODNI၊ at IARPA) နှင့် MSU ရှိ ကွန်ပျူတာသိပ္ပံနှင့် အင်ဂျင်နီယာဌာနမှ သုတေသီ လေးဦးထံမှ လာခြင်းဖြစ်သည်။

အသားပေးအကြောင်းအရာ

အရည်အသွေးနိမ့် မျက်နှာမှတ်မိခြင်း (LQFR) ဖြစ်လာသည်။ ထင်ရှားသောလေ့လာမှုနယ်ပယ် လွန်ခဲ့သောနှစ်အနည်းငယ်အတွင်း။ မြို့ပြနှင့် စည်ပင်သာယာရေး အာဏာပိုင်များသည် ခံနိုင်ရည်ရှိပြီး ရေရှည်တည်တံ့စေရန် ဗီဒီယိုစောင့်ကြည့်ရေးစနစ်များကို တည်ဆောက်ထားသောကြောင့် (ပြဿနာအတွက် အရင်းအမြစ်များကို အခါအားလျော်စွာ ပြန်လည်ခွဲဝေပေးလိုခြင်းမဟုတ်)၊ များစွာသော 'အမွေအနှစ်' စောင့်ကြည့်ရေးကွန်ရက်များသည် ဒေတာအဖြစ် ၎င်းတို့၏ လိုက်လျောညီထွေရှိမှုနှင့် လိုက်လျောညီထွေရှိသော နည်းပညာဆိုင်ရာကြွေးမြီများ၏ သားကောင်များဖြစ်လာကြသည်။ machine learning အတွက် အရင်းအမြစ်များ။

သမိုင်းဝင်နှင့် မကြာသေးမီက ဗီဒီယိုစောင့်ကြည့်ရေးစနစ်အမျိုးမျိုးတွင် မျက်နှာကြည်လင်ပြတ်သားမှု အဆင့်အမျိုးမျိုးရှိသည်။ အရင်းအမြစ်- https://arxiv.org/pdf/1805.11519.pdf

သမိုင်းဝင်နှင့် မကြာသေးမီက ဗီဒီယိုစောင့်ကြည့်ရေးစနစ်အမျိုးမျိုးတွင် မျက်နှာကြည်လင်ပြတ်သားမှု အဆင့်အမျိုးမျိုးရှိသည်။ အရင်းအမြစ်- https://arxiv.org/pdf/1805.11519.pdf

ကံကောင်းစွာဖြင့်၊ ၎င်းသည် disffusion မော်ဒယ်များနှင့် အခြားသော ဆူညံသံအခြေခံ မော်ဒယ်များကို ဖြေရှင်းရန် ပုံမှန်မဟုတ်ဘဲ ကောင်းမွန်စွာ လိုက်လျောညီထွေ ဖြစ်နေသော အလုပ်ဖြစ်သည်။ မကြာသေးမီနှစ်များအတွင်း လူကြိုက်အများဆုံးနှင့် ထိရောက်မှုအရှိဆုံး ရုပ်ပုံပေါင်းစပ်မှုစနစ်များစွာကို လုပ်ဆောင်သည်။ upscaling ၎င်းတို့၏ ပိုက်လိုင်း၏ တစ်စိတ်တစ်ပိုင်းအနေဖြင့် ကြည်လင်ပြတ်သားမှု နည်းပါးသော ရုပ်ပုံများ ၊ ၎င်းသည် အာရုံကြော ဖိသိပ်မှု နည်းစနစ် (Bitmap data အစား အာရုံကြော ဒေတာအဖြစ် ပုံများနှင့် ရုပ်ရှင်များကို သိမ်းဆည်းရန် နည်းလမ်းများ) တွင်လည်း မရှိမဖြစ် လိုအပ်ပါသည်။

မျက်နှာမှတ်မိခြင်း၏ စိန်ခေါ်မှုတစ်စိတ်တစ်ပိုင်းမှာ အနည်းဆုံးအရေအတွက်မှ ဖြစ်နိုင်ခြေအများဆုံးတိကျမှုကို ရရှိရန်ဖြစ်သည်။ အင်္ဂါရပ်များ ၎င်းကို အသေးဆုံးနှင့် အလားအလာအနည်းဆုံး ပုံရိပ်ပြတ်သားမှုနိမ့်ပုံများမှ ထုတ်ယူနိုင်သည်။ ဤကန့်သတ်ချက်သည် ကြည်လင်ပြတ်သားမှုနည်းသောမျက်နှာကို ခွဲခြားသိမြင်နိုင်စေရန် (သို့မဟုတ်) ဖန်တီးနိုင်ရုံသာမက မည်သည့်အရာအတွက်မဆို လေ့ကျင့်သင်ကြားနေသည့် မော်ဒယ်တစ်ခု၏ ပေါ်ပေါက်လာသော ငုပ်လျှိုးနေသောနေရာကို ဖြတ်သန်းနိုင်သည့် ပုံများ၏ အရွယ်အစားဆိုင်ရာ နည်းပညာဆိုင်ရာ ကန့်သတ်ချက်များကြောင့်လည်း အသုံးဝင်ပါသည်။ VRAM ကို ဒေသတွင်း GPU တွင် ရနိုင်ပါသည်။

ဤသဘောအရ၊ 'အင်္ဂါရပ်များ' ဟူသော အသုံးအနှုန်းသည် ရှုပ်ထွေးနေသည်၊ အဘယ်ကြောင့်ဆိုသော် ထိုသို့သောအင်္ဂါရပ်များကို ပန်းခြံခုံတန်းလျားများ၏ အချက်အလက်အစုံမှလည်း ရယူနိုင်သည်။ ကွန်ပျူတာအမြင်ကဏ္ဍတွင် 'အင်္ဂါရပ်များ' ကို ရည်ညွှန်းသည်။ ထူးခြားသောလက္ခဏာများ ပုံများမှရရှိသည်- မည်သည့် ဘုရားရှိခိုးကျောင်းရဲ့ စည်းရိုးတွေပဲဖြစ်ဖြစ်၊ တောင်ကြီး၊ ဒါမှမဟုတ် ရုပ်ပုံတွေ မျက်နှာ မျက်နှာဒေတာအစုံရှိ အင်္ဂါရပ်များ။

ကွန်ပြူတာအမြင်အာရုံဆိုင်ရာ အယ်လဂိုရီသမ်များသည် ယခုအခါ ရုပ်ပုံများနှင့် ဗီဒီယိုဖိုင်များကို ချဲ့ထွင်ခြင်းတွင် ကျွမ်းကျင်လာသောကြောင့်၊ ကြည်လင်ပြတ်သားမှုနည်းသော သို့မဟုတ် အခြားနည်းဖြင့် ပျက်စီးသွားသော အမွေအနှစ် စောင့်ကြည့်ရေးပစ္စည်းကို 'မြှင့်တင်ရန်' နည်းလမ်းအမျိုးမျိုးကို အဆိုပြုခဲ့သည်။ တရားဥပဒေဆိုင်ရာ ရည်ရွယ်ချက်များအတွက် ထိုသို့သော တိုးမြင့်မှုများကို အသုံးပြုပါ။မှုခင်းစုံစမ်းစစ်ဆေးခြင်းနှင့်စပ်လျဉ်း၍ အခင်းဖြစ်ပွားရာနေရာ၌ လူတစ်ဦးကို နေရာချထားခြင်းကဲ့သို့သော၊

လွဲမှားစွာ ခွဲခြားသတ်မှတ်ခြင်း ဖြစ်နိုင်ခြေများအပြင်၊ ရံဖန်ရံခါ ခေါင်းစည်းများကို စုစည်းထားသည်။သီအိုရီအရ၊ တစ်ဦးချင်းစီ၏ အပြုသဘောဆောင်သော ခွဲခြားသတ်မှတ်မှုပြုလုပ်ရန်အတွက် ပုံရိပ်ပြတ်သားမှုနည်းသော ဗီဒီယိုများကို hyper-resolve သို့မဟုတ် တစ်နည်းတစ်ဖုံ ပြောင်းလဲရန် မလိုအပ်သင့်ပေ။ ရှင်းလင်းမှု။ ထို့အပြင် ယင်းကဲ့သို့ အသွင်ကူးပြောင်းမှုများသည် လက်တွေ့တွင် စျေးကြီးပြီး ထပ်လောင်းမြှင့်တင်ရန်၊ ထပ်တလဲလဲမေးခွန်းများ ၎င်းတို့၏ ဖြစ်နိုင်ချေရှိသော တရားဝင်မှုနှင့် တရားဥပဒေစိုးမိုးမှု ဝန်းကျင်။

'Down-At-Heel' Celebrities များ ပိုမိုလိုအပ်ခြင်း။

မျက်နှာမှတ်သားမှုစနစ်သည် အင်္ဂါရပ်များ (ဥပမာ စက်သင်ယူခြင်းဆိုင်ရာ အင်္ဂါရပ်များ) ကို ရယူနိုင်ခဲ့ပါက ပိုမိုအသုံးဝင်မည်ဖြစ်သည်။ လူ့ အင်္ဂါရပ်များ) ၎င်းတို့ရပ်တည်နေသည့်အတိုင်း အမွေအနှစ်စနစ်များ၏ ထွက်ရှိမှုမှ၊ 'မြင့်မားသောကြည်လင်ပြတ်သားမှု' ဝိသေသလက္ခဏာနှင့် အစားထိုးမရနိုင်သော (မကြာခဏအစားထိုးမရနိုင်သော) ရှိပြီးသား ဗီဒီယိုစောင့်ကြည့်ရေးဘောင်များတွင် ရရှိနိုင်သော ပျက်စီးယိုယွင်းနေသော ရုပ်ပုံများအကြား ဆက်ဆံရေးကို ပိုမိုကောင်းမွန်စွာ နားလည်ခြင်းဖြင့်၊

ဤနေရာတွင် ပြဿနာမှာ စံနှုန်းများထဲမှ တစ်ခုဖြစ်သည်- ဘုံဝဘ်မှ စုစည်းထားသော ဒေတာအတွဲများ ကဲ့သို့သော MS-Celeb-1M နှင့် WebFace260M (အခြားများစွာတို့တွင်) ရှိခဲ့ဖူးသည်။ ပေါ်သို့ ချိတ်ထားသည်။ သုတေသနအသိုက်အဝန်းမှ သုတေသီများသည် ၎င်းတို့၏ တိုးမြင့်လာမှု သို့မဟုတ် ကြီးမားသောတိုးတက်မှုကို လက်ရှိအနုပညာအခြေအနေနှင့် နှိုင်းယှဉ်နိုင်သည့် တသမတ်တည်း စံနှုန်းများကို ပေးဆောင်သောကြောင့်ဖြစ်သည်။

Microsoft ၏ နာမည်ကြီး MS-Celeb1m ဒေတာအတွဲမှ နမူနာများ။ အရင်းအမြစ်- https://www.microsoft.com/en-us/research/project/ms-celeb-1m-challenge-recognizing-one-million-celebrities-real-world/

Microsoft ၏ နာမည်ကြီး MS-Celeb1m ဒေတာအတွဲမှ နမူနာများ။ အရင်းအမြစ်- https://www.microsoft.com/en-us/research/project/ms-celeb-1m-challenge-recognizing-one-million-celebrities-real-world/

သို့ရာတွင်၊ ဤဒေတာအတွဲများတွင် လေ့ကျင့်ထားသော မျက်နှာမှတ်မိခြင်း (FR) အယ်လဂိုရီသမ်များသည် ရှေးခေတ်စောင့်ကြည့်ရေးစနစ်များစွာမှထွက်ရှိထားသော အမြင် 'ဒိုမိန်းများ' အတွက် မသင့်လျော်ကြောင်း စာရေးသူများက ငြင်းခုံကြသည်။

စာတမ်းတွင်ဖော်ပြထားသည် *

'[State-of-the-art] (SoTA) FR မော်ဒယ်များသည် ဒိုမိန်းပြောင်းမှုပြဿနာကြောင့် ရရှိသော ကြီးမားသော လေ့ကျင့်ရေးဒေတာအတွဲများ ( semi-constrained ) ကြောင့် ကောင်းစွာအလုပ်မလုပ်ပါ။ ဝဘ်မှ ကူးယူလာသော ကျော်ကြားသူများ၏ မျက်နှာများမှတစ်ဆင့် မွေးရာပါ အာရုံခံကိရိယာ ဆူညံသံ၊ ကြည်လင်ပြတ်သားမှု နည်းပါးသော၊ လှုပ်ရှားမှု မှုန်ဝါးမှု၊ လှိုင်းထန်သည့် အကျိုးသက်ရောက်မှု စသည်တို့ကဲ့သို့-the-wild ကွဲလွဲမှုများ မရှိပေ။

'ဥပမာ၊ 1:1 အတည်ပြုမှု တိကျမှုကို ဖော်ပြသည်။ SoTA မော်ဒယ်များထဲမှ တစ်ခု အချုပ်အနှောင်ကင်းသောအပေါ် IJB-S dataset သည် semi-constrained ထက် 30% ခန့်နိမ့်သည်။ LFW.

'ထိုကဲ့သို့သော စွမ်းဆောင်ရည်ကွာဟမှုကို ကုစားနိုင်သည့် အလားအလာမှာ အတားအဆီးမဲ့ ကြီးမားသော မျက်နှာဒေတာအတွဲကို စုစည်းရန်ဖြစ်သည်။ သို့သော်၊ ဘာသာရပ်ပေါင်း သောင်းနှင့်ချီရှိသော လေ့ကျင့်ရေးဒေတာအတွဲကို တည်ဆောက်ခြင်းသည် မြင့်မားသော လက်စွဲတံဆိပ်ကပ်ခြင်းကုန်ကျစရိတ်ဖြင့် တားမြစ်ရန်ခက်ခဲသည်။'

သမိုင်းဆိုင်ရာ သို့မဟုတ် ကုန်ကျစရိတ်နည်းသော စောင့်ကြည့်ရေးစနစ်များမှ အမျိုးမျိုးကွဲပြားသော ရလဒ်များကို 'ကိုက်ညီ' ရန် ကြိုးပမ်းခဲ့သည့် အမျိုးမျိုးသော ယခင်နည်းလမ်းများကို ပြန်ရေတွက်ထားသော်လည်း ၎င်းတို့သည် 'မျက်ကန်း' တိုးမြှင့်မှုများနှင့် ပတ်သက်ကြောင်း သတိပြုပါ။ ဆန့်ကျင်ဘက်အားဖြင့်၊ CFSM သည် လေ့ကျင့်နေစဉ်အတွင်း ပစ်မှတ်စနစ်၏ လက်တွေ့ကမ္ဘာထွက်ရှိမှုမှ တိုက်ရိုက်တုံ့ပြန်ချက်ကို လက်ခံရရှိပြီး ၎င်းဒိုမိန်းကိုတုပရန် စတိုင်လွှဲပြောင်းမှုမှတစ်ဆင့် သူ့ကိုယ်သူ လိုက်လျောညီထွေဖြစ်အောင် ပြုလုပ်သည်။

မင်းသမီး Natalie Portman သည် ကွန်ပျူတာအမြင်အသိုက်အဝန်းကို လွှမ်းမိုးထားသည့် လက်တစ်ဆုပ်စာ ဒေတာအတွဲများနှင့် မစိမ်းတော့ဘဲ၊ အမှန်တကယ် ပစ်မှတ်မော်ဒယ်၏ ဒိုမိန်း၏ တုံ့ပြန်ချက်အပေါ် အခြေခံ၍ CFSM လုပ်ဆောင်နေသည့် စတိုင်နှင့်လိုက်ဖက်သော ဒိုမိန်းကို လိုက်လျောညီထွေဖြစ်အောင် လုပ်ဆောင်ခြင်း၏ အထောက်အထားများကြားတွင် လက္ခဏာများ ပါဝင်သည်။

မင်းသမီး Natalie Portman သည် ကွန်ပျူတာအမြင်အသိုက်အဝန်းကို လွှမ်းမိုးထားသည့် လက်တစ်ဆုပ်စာ ဒေတာအတွဲများနှင့် မစိမ်းတော့ဘဲ၊ အမှန်တကယ် ပစ်မှတ်မော်ဒယ်၏ ဒိုမိန်း၏ တုံ့ပြန်ချက်အပေါ် အခြေခံ၍ CFSM လုပ်ဆောင်နေသည့် စတိုင်နှင့်လိုက်ဖက်သော ဒိုမိန်းကို လိုက်လျောညီထွေဖြစ်အောင် လုပ်ဆောင်ခြင်း၏ အထောက်အထားများကြားတွင် လက္ခဏာများ ပါဝင်သည်။

စာရေးဆရာများမှ ဒီဇိုင်းထုတ်ထားသော ဗိသုကာလက်ရာသည် Fast Gradient Sign Method ကိုအသုံးပြုသည် (FGSM) ပစ်မှတ်စနစ်၏ စစ်မှန်သောထွက်ရှိမှုမှရရှိသောပုံစံများနှင့် ဝိသေသလက္ခဏာများကို သီးခြားခွဲခြားပြီး 'တင်သွင်းခြင်း'။ ရုပ်ပုံထုတ်လုပ်ခြင်းအတွက် မြှုပ်နှံထားသည့် ပိုက်လိုင်း၏ အစိတ်အပိုင်းသည် နောက်ပိုင်းတွင် တိုးတက်ကောင်းမွန်လာပြီး လေ့ကျင့်မှုဖြင့် ပစ်မှတ်စနစ်အပေါ် ပိုမိုသစ္စာရှိလာသည်။ ပစ်မှတ်စနစ်၏ အနိမ့်ပိုင်းပုံစံနေရာလွတ်မှ ဤတုံ့ပြန်ချက်သည် သဘာဝတွင် အဆင့်နိမ့်ပြီး ကျယ်ပြန့်ဆုံးရရှိလာသော အမြင်ဖော်ပြချက်များနှင့် သက်ဆိုင်ပါသည်။

စာရေးသူမှတ်ချက်။

'FR မော်ဒယ်မှ တုံ့ပြန်ချက်ဖြင့်၊ ပေါင်းစပ်ထားသော ပုံများသည် FR စွမ်းဆောင်ရည်အတွက် ပိုမိုအကျိုးရှိစေပြီး ၎င်းတို့နှင့် လေ့ကျင့်ထားသော FR မော်ဒယ်များ၏ ယေဘုယျလုပ်ဆောင်နိုင်စွမ်းများကို သိသိသာသာ တိုးတက်စေသည်။'

စမ်းသပ်မှုများ

သုတေသီများသည် MSU ၏ကိုယ်ပိုင်ကိုအသုံးပြုသည်။ အရင်အလုပ် ၎င်းတို့၏စနစ်အား စမ်းသပ်ရန်အတွက် ပုံစံတစ်ခုအနေဖြင့် တူညီသော စမ်းသပ်မှု ပရိုတိုကောများကို အခြေခံ၍ ၎င်းတို့သည် တံဆိပ်တပ်ထားသော လေ့ကျင့်ရေးဒေတာအတွဲအဖြစ် ဝဘ်မှဆွဲယူထားသော နာမည်ကြီးဓာတ်ပုံများ သီးသန့်ပါဝင်သော MS-Celeb-1m ကို အသုံးပြုခဲ့သည်။ တရားမျှတမှုအတွက်၊ ၎င်းတို့တွင် အတန်းပေါင်း 1 ပါဝင်သည့် ပုံပေါင်း 2 သန်းပါဝင်သည့် MS3.9M-V85,700 ကိုလည်း ထည့်သွင်းထားသည်။

ပစ်မှတ် ဒေတာ ဖြစ်ခဲ့သည် WiderFace ဒေတာအတွဲHong Kong တရုတ်တက္ကသိုလ်မှ ၎င်းသည် စိန်ခေါ်မှု အခြေအနေများတွင် မျက်နှာကို ထောက်လှမ်းခြင်း လုပ်ငန်းများအတွက် ဒီဇိုင်းထုတ်ထားသော အထူးကွဲပြားသော ပုံများဖြစ်သည်။ ဤအတွဲမှ ပုံ 70,000 ကို အသုံးပြုခဲ့သည်။

အကဲဖြတ်ရန်အတွက်၊ စနစ်ကို မျက်နှာအသိအမှတ်ပြုမှုစံနှုန်းလေးခုနှင့် စမ်းသပ်ခဲ့သည်- : IJB-B, IJB-C, IJB-Sနှင့် TinyFace.

CFSM သည် MS-Celeb-10m မှ ပုံ 1 သန်းဝန်းကျင်၊ လေ့ကျင့်ရေးဒေတာ၏ ∼0.4% ဖြင့် လေ့ကျင့်သင်ကြားထားပြီး Adam optimizer အောက်တွင် 125,000 batch size ဖြင့် 32e-1 (အလွန်နိမ့်) သင်ယူမှုနှုန်းဖြင့် ထပ်လုပ်ခြင်း 4။

ပစ်မှတ်မျက်နှာ မှတ်သားမှုပုံစံကို အသုံးပြုထားသည်။ ပွောငျးလှဲခွငျး လေ့ကျင့်နေစဉ်အတွင်း ArcFace ဆုံးရှုံးမှုလုပ်ဆောင်ချက်ကို ဖွင့်ထားခြင်းဖြင့် ကျောရိုးအတွက် ResNet-50။ ထို့အပြင်၊ မော်ဒယ်တစ်ခုကို CFSM ဖြင့် လေ့ကျင့်သင်ကြားပေးပြီး ablation and comparative exercise (အောက်ဖော်ပြပါရလဒ်ဇယားတွင် 'ArcFace' အဖြစ် မှတ်သားထားသည်)။

CFSM အတွက် မူလစမ်းသပ်မှုများမှ ရလဒ်များ။ နံပါတ်မြင့်တာက ပိုကောင်းပါတယ်။

CFSM အတွက် မူလစမ်းသပ်မှုများမှ ရလဒ်များ။ နံပါတ်မြင့်တာက ပိုကောင်းပါတယ်။

စာရေးဆရာများသည် မူလရလဒ်များအပေါ် မှတ်ချက်ပေးသည်-

'ArcFace မော်ဒယ်သည် မျက်နှာခွဲခြားခြင်းနှင့် အတည်ပြုခြင်းလုပ်ငန်းနှစ်ခုစလုံးတွင် အခြေခံအချက်အားလုံးကို စွမ်းဆောင်ရည်ထက် သာလွန်စေပြီး SoTA စွမ်းဆောင်ရည်အသစ်ကို ရရှိစေပါသည်။'

အမွေဆက်ခံမှု သို့မဟုတ် သတ်မှတ်မထားသော စောင့်ကြည့်ရေးစနစ်များ၏ အမျိုးမျိုးသောဝိသေသလက္ခဏာများမှ ဒိုမိန်းများကို ထုတ်ယူနိုင်မှုသည် စာရေးသူအား ဤဘောင်များကြားတွင် ဖြန့်ဖြူးမှုဆိုင်ရာ တူညီမှုကို နှိုင်းယှဉ်အကဲဖြတ်နိုင်စေပြီး နောက်ဆက်တွဲအလုပ်တွင် အသုံးချနိုင်သည့် အမြင်ပုံစံ၏ သတ်မှတ်ချက်များနှင့်အညီ စနစ်တစ်ခုစီကို တင်ပြနိုင်စေပါသည်။ .

ဒေတာအတွဲအမျိုးမျိုးမှ နမူနာများသည် စတိုင်လ်တွင် ရှင်းရှင်းလင်းလင်း ကွဲပြားမှုများကို ပြသသည်။

ဒေတာအတွဲအမျိုးမျိုးမှ နမူနာများသည် စတိုင်လ်တွင် ရှင်းရှင်းလင်းလင်း ကွဲပြားမှုများကို ပြသသည်။

သုတေသနနှင့် အမြင်အသိုက်အဝန်းမှ ဖြေရှင်းရမည့် ပြဿနာများအဖြစ် ယနေ့အထိ ရှုမြင်ခံထားရသည့် အချို့သောနည်းပညာများကို တန်ဖိုးရှိစွာ အသုံးပြုနိုင်ကြောင်း စာရေးသူများ သတိပြုမိသည်-

'[CFSM] သည် ရန်သူများ၏ ခြယ်လှယ်မှုသည် တိုက်ခိုက်သူဖြစ်ခြင်းထက် ကျော်လွန်သွားနိုင်ပြီး အမြင်ဆိုင်ရာ လုပ်ဆောင်ချက်များတွင် အသိအမှတ်ပြုမှု တိကျမှုကို တိုးမြင့်လာစေရန် လုပ်ဆောင်နိုင်ကြောင်း ပြသသည်။ တစ်ချိန်တည်းတွင်၊ ကျွန်ုပ်တို့သည် အညွှန်းတစ်ခု သို့မဟုတ် ကိုးကွယ်ယုံကြည်မှုဆိုင်ရာ ကြိုတင်ခန့်မှန်းသည့်နည်းလမ်းဖြင့် စတိုင်ကွဲပြားမှုများကို ဖမ်းယူနိုင်သည့် သင်ယူထားသောစတိုင်အခြေများပေါ်အခြေခံ၍ ဒေတာအတွဲဆင်တူမှုမက်ထရစ်ကို သတ်မှတ်ပေးပါသည်။

'ကျွန်ုပ်တို့၏ သုတေသနသည် အတားအဆီးမဲ့ FR အတွက် ထိန်းချုပ်နိုင်သော လမ်းညွှန်ချက်ရှိသော မျက်နှာပေါင်းစပ်မှုပုံစံ၏ စွမ်းအားကို တင်ပြထားပြီး ဒေတာအတွဲကွဲပြားမှုများကို နားလည်ပေးသည်ဟု ကျွန်ုပ်တို့ ယုံကြည်ပါသည်။'

 

* ကျွန်ုပ်၏ စာရေးဆရာများ၏ အတွင်းလိုင်းကိုးကားချက်များကို ဟိုက်ပါလင့်ခ်များအဖြစ်သို့ ပြောင်းလဲခြင်း။

ဩဂုတ်လ 1 ရက် 2022 တွင် ပထမဆုံး ထုတ်ဝေခဲ့သည်။