ဆောင်းပါးတို AI သည် Blank Walls - Unite.AI မှဖော်ထုတ်ထားသောလျှို့ဝှက်လုပ်ဆောင်ချက်ကိုဖော်ထုတ်သည်။
ကြှနျုပျတို့နှငျ့အတူချိတ်ဆက်ပါ

စောင့်ကြပ်ခြင်း

AI သည် Blank Walls မှထုတ်ပြသောလျှို့ဝှက်လုပ်ဆောင်ချက်ကိုဖော်ထုတ်သည်။

mm

Published

 on

NVIDIA နှင့် MIT တို့မှ ပံ့ပိုးကူညီသူများ အပါအဝင် သုတေသန ပူးပေါင်းဆောင်ရွက်မှုတစ်ခုသည် အနီးနားရှိ နံရံတွင် သွယ်ဝိုက်သောအလင်းရောင်များကို ကြည့်နေရုံဖြင့် လျှို့ဝှက်သူများကို ရှာဖွေဖော်ထုတ်နိုင်သည့် စက်သင်ယူမှုနည်းလမ်းကို တီထွင်ခဲ့သည်။ အဆိုပါနည်းလမ်းသည် လျှို့ဝှက်ထားသောလူအရေအတွက်ကို ဖော်ထုတ်ရန်ကြိုးပမ်းသည့်အခါ 94% နီးပါး တိကျမှုရှိပြီး လူ့မျက်စိဖြင့်မမြင်နိုင်သော အလင်းပြန်ပေါက်မှုများကို ကျယ်ကျယ်ပြန့်ပြန့်ချဲ့ပေးခြင်းဖြင့် လျှို့ဝှက်ထားသောပုဂ္ဂိုလ်၏ လုပ်ဆောင်ချက်ကို ခွဲခြားသတ်မှတ်နိုင်ကာ စံပြုပုံရိပ်ချဲ့ထွင်မှုနည်းလမ်းများကို ဖော်ထုတ်နိုင်သည်။

ပြောင်းလဲမှုနယ်ပယ်များကို ခွဲခြားသတ်မှတ်ရန် convolutional neural networks ကိုအသုံးပြုသည့် နည်းလမ်းသစ်ဖြင့် ချဲ့ထွင်ထားသော အလင်း၏ အာရုံမခံနိုင်သော အနှောက်အယှက်များ။ အရင်းအမြစ်- https://www.youtube.com/watch?v=K4PapXyX-bI

ပြောင်းလဲမှုနယ်ပယ်များကို ခွဲခြားသတ်မှတ်ရန် convolutional neural networks ကိုအသုံးပြုသည့် နည်းလမ်းသစ်ဖြင့် ချဲ့ထွင်ထားသော အလင်း၏ အာရုံမခံနိုင်သော အနှောက်အယှက်များ။ အရင်းအမြစ်- https://www.youtube.com/watch?v=K4PapXyX-bI

အသစ် စက္ကူ ခေါင်းစဉ်ဖြစ်ပါတယ် ဗလာကျင်းနံရံကိုကြည့်ခြင်းဖြင့် သင်လေ့လာနိုင်သောအရာများNVIDIA နှင့် MIT တို့အပြင် Israel Institute of Technology မှ ပံ့ပိုးကူညီမှုများဖြင့်၊

'နံရံများကို မြင်ခြင်း' မတိုင်မီ ချဉ်းကပ်မှုများသည် ထိန်းချုပ်နိုင်သော အလင်းရောင်အရင်းအမြစ်များ သို့မဟုတ် ပိတ်ဆို့ခြင်း၏ လူသိများသော အရင်းအမြစ်များကို ကြိုတင်သိရှိမှုအပေါ် အားကိုးထားသော်လည်း နည်းပညာအသစ်သည် ပြန်လည်ချိန်ညှိရန် မလိုအပ်ဘဲ မည်သည့်အခန်းအသစ်တွင်မဆို ယေဘူယျအားဖြင့် ပြောင်းလဲနိုင်သည်။ လျှို့ဝှက်လူများကို သီးသန့်ခွဲခြားပေးသည့် convolutional neural network နှစ်ခုသည် မြင်ကွင်း 20 မှရရှိသော data ကိုအသုံးပြုသည်။

ပရောဂျက်သည် အန္တရာယ်များသော၊ လုံခြုံရေးအရ အရေးပါသော အခြေအနေများ၊ ရှာဖွေရေးနှင့် ကယ်ဆယ်ရေး လုပ်ငန်းများ၊ အထွေထွေ တရားဥပဒေစိုးမိုးရေး စောင့်ကြည့်ခြင်း လုပ်ငန်းများ၊ အရေးပေါ် တုံ့ပြန်မှု အခြေအနေများ၊ သက်ကြီးရွယ်အိုများကြား ပြုတ်ကျခြင်းကို သိရှိနိုင်စေရန်နှင့် ကိုယ်ပိုင်အုပ်ချုပ်ခွင့်ရ ယာဉ်များအတွက် လျှို့ဝှက် လမ်းသွားလမ်းလာများကို ရှာဖွေရန် နည်းလမ်းအဖြစ် ရည်ရွယ်ပါသည်။

Passive အကဲဖြတ်ခြင်း။

ကွန်ပြူတာအမြင်ပရောဂျက်များတွင် ဖြစ်လေ့ဖြစ်ထရှိသည့်အတိုင်း၊ ဗဟိုအလုပ်မှာ ရုပ်ပုံစီးကြောင်းတစ်ခုအတွင်း သိမြင်နိုင်သောပြောင်းလဲမှုများကို ခွဲခြားသတ်မှတ်ရန်နှင့် လည်ပတ်လုပ်ဆောင်ရန်ဖြစ်သည်။ အပြောင်းအလဲများကို ပေါင်းစပ်ခြင်းသည် လူအများအပြားကို ခွဲခြားသတ်မှတ်ရန် သို့မဟုတ် တစ်ဦး သို့မဟုတ် တစ်ခုထက်ပိုသော တစ်ဦးချင်းစီ၏ လုပ်ဆောင်ချက်ကို ရှာဖွေရန် လက်မှတ်ပုံစံများကို အသုံးပြုနိုင်သည်။

အလုပ်သည် ရောင်ပြန်မျက်နှာပြင်များကို အသုံးပြုရန်မလိုအပ်ဘဲ လုံးဝ passive scene evaluation ဖြစ်နိုင်ခြေကို ပွင့်စေသည်၊ Wi-Fi ကိုအချက်ပြမှုများ, ရေဒါ, အသံက သို့မဟုတ် အန္တရာယ်ရှိသော သို့မဟုတ် အရေးကြီးသော ပတ်ဝန်းကျင်တွင် လျှို့ဝှက်ထားသော လူသားများ ရှိနေခြင်းကို ထူထောင်ရန် ကြိုးပမ်းခဲ့သည့် မကြာသေးမီနှစ်များအတွင်း အခြားသော သုတေသန ကြိုးပမ်းမှုများတွင် လိုအပ်သည့် အခြားသော 'အထူးအခြေအနေများ' တစ်ခုခု။

သုတေသနအသစ်အတွက် အသုံးပြုသည့် အမျိုးအစား၏နမူနာဒေတာစုစည်းမှု မြင်ကွင်း။ အရာဝတ္ထုများသည် အရိပ်များမ၀င်စေရန် သို့မဟုတ် မည်သည့်အလင်းရောင်ကိုမျှ တိုက်ရိုက်မထိစေရန် ဂရုတစိုက်နေရာချထားပြီး ရောင်ပြန်ဟပ်သောမျက်နှာပြင်များ သို့မဟုတ် အခြား 'လိမ်လည်လှည့်ကွက်များ' ကို ခွင့်မပြုပါ။ အရင်းအမြစ်- https://arxiv.org/pdf/2108.13027.pdf

သုတေသနအသစ်အတွက် အသုံးပြုသည့် အမျိုးအစား၏နမူနာဒေတာစုစည်းမှု မြင်ကွင်း။ အရာဝတ္ထုများသည် အရိပ်များမ၀င်စေရန် သို့မဟုတ် မည်သည့်အလင်းရောင်ကိုမျှ တိုက်ရိုက်မထိစေရန် ဂရုတစိုက်နေရာချထားပြီး ရောင်ပြန်ဟပ်သောမျက်နှာပြင်များ သို့မဟုတ် အခြား 'လိမ်လည်လှည့်ကွက်များ' ကို ခွင့်မပြုပါ။ အရင်းအမြစ်- https://arxiv.org/pdf/2108.13027.pdf

ထိရောက်စွာ၊ အပလီကေးရှင်းအတွက် မျှော်မှန်းထားသော ပုံမှန်အခြေအနေအတွက် ပတ်ဝန်းကျင်အလင်းရောင်သည် အခင်းဖြစ်ပွားရာနေရာရှိ အခြားနေရာများတွင် ဝှက်ထားသူများထံမှ ရောင်ပြန်ဟပ်လာသော အလင်းကြောင့် ဖြစ်ပေါ်လာသော အသေးစားအနှောင့်အယှက်များကို လွှမ်းမိုးသွားမည်ဖြစ်သည်။ လူတစ်ဦးချင်းစီ၏ အလင်းအနှောက်အယှက်ပေးမှုသည် အများအားဖြင့် မြင်နိုင်သောအလင်းရောင်စုစုပေါင်း၏ 1% ထက်နည်းမည်ဟု သုတေသီများက တွက်ချက်သည်။

Static Lighting ကို ဖယ်ရှားခြင်း။

ပုံသဏ္ဍာန်တည်ငြိမ်သော နံရံရုပ်ပုံမှ ရွေ့လျားမှုကို ထုတ်ယူရန်အတွက်၊ ဗီဒီယို၏ ယာယီပျမ်းမျှအား တွက်ချက်ပြီး ဖရိမ်တစ်ခုစီမှ ဖယ်ရှားရန် လိုအပ်ပါသည်။ ထွက်ပေါ်လာသော ရွေ့လျားမှုပုံစံများသည် များသောအားဖြင့် အရည်အသွေးကောင်းမွန်သည့် ဗီဒီယိုကိရိယာများ၏ ဆူညံသံဘောင်အောက်၌ ရှိနေကြပြီး လှုပ်ရှားမှုအများစုသည် အနှုတ်ပစ်ဇယ်နေရာအတွင်းတွင် ဖြစ်ပေါ်ပါသည်။

ယင်းကို ကုစားရန်၊ သုတေသီများသည် ဗီဒီယိုကို ကိန်းဂဏန်း 16 ဖြင့် နမူနာကို နှိမ့်ချပြီး ရလဒ်ကို ကိန်းဂဏန်း 50 ဖြင့် မြှင့်တင်ကာ အနှုတ်ပစ်ဇယ်များ၏ ပါဝင်မှုကို ပိုင်းခြားရန် အလယ်အလတ်-မီးခိုးရောင် အခြေခံအဆင့်ကို ပေါင်းထည့်ကာ (အခြေခံဗီဒီယိုဖြင့် ထည့်တွက်၍မရပါ။ sensor noise)။

လူသားတို့ ရိပ်မိသော တံတိုင်းကြား ခြားနားချက် နှင့် လျှို့ဝှက်ထားသော ပုဂ္ဂိုလ်များ၏ နှောင့်ယှက်မှု များ။ ပုံအရည်အသွေးသည် ဤသုတေသနတွင် အဓိကပြဿနာဖြစ်သောကြောင့်၊ အရည်အသွေးပိုမြင့်သောပုံအတွက် ဆောင်းပါး၏အဆုံးတွင် တရားဝင်ဗီဒီယိုကို ဖတ်ရှုပါ။

လူသားတို့ ရိပ်မိသော တံတိုင်းကြား ခြားနားချက် နှင့် လျှို့ဝှက်ထားသော ပုဂ္ဂိုလ်များ၏ နှောင့်ယှက်မှု များ။ ပုံအရည်အသွေးသည် ဤသုတေသနတွင် အဓိကပြဿနာဖြစ်သောကြောင့်၊ အရည်အသွေးပိုမြင့်သောပုံအတွက် ဆောင်းပါး၏အဆုံးတွင် တရားဝင်ဗီဒီယိုကို ဖတ်ရှုပါ။

ရွေ့လျားမှုကို ရိပ်မိနိုင်သော အခွင့်အလမ်းပြတင်းပေါက်သည် အလွန်ပျက်စီးလွယ်ပြီး 60 Hz AC ကြိမ်နှုန်းဖြင့် မီးများ မှိတ်တုတ်မှိတ်တုတ်မှပင် ထိခိုက်နိုင်သည်။ ထို့ကြောင့် ဤသဘာဝအနှောက်အယှက်ကို အကဲဖြတ်ပြီး လူတစ်ဦး၏ လှုပ်ရှားမှုများ မပေါ်ပေါက်မီ ဗီဒီယိုဖိုင်မှ ဖယ်ရှားရန် လိုအပ်ပါသည်။

နောက်ဆုံးတွင်၊ စနစ်သည် လျှို့ဝှက်အခန်းအတွင်းနေထိုင်သူအရေအတွက်ကို အချက်ပြသည့် အာကာသ-အချိန်ကွက်လပ်များကို ထုတ်လုပ်သည် - သီးခြားအမြင်အာရုံဆိုင်ရာ လက်မှတ်များ-

အခန်းတွင်းရှိ လျှို့ဝှက်လူအရေအတွက် အမျိုးမျိုးကို ကိုယ်စားပြုသည့် နေရာ-အချိန်ကွက်ကွက်များ။

အခန်းတွင်းရှိ လျှို့ဝှက်လူအရေအတွက် အမျိုးမျိုးကို ကိုယ်စားပြုသည့် နေရာ-အချိန်ကွက်ကွက်များ။

မတူညီသော လူ့လုပ်ဆောင်မှုများသည် ခွဲခြားနိုင်ပြီး နောက်ပိုင်းတွင် အသိအမှတ်ပြုနိုင်သည့် လက်မှတ်နှောင့်ယှက်မှုများ ဖြစ်ပေါ်လိမ့်မည်-

လှုပ်ရှားမှုမရှိခြင်း၊ လမ်းလျှောက်ခြင်း၊ ဝပ်တွားခြင်း၊ လက်ဝှေ့ယမ်းခြင်းနှင့် ခုန်ခြင်းအတွက် အာကာသအချိန်ဇာတ်ကွက်သည် လက်မှတ်များဖြစ်သည်။

လှုပ်ရှားမှုမရှိခြင်း၊ လမ်းလျှောက်ခြင်း၊ ဝပ်တွားခြင်း၊ လက်ဝှေ့ယမ်းခြင်းနှင့် ခုန်ခြင်းအတွက် အာကာသအချိန်ဇာတ်ကွက်သည် လက်မှတ်များဖြစ်သည်။

လျှို့ဝှက်ပုဂ္ဂိုလ်အသိအမှတ်ပြုမှုအတွက် အလိုအလျောက်စက်သင်ယူမှုအခြေခံအလုပ်အသွားအလာကို ထုတ်လုပ်ရန်အတွက် ကျယ်ပြန့်သောဆင်တူသောဖွဲ့စည်းပုံများပေါ်တွင် လုပ်ဆောင်နေသော အာရုံကြောကွန်ရက်နှစ်ခုကို လေ့ကျင့်ရန် - မြင်ကွင်းတစ်ခုရှိ လူအရေအတွက်ကို ရေတွက်ရန်နှင့် နောက်တစ်ခုအား မည်သည့်လှုပ်ရှားမှုကိုမဆို ဖော်ထုတ်ပါ။

ဘာသာပြန်အတွက် စမ်းသပ်ခြင်း

သုတေသီများသည် အဆုံးစွန်အသုံးချမှုအတွက် မျှော်လင့်ထားသည့် ကန့်သတ်ချက်များကို ပြန်လည်ဖန်တီးရန် ဒီဇိုင်းထုတ်ထားသည့် မမြင်ရသော လက်တွေ့ကမ္ဘာပတ်ဝန်းကျင် ဆယ်ခုတွင် လေ့ကျင့်သင်ကြားထားသည့်စနစ်ကို စမ်းသပ်ခဲ့ကြသည်။ စနစ်သည် ဝှက်ထားသောလူများကို အမျိုးအစားခွဲခြားရာတွင် 94.4% တိကျမှု (256 frames ကျော် - ပုံမှန်အားဖြင့် ဗီဒီယို၏ 8 စက္ကန့်ကျော်သာ) နှင့် လှုပ်ရှားမှုများကို အမျိုးအစားခွဲခြားရာတွင် 93.7% တိကျမှု (တူညီသောအခြေအနေများအောက်တွင်) အထိ လုပ်ဆောင်နိုင်ခဲ့သည်။ ရင်းမြစ်ဘောင်များ နည်းပါးလာသဖြင့် တိကျမှု ကျဆင်းသွားသော်လည်း၊ ၎င်းသည် တစ်ပြေးညီ ကျဆင်းသွားခြင်း မဟုတ်ဘဲ 64 ဖရိမ်များပင်လျှင် 'လူအရေအတွက်' အကဲဖြတ်မှုအတွက် 79.4% တိကျမှုနှုန်းကို ရရှိလိမ့်မည် (ဖရိမ်အရေအတွက် လေးဆအတွက် 95% နီးပါး)။

အဆိုပါနည်းလမ်းသည် ရာသီဥတုအခြေခံအလင်းရောင်ပြောင်းလဲမှုများအတွက် အားကောင်းသော်လည်း ရုပ်မြင်သံကြားဖြင့် လင်းထိန်နေသောမြင်ကွင်းတစ်ခုတွင် သို့မဟုတ် ရောင်ပြန်ဟပ်နေသော နံရံကဲ့သို့ ရောင်ပြန်ဟပ်နေသော monotone ၀တ်စုံကို လူများဝတ်ဆင်သည့်အခြေအနေမျိုးတွင် ၎င်းသည် ရုန်းကန်နေရပါသည်။

ထုတ်ယူမှုများ၏ အရည်အသွေးမြင့် ဗီဒီယိုများအပါအဝင် သုတေသန၏ နောက်ထပ်အသေးစိတ်အချက်အလက်များကို အောက်ပါတရားဝင်ဗီဒီယိုတွင် ကြည့်ရှုနိုင်ပါသည်။

ဗလာကျင်းနံရံကိုကြည့်ခြင်းဖြင့် သင်လေ့လာနိုင်သောအရာများ