ဆောင်းပါးတို DeepMind- AI သည် လူ့အသိဉာဏ်ဆိုင်ရာ ကန့်သတ်ချက်များကို အမွေဆက်ခံနိုင်ပြီး 'တရားဝင်ပညာရေး' မှ အကျိုးကျေးဇူးရရှိနိုင်သည် - Unite.AI
ကြှနျုပျတို့နှငျ့အတူချိတ်ဆက်ပါ

ဉာဏ်ရည်တု

DeepMind- AI သည် လူသားတို့၏ အသိဉာဏ်ဆိုင်ရာ ကန့်သတ်ချက်များကို အမွေဆက်ခံနိုင်ပြီး 'တရားဝင်ပညာရေး' မှ အကျိုးကျေးဇူးရရှိနိုင်သည်။

mm
နောက်ဆုံးရေးသားချိန် on

DeepMind နှင့် Stanford University တို့မှ ပူးပေါင်းဆောင်ရွက်မှုအသစ်တစ်ခုအရ AI သည် လူများထက် စိတ်ကူးယဉ်ဆင်ခြင်ခြင်းတွင် မကြာခဏ ပိုမိုကောင်းမွန်ခြင်းမရှိကြောင်း အကြံပြုသည်၊ အကြောင်းမှာ စက်သင်ယူမှုပုံစံများသည် လက်တွေ့ကမ္ဘာမှ ၎င်းတို့၏ ကျိုးကြောင်းဆင်ခြင်ခြင်းဆိုင်ရာ ဗိသုကာလက်ရာများကို ရယူထားသောကြောင့် လက်တွေ့ကျသောအခြေအနေတွင် အခြေခံထားသော လူသားနမူနာများ (AI သည် မတွေ့ကြုံနိုင်ပေ။ ) သို့သော် ကျွန်ုပ်တို့၏ ကိုယ်ပိုင်အသိဉာဏ်ဆိုင်ရာ ချို့ယွင်းချက်များကြောင့်လည်း ဟန့်တားထားသည်။

သက်သေပြနိုင်သည်၊ ၎င်းသည် စက်သင်ယူမှုစနစ်များမှ လူအများမျှော်လင့်ထားသည့် သာလွန်ကောင်းမွန်သော 'ကောင်းကင်ပြာ' တွေးခေါ်မှုနှင့် အရည်အသွေးဆိုင်ရာ အတားအဆီးကို ကိုယ်စားပြုနိုင်ပြီး AI သည် လူသားအတွေ့အကြုံကို ထင်ဟပ်စေသည့်အတိုင်းအတာကို သရုပ်ဖော်ကာ တွေးခေါ်နိုင်စွမ်း (ဆင်ခြင်တုံတရား) ဖြစ်နိုင်သည်။ လူ့နယ်နိမိတ်အတွင်းက အကြောင်းကြားတယ်။

သုတေသီများက AI မော်ဒယ်များသည် လက်တွေ့လောကတွင် လုပ်ဆောင်ရန် မသတ်မှတ်မီ 'တရားဝင်ပညာရေး' နှင့် ခိုင်းနှိုင်းကာ စိတ်ကူးစိတ်သန်း ဆင်ခြင်ခြင်းအတွက် အကြိုလေ့ကျင့်ခြင်းမှ အကျိုးကျေးဇူးရရှိနိုင်သည်ဟု သုတေသီများက အကြံပြုထားသည်။

စာတမ်းတွင် -

‘လူသားများသည် မစုံလင်သော အကြောင်းပြချက်များဖြစ်သည်။ ကျွန်ုပ်တို့သည် ကမ္ဘာကြီးကို ကျွန်ုပ်တို့၏နားလည်သဘောပေါက်မှုနှင့် ကိုက်ညီသော အရာများနှင့် အခြေအနေများအကြောင်း အထိရောက်ဆုံး ကျိုးကြောင်းဆင်ခြင်ပါသည်။

'ကျွန်ုပ်တို့၏ စမ်းသပ်ချက်များအရ ဘာသာစကားပုံစံများသည် ဤအပြုအမူပုံစံများကို ထင်ဟပ်စေကြောင်း ပြသပါသည်။ ဘာသာစကားမော်ဒယ်များသည် ကျိုးကြောင်းဆီလျော်သော ကျိုးကြောင်းဆင်ခြင်ခြင်းလုပ်ငန်းများတွင် မှားယွင်းစွာလုပ်ဆောင်သော်လည်း ဤစွမ်းဆောင်ရည်သည် အကြောင်းအရာနှင့် အကြောင်းအရာအပေါ် မူတည်ပါသည်။ အသိသာဆုံးမှာ၊ လှုံ့ဆော်မှုများသည် စိတ်ကူးယဉ်ဆန်လွန်းသော သို့မဟုတ် ကမ္ဘာကြီးကို ကြိုတင်နားလည်မှုဖြင့် ဆန့်ကျင်နေသောအခါတွင် ယင်းပုံစံများသည် လူသားများ ကျရှုံးသည့်အခြေအနေများတွင် မကြာခဏပျက်ကွက်လေ့ရှိသည်။'

ဤကန့်သတ်ချက်များကြောင့် မည်သည့် hyperscale၊ GPT-level Natural Language Processing (NLP) မော်ဒယ်များ ထိခိုက်နိုင်သည်ကို စမ်းသပ်ရန်၊ သုတေသီများသည် သင့်လျော်သော မော်ဒယ်တစ်ခုတွင် စမ်းသပ်မှုသုံးခုကို ဆက်တိုက်လုပ်ဆောင်ခဲ့ပြီး၊ နိဂုံးချုပ်သည်*-

'ကျွန်ုပ်တို့သည် ထိုအနုပညာ၏ ကြီးမားသော ဘာသာစကားပုံစံများ (7 သို့မဟုတ် 70 ဘီလီယံ) ဖြင့် တွေ့ရှိရသည်။ parameters တွေကို) ဤလုပ်ငန်းခွင်များတွင် လူသားများ သတိပြုမိသော တူညီသောပုံစံများစွာကို ရောင်ပြန်ဟပ်သည် — လူသားများကဲ့သို့ပင်၊ မော်ဒယ်များသည် လက်တွေ့မကျသော သို့မဟုတ် စိတ္တဇမဟုတ်သည့်အရာများထက် ယုံကြည်နိုင်လောက်သော အခြေအနေများကို ပိုမိုထိရောက်စွာ ကျိုးကြောင်းပြပါသည်။

'ကျွန်ုပ်တို့၏ ရှာဖွေတွေ့ရှိချက်များသည် ဤသိမြင်မှုဆိုင်ရာ အကျိုးသက်ရောက်မှုများ နှစ်ခုလုံးကို နားလည်ခြင်းနှင့် ဘာသာစကား မော်ဒယ်စွမ်းဆောင်ရည်ကို အထောက်အကူပြုသည့် အချက်များ' ရှိသည်။

လက်တွေ့ကမ္ဘာ၏ အကျိုးကိုမပေးဘဲ AI တွင် ကျိုးကြောင်းဆင်ခြင်ခြင်းစွမ်းရည်ကို ဖန်တီးခြင်းသည် ထိုကျွမ်းကျင်မှုများကို ဆက်စပ်ထည့်သွင်းပေးသည့် ခန္ဓာငါးပါးအတွေ့အကြုံ၊ ထိုကဲ့သို့သောစနစ်များ၏ အလားအလာကို ကန့်သတ်နိုင်ကြောင်း စာတမ်းက အကြံပြုထားသည်။ 'အခြေခံအတွေ့အကြုံ… လူသားအချို့၏ ယုံကြည်ချက်နှင့် ကျိုးကြောင်းဆင်ခြင်မှုကို အထောက်အပံဖြစ်စေသည်ဟု ယူဆသည်'.

AI သည် ဘာသာစကားအား ခိုင်းစေခြင်း နှင့် တွေ့ကြုံခံစားရသည်ဟု စာရေးသူက ယူဆထားသော်လည်း လူသားများက ၎င်းကို လူမှုဆက်ဆံရေးအတွက် တက်ကြွပြီး အဓိက အစိတ်အပိုင်းတစ်ခုအဖြစ် တွေ့ကြုံရပြီး ဤတက်ကြွစွာပါဝင်မှုမျိုး (သမားရိုးကျ လူမှုရေးစနစ်များတွင် ပြစ်ဒဏ်ပေးခြင်းနှင့် ဆုလာဘ်များပါ၀င်သည်) သည် အဓိပ္ပာယ်နားလည်ရန် 'သော့ချက်' ဖြစ်နိုင်သည် လူသားတွေလုပ်တဲ့နည်းအတိုင်းပဲ။

သုတေသီများက သုံးသပ်သည်။

'ထို့ကြောင့် ဘာသာစကား မော်ဒယ်များနှင့် လူသားများကြား ခြားနားချက်အချို့သည် လူသားများ၏ ကြွယ်ဝသော၊ အခြေခံကျကျ၊ အပြန်အလှန်အကျိုးပြုသော အတွေ့အကြုံနှင့် မော်ဒယ်များ၏ ဆင်းရဲနွမ်းပါးသော အတွေ့အကြုံများကြား ခြားနားချက်များမှ ပေါက်ဖွားလာနိုင်သည်။'

အဖြေတစ်ခုသည် အသုံးဝင်ပြီး စွယ်စုံသုံးဘာသာစကားပုံစံတစ်ခုတည်ဆောက်မည့် ပင်မဒေတာများကို လေ့ကျင့်ခြင်းမပြုမီ ကျောင်းနှင့်တက္ကသိုလ်စနစ်တွင် လူသားများတွေ့ကြုံခံစားရသည့်အတိုင်း 'အကြိုလေ့ကျင့်ရေးကာလ' ကာလဖြစ်နိုင်ကြောင်း ၎င်းတို့က အကြံပြုထားသည်။

'တရားဝင်ပညာရေး' ၏ ဤကာလသည် (သုတေသီများ၏ သရုပ်ဖော်ပုံအတိုင်း) သည် သမားရိုးကျ စက်သင်ယူမှုကြိုတင်လေ့ကျင့်ခြင်းမှ ကွဲပြားသည် (၎င်းသည် လေ့ကျင့်ထားသော မော်ဒယ်များကို ပြန်လည်အသုံးပြုခြင်းဖြင့် လေ့ကျင့်ချိန်ကို ဖြတ်တောက်ခြင်း သို့မဟုတ် အပြည့်အဝ လေ့ကျင့်ထားသော မော်ဒယ်များမှ အလေးများကို တင်သွင်းခြင်း၊ လေ့ကျင့်ရေးလုပ်ငန်းစဉ်ကို စတင်ရန် 'booster'။

ယင်းအစား၊ ၎င်းသည် AI ၏ ယုတ္တိဗေဒဆိုင်ရာ ကျိုးကြောင်းဆင်ခြင်ခြင်းစွမ်းရည်ကို ရိုးရိုးရှင်းရှင်း စိတ္တဇနည်းဖြင့် ဖွံ့ဖြိုးတိုးတက်စေရန် ဒီဇိုင်းထုတ်ကာ ရေရှည်တည်တံ့သော သင်ယူမှုကာလကို ကိုယ်စားပြုမည်ဖြစ်ပြီး၊ တက္ကသိုလ်ကျောင်းသားတစ်ဦးအနေဖြင့် ၎င်းတို့၏ဘွဲ့ဒီဂရီသင်တန်းတွင် လုပ်ဆောင်ရန် တွန်းအားပေးခံရသည့်ပုံစံအတိုင်း ဝေဖန်ပိုင်းခြားနိုင်သော ဘာသာရပ်များကို ဖွံ့ဖြိုးတိုးတက်စေရန်၊ .

'ရလဒ်များစွာ၊ ဤအရာသည် ထင်သလောက် ဝေးကွာမည်မဟုတ်ကြောင်း စာရေးသူက ညွှန်ပြသည်' ဟုဆိုသည်။

အဆိုပါ စက္ကူ ခေါင်းစဉ်ဖြစ်ပါတယ် ဘာသာစကားပုံစံများသည် ကျိုးကြောင်းဆင်ခြင်ခြင်းအပေါ် လူသားနှင့်တူသော အကြောင်းအရာသက်ရောက်မှုများကို ပြသသည်။DeepMind မှ သုတေသီ ခြောက်ဦးမှ ဆင်းသက်လာပြီး တစ်ဦးမှာ DeepMind နှင့် Stanford University နှစ်ခုလုံးနှင့် သက်ဆိုင်ပါသည်။

စမ်းသပ်မှုများ

လူသားများသည် mnemonics မှတစ်ဆင့် ဘာသာစကားသင်ယူသူများအား ဝေါဟာရနှင့် ဘာသာစကားစည်းမျဉ်းများကို အလွတ်ကျက်စေရန် ကူညီပေးလေ့ရှိသည့် 'အဓိပ္ပာယ်သက်ရောက်သောအရေးပါမှု' ၏တူညီသောနည်းလမ်းများစွာဖြင့် လက်တွေ့နမူနာများမှ စိတ္တဇအယူအဆများကို သင်ယူကြသည်။ ဤအရာ၏ အရိုးရှင်းဆုံး ဥပမာမှာ ရူပဗေဒတွင် အကြမ်းမဖက်သော သဘောတရားများကို သင်ကြားခြင်း ဖြစ်သည်။ 'ခရီးသွား ဇာတ်လမ်းများ' ကို ပုံဖော်ခြင်း ရထားနှင့်ကားများအတွက်။

ဟိုက်ပါစကေးဘာသာစကားမော်ဒယ်တစ်ခု၏ စိတ်ကူးစိတ်သန်း ဆင်ခြင်နိုင်စွမ်းကို စမ်းသပ်ရန်အတွက် သုတေသီများသည် လူသားများအတွက် စိန်ခေါ်မှုဖြစ်စေနိုင်သော ဘာသာစကား/အခေါ်အဝေါ်ဆိုင်ရာ စမ်းသပ်မှုသုံးခုကို တီထွင်ခဲ့သည်။ စမ်းသပ်မှုများကို 'သုညရိုက်ချက်' (ဖြေရှင်းထားသော ဥပမာများမပါဘဲ) နှင့် 'five shot' (ရှေ့ဖြေရှင်းထားသော ဥပမာငါးခုဖြင့်) အသုံးချခဲ့သည်။

ပထမတာဝန်မှာ ဘာသာရပ် (လူတစ်ဦး သို့မဟုတ် ဤကိစ္စတွင်၊ ဘာသာစကားမုဒ်) မှ နုတ်ယူထားသည့် စာကြောင်းနှစ်ကြောင်း၊ 'အနှစ်သာရ' နှင့် 'ယူဆချက်' ကို လက်ခံရရှိသည့် သဘာဝဘာသာစကား ကောက်ချက် (NLI) နှင့် သက်ဆိုင်သည်။ ဥပမာအားဖြင့် X သည် Y ထက်ငယ်သည်၊ ယူဆချက်- Y သည် X ထက်ကြီးသည် (အသေးစိတ်ဖော်ပြထားသည်).

Natural Language Inference လုပ်ငန်းအတွက် သုတေသီများသည် ဘာသာစကားပုံစံများကို အကဲဖြတ်သည်။ ချင်းချိုင်းလား (70 ဘီလီယံပါရာမီတာမော်ဒယ်) နှင့် 7B (တူညီသောမော်ဒယ်၏ 7 ဘီလီယံပါရာမီတာဗားရှင်းတစ်ခု)၊ တသမတ်တည်းဖြစ်သောဥပမာများ (ဆိုလိုသည်မှာ အဓိပ္ပါယ်မရှိသော) ကြီးမားသော Chinchilla မော်ဒယ်မှသာလျှင် အခွင့်အလမ်းထက်ပိုမိုမြင့်မားသောရလဒ်များကိုရရှိသည်ကို တွေ့ရှိရသည်။ ပြီးတော့ သူတို့ မှတ်ထားတယ်၊

'၎င်းက ပြင်းထန်သော အကြောင်းအရာဘက်လိုက်မှုကို ညွှန်ပြသည်- မော်ဒယ်များသည် ယုတ္တိဗေဒစည်းမျဉ်းများနှင့် ကိုက်ညီမည့်နည်းလမ်းထက် ကြိုတင်မျှော်လင့်ချက်များနှင့်အညီ ဝါကျကို အပြီးသတ်ရန် နှစ်သက်သည်'။

NLI လုပ်ငန်းတွင် Chinchilla ၏ 70-billion ပါရာမီတာ စွမ်းဆောင်ရည်။ ဤမော်ဒယ်နှင့် ၎င်း၏ပါးလွှာသောဗားရှင်း 7B နှစ်ခုစလုံးသည် 'သိသိသာသာယုံကြည်မှုဘက်လိုက်မှု' ကိုပြသခဲ့ကြောင်း သုတေသီများကဆိုသည်။

NLI လုပ်ငန်းတွင် Chinchilla ၏ 70-billion ပါရာမီတာ စွမ်းဆောင်ရည်။ ဤမော်ဒယ်နှင့် ၎င်း၏ပါးလွှာသောဗားရှင်း 7B နှစ်ခုစလုံးသည် 'သိသိသာသာယုံကြည်မှုဘက်လိုက်မှု' ကိုပြသခဲ့ကြောင်း သုတေသီများကဆိုသည်။ အရင်းအမြစ်- https://arxiv.org/pdf/2207.07051.pdf

သင်ရိုးညွှန်းတမ်းများ

ဒုတိယတာဝန်သည် ပိုမိုရှုပ်ထွေးသောစိန်ခေါ်မှုတစ်ရပ်ကိုတင်ပြသည်၊ ဝေါဟာရအသုံးအနှုန်းများ - စစ်မှန်သောထုတ်ပြန်ချက်နှစ်ခုသည် တတိယဖော်ပြချက် (ယခင်ဖော်ပြချက်နှစ်ခုမှ ကောက်ချက်ချသည့် ယုတ္တိရှိနိုင် သို့မဟုတ် မဟုတ်နိုင်) ဟူသော အကြောင်းပြချက်များ-

စာရွက်၏စမ်းသပ်မှုဆိုင်ရာပစ္စည်းမှ၊ အမျိုးမျိုးသော 'လက်တွေ့' နှင့် ဝိရောဓိ သို့မဟုတ် မဆီမဆိုင် syllogism များ။

ဤတွင်၊ လူသားများသည် လွန်စွာအားကျလွယ်ကြပြီး ယုတ္တိဗေဒနိယာမကို နမူနာယူရန် ဒီဇိုင်းထုတ်ထားသော တည်ဆောက်မှုတစ်ခုသည် ချက်ချင်းနီးပါးဖြစ်လာသည်၊ (အမြဲတမ်းဖြစ်ကောင်းဖြစ်နိုင်သည်) မှန်ကန်သောအဖြေနှင့် ပတ်သက်၍ လူသား၏ 'ယုံကြည်ချက်' ဖြင့် အရှက်ကွဲကာ (အမြဲတမ်း) ရောထွေးလျက်၊ သင့်၏ ဖြစ်။

စာရေးသူသတိပြုမိသည်မှာ 1983 ကနေလေ့လာမှု ပါဝင်သူများသည် ဝိဇ္ဇာဝါဒ၏ နိဂုံးချုပ်ချက်အား ၎င်းတို့၏ ကိုယ်ပိုင်ယုံကြည်ချက်များနှင့်အညီ ဘက်လိုက်မှု ရှိမရှိကို လေ့လာကြည့်ရှုလျက်-

'ပါဝင်သူများသည် (90%) သည် နိဂုံးချုပ်သည် ယုံနိုင်ဖွယ်ဖြစ်လျှင် မှားယွင်းစွာပြောဆိုရန် အလားအလာပိုများပြီး အများစုမှာ စိတ်ကူးယဉ်ဆင်ခြင်ခြင်းထက် ယုံကြည်ချက်အပေါ် အားကိုးကြသည်။'

Chinchilla ကို စမ်းသပ်ရာတွင် မတူကွဲပြားသော စကားလုံးများစွာကို မှားယွင်းသော ဆက်စပ်မှုများဖြင့် နိဂုံးချုပ်ခဲ့သည်ကို သုတေသီများက တွေ့ရှိခဲ့သည်။ 'ယုံကြည်မှု ဘက်လိုက်မှုက ဆုံးဖြတ်ချက်အားလုံးနီးပါးကို တွန်းပို့တယ်'. ဘာသာစကားပုံစံက နိဂုံးချုပ်ချက်သည် လက်တွေ့နှင့်မကိုက်ညီကြောင်း တွေ့ရှိပါက၊ မော်ဒယ်၊ စာရေးဆရာများ၏ ဖော်ပြချက်သည် နောက်ဆုံးအငြင်းအခုံတရားမဝင်ကြောင်း ကြေညာခြင်းအပေါ် 'ပြင်းထန်စွာ ဘက်လိုက်သည်' မှာ၊ နောက်ဆုံးအငြင်းအခုံသည် ရှေ့ဖော်ပြချက်များ၏ ယုတ္တိဆက်စပ်မှုတစ်ခုဖြစ်နေသော်လည်း၊

Chinchilla အတွက် သုညရိုက်ချက်ရလဒ်များ (သုညရိုက်ချက်သည် လမ်းညွှန်စည်းမျဉ်း၏ ရှင်းလင်းချက်အပြီးတွင် အဆိုပါစိန်ခေါ်မှုများကို လက်ခံရရှိမည့်နည်းလမ်းဖြစ်သည်)၊ ကွန်ပျူတာ၏ တွက်ချက်မှုစွမ်းရည်နှင့် ဤကဲ့သို့သော အခြေတည်သော ယုတ္တိဗေဒမျိုးကို လမ်းညွှန်ရန် NLP မော်ဒယ်၏ စွမ်းရည်များကြားရှိ ကျယ်ပြန့်သောပင်လယ်ကွေ့ကို သရုပ်ဖော်ထားသည်။ စိန်ခေါ်မှု

Chinchilla အတွက် သုညရိုက်ချက်ရလဒ်များ (သုညရိုက်ချက်သည် လမ်းညွှန်စည်းမျဉ်း၏ ရှင်းလင်းချက်အပြီးတွင် အဆိုပါစိန်ခေါ်မှုများကို လက်ခံရရှိမည့်နည်းလမ်းဖြစ်သည်)၊ ကွန်ပျူတာ၏ တွက်ချက်မှုစွမ်းရည်နှင့် ဤကဲ့သို့သော 'အခြေတည်သွားလာရန် NLP မော်ဒယ်၏စွမ်းရည်များကြားရှိ ကျယ်ပြန့်သောပင်လယ်ကွေ့ကို သရုပ်ဖော်ခြင်း logic စိန်ခေါ်မှု။

Wason ရွေးချယ်မှုတာဝန်

တတိယအကြိမ် စာမေးပွဲအတွက် ပိုလို့တောင် စိန်ခေါ်ပါတယ်။ Wason ရွေးချယ်ခြင်းလုပ်ငန်း ယုတ္တိဗေဒပြဿနာကို ဖြေရှင်းရန်အတွက် ဘာသာစကားပုံစံကို အမျိုးမျိုးသော ထပ်ခါတလဲလဲ အသွင်ပြောင်းခဲ့သည်။

The Wason တာဝန်၊ ဆွမ်း၊ 1968 အတွက်၊ အလွန်ရိုးရှင်းပုံရပါသည်- ပါဝင်သူများကို ကတ်လေးခုပြပြီး 'ကတ်တစ်ခုတွင် 'D' ရှိပါက အခြားတစ်ဖက်တွင် '3' ပါ' ကဲ့သို့သော မထင်သလိုစည်းမျဉ်းတစ်ခုအား ပြောပြသည်။ မြင်နိုင်သော ကတ်လေးခုတွင် 'D'၊ 'F'၊ '3' နှင့် '7' ကို ပြသထားသည်။

ထို့နောက် ဘာသာရပ်များသည် စည်းကမ်းချက်မှန်သည်ဖြစ်စေ၊ မှားသည်ဖြစ်စေ စိစစ်ရန် မည်သည့်ကတ်များကို လွှဲပေးရမည်နည်း။

ဤဥပမာရှိ မှန်ကန်သောဖြေရှင်းချက်မှာ ကတ်များ 'D' နှင့် '7' ကိုလှန်ရန်ဖြစ်သည်။ အစောပိုင်းစမ်းသပ်မှုများတွင် ဘာသာရပ်အများစုသည် 'D' ကို မှန်မှန်ကန်ကန်ရွေးချယ်ကြသော်လည်း '3' ထက် '7' ကို ရွေးချယ်ရန် အလားအလာပိုများကြောင်း တွေ့ရှိရကြောင်း၊ ဆန့်ကျင်ဘက် of the rule ('not 3 implies not D') with the conversation ('၃' သည် 'D' ကို အဓိပ္ပာယ်ဖွင့်ဆိုသည်၊ ၎င်းသည် ယုတ္တိဗေဒအရ အဓိပ္ပာယ်မရှိ)။

လူသားဘာသာရပ်များတွင် ယုတ္တိကျသော ဖြစ်စဉ်သို့ ဝင်ရောက်ရန် ကြိုတင်ယုံကြည်ချက်အတွက် အလားအလာရှိကြောင်း စာရေးသူ သတိပြုမိပြီး ပညာရပ်ဆိုင်ရာ သင်္ချာပညာရှင်များနှင့် ဘွဲ့ကြို သင်္ချာပညာရှင်များပင်လျှင် ဤလုပ်ငန်းတွင် ယေဘုယျအားဖြင့် ရမှတ် 50% အောက်တွင်သာ ရှိသည်ကို သတိပြုပါ။

သို့သော်လည်း၊ Wason အလုပ်တစ်ခု၏ စီမံချက်သည် လူသား၏လက်တွေ့အတွေ့အကြုံကို တစ်နည်းနည်းဖြင့် ထင်ဟပ်လာသောအခါ၊ စွမ်းဆောင်ရည်သည် အစဉ်အလာအားဖြင့် မြင့်တက်လာသည်။

စာရေးသူသည် အစောပိုင်းစမ်းသပ်မှုများကို ရည်ညွှန်းပြီး လေ့လာတွေ့ရှိခဲ့သည်-

'[အကယ်၍] ကတ်များတွင် အသက်အရွယ်နှင့် အဖျော်ယမကာများကို ပြသထားပြီး စည်းမျဉ်းမှာ "အရက်သောက်ပါက အသက် 21 နှစ်နှင့် အထက်ဖြစ်ရမည်" နှင့် ကတ်များကို 'ဘီယာ'၊ 'ဆိုဒါ'၊ '25'၊ '16'၊ ပါဝင်သူအများစုသည် 'ဘီယာ' နှင့် '16' ပြထားသောကတ်များကို မှန်မှန်ကန်ကန် ရွေးချယ်စစ်ဆေးရန် ရွေးချယ်ကြသည်။

Wason လုပ်ငန်းဆောင်တာများတွင် ဘာသာစကားမော်ဒယ်စွမ်းဆောင်ရည်ကို စမ်းသပ်ရန်အတွက် သုတေသီများသည် 'အဓိပ္ပါယ်မရှိသော' စကားလုံးများပါရှိသော မတူကွဲပြားသော လက်တွေ့ဆန်သော စည်းမျဉ်းများကို ဖန်တီးခဲ့ပြီး AI သည် 'virtual cards' ကို လှန်ပစ်ရမည့် 'virtual cards' ၏ အကြောင်းအရာ၏ အကြောင်းအရာ၏ ဆက်စပ်မှုကို AI ထံ ထိုးဖောက်ဝင်ရောက်နိုင်မလား။

စာမေးပွဲများတွင်တင်ပြထားသော Wason Selection Task ပဟေဋ္ဌိများစွာထဲမှအချို့။

စာမေးပွဲများတွင်တင်ပြထားသော Wason Selection Task ပဟေဋ္ဌိများစွာထဲမှအချို့။

Wason စမ်းသပ်မှုများအတွက်၊ မော်ဒယ်သည် 'လက်တွေ့ကျကျ' (အဓိပ္ပါယ်မရှိသော) အလုပ်များကို လူသားများနှင့် နှိုင်းယှဉ်လုပ်ဆောင်ခဲ့သည်။

အနည်းဆုံး 'လက်တွေ့ကျသော' စည်းမျဉ်းများအတွက် မော်ဒယ်သည် အခွင့်အလမ်းထက် ကောင်းစွာလုပ်ဆောင်ခြင်းဖြင့် Chinchilla အတွက် Zero-shot Wason ရွေးချယ်ခြင်းလုပ်ငန်း ရလဒ်များ။

အနည်းဆုံး 'လက်တွေ့ကျသော' စည်းမျဉ်းများအတွက် မော်ဒယ်သည် အခွင့်အလမ်းထက် ကောင်းစွာလုပ်ဆောင်ခြင်းဖြင့် Chinchilla အတွက် Zero-shot Wason ရွေးချယ်ခြင်းလုပ်ငန်း ရလဒ်များ။

စာတမ်းမှတ်ချက်များ

'ဤသည်မှာ လူ့စာပေရှိ တွေ့ရှိချက်များကို ရောင်ပြန်ဟပ်သည်- စိတ္တဇဂုဏ်ရည်များအကြောင်း မတရားသော စည်းမျဉ်းများထက် လက်တွေ့ကျသော အခြေအနေများကို ဘောင်ခတ်ထားသောအခါတွင် လူသားများသည် Wason အလုပ်အား ဖြေဆိုရာတွင် ပိုမိုတိကျပါသည်။'

ပညာရေး

စာတမ်း၏ရှာဖွေတွေ့ရှိချက်များသည် ကျွန်ုပ်တို့၏ကိုယ်ပိုင်ကန့်သတ်ချက်များ၏အခြေအနေတွင် hyperscale NLP စနစ်များ၏ ကျိုးကြောင်းဆင်ခြင်နိုင်စွမ်းကို ဘောင်ခတ်ထားပြီး ၎င်းတို့ကို စွမ်းအားပေးသော လက်တွေ့ကမ္ဘာဒေတာအစုံများမှတစ်ဆင့် မော်ဒယ်များထံ ကျွန်ုပ်တို့ဖြတ်သန်းနေပုံရသည်။ ကျွန်ုပ်တို့အများစုသည် ဉာဏ်ကြီးရှင်များမဟုတ်ကြသောကြောင့်၊ ကျွန်ုပ်တို့၏ကိုယ်ပိုင်အသိပေးသည့် ကန့်သတ်ချက်များကို သိရှိသည့် မော်ဒယ်များလည်း မဟုတ်ပါ။

ထို့အပြင်၊ အလုပ်အသစ်၏နိဂုံးချုပ်သည်မှာ၊ ကျွန်ုပ်တို့သည် အနည်းဆုံး စဉ်ဆက်မပြတ်ဖွဲ့စည်းပုံပညာရေး၏ အကျိုးကျေးဇူးနှင့် လူသား၏မဖြစ်မနေဖြစ်လာသော ထပ်လောင်းလူမှုရေး၊ ငွေကြေးနှင့် လိင်ပိုင်းဆိုင်ရာ လှုံ့ဆော်မှုများပင် ဖြစ်သည်။ NLP မော်ဒယ်များရရှိနိုင်သမျှသည် ဤပတ်ဝန်းကျင်ဆိုင်ရာအချက်များ၏ ရလဒ်များဖြစ်ပြီး ၎င်းတို့သည် ထူးခြားသောလူသားများထက် ယေဘူယျနှင့်လိုက်လျောညီထွေဖြစ်ပုံရသည်။

စာရေးသူက ဤသို့ဆိုသည်-

'ကျွန်ုပ်တို့၏ ရလဒ်များသည် ဤလူ့သီးသန့်အတွင်းပိုင်း ယန္တရားများကို မထည့်သွင်းဘဲ လူသားယဉ်ကျေးမှုမှ ထုတ်လုပ်သော ဘာသာစကားကို အတုယူရန် ကြီးမားသော transformer ကို လေ့ကျင့်သင်ကြားရုံမှ ထွက်ပေါ်လာနိုင်သည်ဟု ကျွန်ုပ်တို့၏ ရလဒ်များက ပြသပါသည်။

'တစ်နည်းဆိုရသော် ဘာသာစကားပုံစံများနှင့် လူသားနှစ်ဦးစလုံးသည် ဤအကြောင်းအရာ၏ ဘက်လိုက်မှုများသို့ ရောက်ရှိလာသည်—သို့သော် အလွန်ကွဲပြားပုံရသော ဗိသုကာလက်ရာများ၊ အတွေ့အကြုံများနှင့် လေ့ကျင့်ရေးရည်ရွယ်ချက်များမှ ရောက်ရှိလာသည်'

ထို့ကြောင့် ၎င်းတို့သည် စင်ကြယ်သော ဆင်ခြင်တုံတရားဖြင့် 'induction training' တစ်မျိုးကို အကြံပြုပါသည်။ ဖြစ် ပြသ သင်္ချာနှင့် ယေဘူယျ ကျိုးကြောင်းဆင်ခြင်မှုအတွက် စံပြစွမ်းဆောင်ရည်ကို မြှင့်တင်ရန်။ ဘာသာစကားပုံစံများကို လေ့ကျင့်သင်ကြားခြင်း သို့မဟုတ် ချိန်ညှိခြင်းများ ပြုလုပ်ခဲ့ကြောင်း ၎င်းတို့က ထပ်လောင်းသတိပြုမိပါသည်။ ညွှန်ကြားချက်တွေကို လိုက်နာဖို့ ပိုကောင်းတယ်။ စိတ္တဇ သို့မဟုတ် ယေဘူယျအဆင့်တွင်၊ နှင့် စစ်ဆေးပါ၊ မှန်ကန်ပါ သို့မဟုတ် debias သူတို့ရဲ့ကိုယ်ပိုင် output ကို။

 

* ကျွန်ုပ်၏ inline ကိုးကားချက်များကို ဟိုက်ပါလင့်ခ်များသို့ ပြောင်းခြင်း။

၂၀၂၂ ခုနှစ် ဇူလိုင်လ ၆ ရက်နေ့တွင် ပထမအကြိမ် ထုတ်ဝေခဲ့သည်။