ဆောင်းပါးတို Machine Learning - Unite.AI ဖြင့် ၂၅ နှစ်တာ ကိုယ်ရေးကိုယ်တာမူဝါဒများကို ပိုင်းခြားစိတ်ဖြာခြင်း။
ကြှနျုပျတို့နှငျ့အတူချိတ်ဆက်ပါ

ဉာဏ်ရည်တု

Machine Learning ဖြင့် ၂၅ နှစ်တာ ကိုယ်ရေးကိုယ်တာ မူဝါဒများကို ပိုင်းခြားစိတ်ဖြာခြင်း။

mm
နောက်ဆုံးရေးသားချိန် on

မကြာသေးမီက လေ့လာမှုတစ်ခုက 50,000 မှ 25 ခုနှစ်အထိ 1996 နှစ်တာကာလအတွင်း လူကြိုက်များသောဝဘ်ဆိုဒ်များရှိ 2021 ကျော်၏ ဖတ်ရှုနိုင်မှု၊ အသုံးဝင်မှု၊ အရှည်နှင့် ရှုပ်ထွေးမှုများကို ဇယားကွက်ရေးဆွဲရန် စက်သင်ယူမှုခွဲခြမ်းစိတ်ဖြာမှုနည်းပညာများကို အသုံးပြုထားသည်။ သုတေသနပြုချက်က ပျမ်းမျှစာဖတ်သူသည် မြှုပ်နှံရန် လိုအပ်ကြောင်း တိုးပွားလာနေသော စကားလုံးအရေအတွက်၊ ရှုပ်ထွေးနေသော ဘာသာစကားနှင့် မရေရာသော ဘာသာစကားအသုံးပြုမှုတို့ကို ထိုးဖောက်နိုင်ရန် 'နှစ်စဉ်စာဖတ်ချိန်' (တစ်နေ့လျှင် တစ်နာရီကျော်) နာရီ 400 ရှိသည်။

အစီရင်ခံစာတွင်ဤသို့ဖော်ပြထားသည် -

'ပျမ်းမျှမူဝါဒအရှည်သည် ပြီးခဲ့သည့်ဆယ်နှစ်အတွင်း နှစ်ဆနီးပါးတိုးလာခဲ့ပြီး 2159 ခုနှစ် မတ်လတွင် စကားလုံး 2011 လုံးနှင့် 4191 ခုနှစ် မတ်လတွင် 2021 လုံး၊ 2000 ခုနှစ်မှစ၍ လေးပုံတစ်ပုံနီးပါး (1146 လုံး) ရှိသည်။'

25 နှစ်တာကာလအတွင်းလေ့လာခဲ့သော corpus တွင် ပျမ်းမျှစကားလုံးရေတွက်ခြင်းနှင့် ဝါကျအရေအတွက်။ အရင်းအမြစ်- https://arxiv.org/pdf/2201.08739.pdf

25 နှစ်တာကာလအတွင်းလေ့လာခဲ့သော corpus တွင် ပျမ်းမျှစကားလုံးရေတွက်ခြင်းနှင့် ဝါကျအရေအတွက်။ အရင်းအမြစ်- https://arxiv.org/pdf/2201.08739.pdf

GDPR နှင့် California Consumer Privacy Act (CCPA) အကာအကွယ်များ အသက်ဝင်လာသောအခါ အရှည်တိုးနှုန်း တိုးလာသော်လည်း၊ စာရွက်တွင် အဆိုပါ ကွဲပြားမှုများကို 'သေးငယ်သော အကျိုးသက်ရောက်မှု အရွယ်အစားများ' အနေဖြင့် ပိုမိုကျယ်ပြန့်သော ရေရှည်လမ်းကြောင်းနှင့် ဆန့်ကျင်ဘက်ဖြစ်ဟန်မရှိပေ။ သို့သော်၊ GDPR သည် မူဝါဒများတွင် 'ဝိုးတဝါး' ဘာသာစကား ကြီးထွားလာရခြင်း၏ ဖြစ်နိုင်ခြေအကြောင်းရင်းတစ်ခုအဖြစ် သတ်မှတ်ဖော်ထုတ်ထားသည် (အောက်တွင် ကြည့်ပါ)။

တစ်မိနစ်လျှင် စာလုံးရေ 250 နှုန်းဖြင့် စာဖတ်နှုန်းဟု ယူဆပါက၊ ပျမ်းမျှ ကိုယ်ရေးကိုယ်တာမူဝါဒသည် ယခုဖတ်ရန် 17 မိနစ်အချိန်ယူရပြီး လူကြိုက်များသောမူဝါဒများ (ဆိုလိုသည်မှာ အသုံးပြုသူအရေအတွက်များသောမူဝါဒများ) သည် ပြီးမြောက်ရန် 23 မိနစ်ကြာမြင့်သည်ဟု စာတမ်းတွင် ဖော်ပြထားသည်။

Microsoft မှ dataset တွင် အရှည်ကြာဆုံးပေါ်လစီသည် သုံးစွဲရန် 152 မိနစ် လိုအပ်ကြောင်း သုတေသနပြုချက်အရ၊ မျိုးကွဲ Google တွင် BERT ဘာသာစကား မော်ဒယ်.

စာဖတ်သူသည် တစ်နှစ်လျှင် တစ်မူထူးခြားသော ဝဘ်ဆိုဒ် 1462 ခုကို ဝင်ကြည့်သည်ဟု ယူဆကာ ခေတ်မီကိုယ်ရေးကိုယ်တာမူဝါဒများကို ဖတ်ရန် လိုအပ်သော နှစ်စဉ်နာရီနှုန်းဖြင့် တိုးလာပါသည်။

စာဖတ်သူ လည်ပတ်သည်ဟု ယူဆကာ ခေတ်မီသော ကိုယ်ရေးကိုယ်တာ မူဝါဒများကို ဖတ်ရန် လိုအပ်သော နှစ်စဉ်နာရီနှုန်း တိုးတက်မှု တစ်နှစ်လျှင် ထူးခြားသော ဝဘ်ဆိုဒ် ၁၄၆၂ ခုရှိသည်။.

မကြာသေးမီက ကိုယ်ရေးကိုယ်တာမူဝါဒများတွင် စကားလုံးကြမ်းကြမ်းနှင့် မရေရာသော တိုးလာမှုအများစုကို စည်းမျဉ်းများပြဌာန်းရန် လွန်ခဲ့သည့်ဆယ်စုနှစ်နှစ်ခုကျော်က ကြိုးပမ်းမှုများအပေါ် တုံ့ပြန်မှုအဖြစ် စာရွက်ပေါ်တွင် ဖော်ပြထားသော်လည်း စည်းမျဉ်းစည်းကမ်းလိုက်နာမှုဆိုင်ရာ လိုအပ်ချက်များကို ခိုးကြောင်ခိုးဝှက်နှင့် နယ်ပယ်ချဲ့ထွင်ရန် အကြောင်းပြချက်အဖြစ် လွတ်လွတ်လပ်လပ်အသုံးပြုခြင်းကိုလည်း၊ ကိုယ်ရေးကိုယ်တာ မူဝါဒများ၏ ပွင့်လင်းမှု။

'ယေဘုယျအားဖြင့်၊ မကြာသေးမီက ကိုယ်ရေးကိုယ်တာစည်းမျဉ်းများသည် အွန်လိုင်းအသုံးပြုသူများ၏ ကိုယ်ရေးကိုယ်တာလုံခြုံမှုကို သိသိသာသာ တိုးတက်ကောင်းမွန်စေခြင်းမရှိသေးကြောင်း ကျွန်ုပ်တို့၏ရလဒ်များက ပြသနေသော်လည်း၊ ဒေတာအလေ့အကျင့်များ ပိုမိုများပြားလာကာ ပျံ့နှံ့နေသော ဒေတာအလေ့အကျင့်များကို ဖော်ပြသည့် ပိုမိုဖောင်းကားလာစေသည်။'

မကြာသေးမီနှစ်များအတွင်း Natural Language Processing (NLP) စာတမ်းအများအပြားသည် ဖတ်ရှုနိုင်မှုနှင့် ကိုယ်ရေးကိုယ်တာမူဝါဒများ၏ အခြားရှုထောင့်များကို ကိုင်တွယ်ဖြေရှင်းပေးခဲ့သော်လည်း၊ ဤသည်မှာ မကြာသေးမီဆယ်စုနှစ်များအတွင်း မူဝါဒဖွံ့ဖြိုးတိုးတက်မှုဆိုင်ရာ ကျယ်ပြန့်သောခြုံငုံသုံးသပ်ချက်ကို ပေးဆောင်ရန် ၎င်း၏အမျိုးအစား၏ ပထမဆုံးပရောဂျက်ဖြစ်သည်ဟု စာရေးသူက ယုံကြည်ပါသည်။

အဆိုပါ စက္ကူ ခေါင်းစဉ်ဖြစ်ပါတယ် ခေတ်များတစ်လျှောက် ကိုယ်ရေးကိုယ်တာမူဝါဒများ- ကိုယ်ရေးကိုယ်တာမူဝါဒများ၏ အကြောင်းအရာနှင့် ဖတ်ရှုနိုင်မှု ၁၉၉၆-၂၀၂၁နှင့် UK ရှိ De Montfort University ၏ Cyber ​​Technology Institute မှ Isabel Wagner မှ ဆင်းသက်လာသည်။

Elliptical ဘာသာစကား

အစီရင်ခံစာတွင် 'ရှုပ်ထွေးသောစကားလုံးများ' ပျမ်းမျှအရေအတွက် (ဆိုလိုသည်မှာ၊ လက်ခံနိုင်ဖွယ်, အရေးကြီးသော, အများအားဖြင့်နှင့် အဓိပ္ပါယ်မရှိသော အခြားစကားလုံးများ) ကိုယ်ရေးကိုယ်တာမူဝါဒများတွင် 2018 အထိ တဖြည်းဖြည်းတိုးလာသော်လည်း 227 မတ်လဝန်းကျင်တွင် 2018 မှ 304 ဇွန်လတွင် 2020 အထိတက်လာပါသည်။

ဤမြင့်တက်မှုသည် GDPR ၏အကျိုးသက်ရောက်မှုများကြောင့်ဖြစ်သည်ဟု စာရေးသူက အခိုင်အမာဆိုသည်၊ စာတမ်းတွင် လေ့လာထားသော ကိုယ်ရေးကိုယ်တာမူဝါဒများတွင် သုံးပုံနှစ်ပုံ (72%) ကျော်တွင် ရှုပ်ထွေးစေသောစကားလုံးတစ်လုံးပါဝင်ကြောင်း စာတမ်းကတွေ့ရှိခဲ့သည်။

၎င်းက

စာဖတ်ခြင်းအခက်အခဲ၏ ဘုံအတိုင်းအတာသုံးရပ်ကို လေ့လာတွေ့ရှိခဲ့သည်။ 'ကိုယ်ရေးကိုယ်တာ ရဲတပ်ဖွဲ့များသည် တစ်နှစ်ထက်တစ်နှစ် ပိုဖတ်ရခက်လာသည်'. 41 ခုနှစ်တွင် ရရှိနိုင်သော လက်ရှိ ကျင့်သုံးနေသော မူဝါဒများ၏ 2021% တွင် ပျမ်းမျှ ရှိသည်ဟု စာရေးသူ ခန့်မှန်းသည်။ Flesch စာဖတ်ခြင်းလွယ်ကူခြင်း။ (FRE၊ ပိုမြင့်တာက ပိုကောင်းတယ်) 31.8 သာရှိသဖြင့် စာရေးသူ စောင့်ကြည့်နေပါသည်။ 'ဤရမှတ်သည် တက္ကသိုလ်ဘွဲ့ရများ နားလည်ရန် အလွန်ခက်ခဲသော စာသားကို ညွှန်ပြသည်'.

တစ်ချိန်တည်းမှာပဲ၊ 6.7% မူဝါဒများ၏ FRE ရမှတ် 45 အထက်ရရှိသည် (၎င်းသည် ဖလော်ရီဒါပြည်နယ်ရှိ အာမခံမူဝါဒများအတွက် လိုအပ်သော အစီရင်ခံစာဖတ်ခြင်းစံနှုန်းဖြစ်သည်)။

မူဝါဒပြောင်းလဲခြင်း အသိအမြင်

လုပ်ငန်းသည် သဘောတူညီချက်ကို ဆက်လက်ထိန်းသိမ်းလိုသည့်ဆန္ဒကို ထိခိုက်စေနိုင်သည့် နောက်ဆက်တွဲမွမ်းမံမှုများအတွင်း အသုံးပြုသူ၏ဆန္ဒကို ထိခိုက်စေနိုင်သည့် အလားအလာရှိသော ခွင့်ပြုသူအား မည်ကဲ့သို့ နောက်ဆုံးတွင် အသိပေးမည်ဆိုသည့် အသေးစိတ်အချက်အလက်များပါဝင်သည့် လျှို့ဝှက်မူဝါဒများပါရှိသည့်အတိုင်းအတာကိုလည်း အလုပ်က ကိုင်တွယ်သည်။

စာရေးသူ သတိပြုမိသည်မှာ-

' 2021 တွင် မူဝါဒများ၏ 73% တွင် မူဝါဒပြောင်းလဲခြင်းဆိုင်ရာ ကြေငြာချက်ပါရှိသည်။ ယင်းတို့အနက် ၃၄% သည် ကိုယ်ရေးကိုယ်တာမူဝါဒတွင် အပြောင်းအလဲများကို အသိပေးကြေညာမည်ဖြစ်ပြီး ၃၇% သည် ဝဘ်ဆိုက်တွင် သတိပေးချက်တစ်ခုတင်မည်ဖြစ်ပြီး 34% သည် ကိုယ်ရေးကိုယ်တာသတိပေးချက်ကို ပေးပို့လိမ့်မည် (ကျန်မူဝါဒများသည် အကြောင်းကြားချက်အမျိုးအစားကို သတ်မှတ်ဖော်ပြထားခြင်းမရှိပါ)။

'ရလဒ်အနေဖြင့်၊ အသုံးပြုသူအများစုသည် ကိုယ်ရေးကိုယ်တာမူဝါဒများဆိုင်ရာ အပြောင်းအလဲများကို သတိပြုမိရန် မဖြစ်နိုင်ပေ။

'ထို့ပြင်၊ မူဝါဒများ ပြောင်းလဲသောအခါတွင် သုံးစွဲသူများအား အဓိပ္ပါယ်ရှိသော ရွေးချယ်မှု မရှိသလောက် နည်းပါးပါသည်။ အပြောင်းအလဲများကို သုံးစွဲသူအား အသိပေးသည့် မူဝါဒများအနက် 12% ကသာ ရွေးချယ်မှုအသစ်ကို ကမ်းလှမ်းသော်လည်း 34% က ရွေးချယ်ခွင့်မပေးဘဲ 54% က ၎င်းကို အတိအကျ မသတ်မှတ်ထားပေ။'

မူဝါဒအပြောင်းအလဲများအကြောင်း သုံးစွဲသူများအား အသိပေးခြင်းအတွက် ဖော်ပြထားသော နည်းလမ်းများတွင် စာတမ်း၏ တွေ့ရှိချက်။

မူဝါဒအပြောင်းအလဲများအကြောင်း သုံးစွဲသူများအား အသိပေးခြင်းအတွက် ဖော်ပြထားသော နည်းလမ်းများတွင် စာတမ်း၏ တွေ့ရှိချက်။

ခြေရာခံခြင်းနှင့်ပတ်သက်၍ ကန့်သတ်ရွေးချယ်မှု

လေ့လာမှုအရ၊ အသုံးပြုသူပရိုဖိုင်ဒေတာကို ရယူခြင်းထက် အသုံးပြုသူအကောင့်အချက်အလက်ကို ရယူခြင်းအတွက် သီးသန့်မူဝါဒများတွင် ပိုမိုများပြားသော ယန္တရားများကို ပေးဆောင်ထားသည်။ ပရိုဖိုင်ဒေတာကို အလိုအလျောက် နှင့် ထင်ရှားသည့် ယန္တရားများမှတဆင့် ဖန်တီးပြီး အပ်ဒိတ်လုပ်နိုင်ပြီး၊ သုံးစွဲသူအကောင့်ဒေတာကို သုံးစွဲသူမှ ပြတ်သားစွာ ခွင့်ပြုရုံသာမက တရားစီရင်ပိုင်ခွင့်အသီးသီး၏ စည်းမျဉ်းများအောက်တွင် တည်းဖြတ်ရန်လည်း လိုအပ်ပါသည်။

ကိုယ်ရေးကိုယ်တာမူဝါဒများတွင် ကွတ်ကီးခွင့်ပြုချက်အတွက် စားသုံးသူရွေးချယ်မှု (ဆွဲဆောင်မှုရှိသောအကြောင်းအရာတစ်ခု အပြင်းအထန်ငြင်းခုံကြသည်။ GDPR ထွန်းကားလာသောအခါတွင် EU ၏နိုင်ငံတကာနှင့်ဥရောပဝဘ်ဆိုဒ်များအတွက် ကွတ်ကီးသဘောတူညီချက် ပေါ့ပ်အပ်များထောင်ပေါင်းများစွာကို ကြေငြာထားသောကြောင့်) သည် ယေဘုယျအားဖြင့် မူဝါဒများတွင် ကိုင်တွယ်ဖြေရှင်းထားသော်လည်း သုံးစွဲ၍ရနိုင်နည်းပါးသောဒေတာ၏ ပိုအရေးကြီးသောအလွှာကို ဖုံးကွယ်ထားသည်*-

'[ကွတ်ကီးများနှင့်ပတ်သက်သည့်] ရွေးချယ်မှုများသည် အသုံးပြုသူများကို ခြေရာခံခြင်းအားလုံးမှ ကာကွယ်ရန် မလုံလောက်သောကြောင့် ရွေးချယ်မှု သို့မဟုတ် ထိန်းချုပ်မှုယန္တရားများအတွက် ကမ်းလှမ်းမှုနည်းပါးသောကြောင့်၊ ကွန်ပျူတာအချက်အလက်, စက်ပစ္စည်း သတ်မှတ်ချက်များနှင့် ပုဂ္ဂိုလ်ရေးခွဲခြားမှုများလက်ဗွေရာမှတစ်ဆင့် သုံးစွဲသူများကို ခြေရာခံခွင့်ပြုသည်။'

ပရိုဖိုင်ဒေတာ (သွယ်ဝိုက်သော သို့မဟုတ် ခိုးဝှက်သောနည်းလမ်းများဖြင့် ရယူနိုင်သည့်) နှင့် အသုံးပြုသူအကောင့်ဒေတာ (GDPR၊ ကယ်လီဖိုးနီးယားစားသုံးသူကိုယ်ရေးကိုယ်တာအက်ဥပဒေ (CCPA) မှ ထိန်းချုပ်မှုအချို့ကို မကြာခဏလုပ်ဆောင်လေ့ရှိသော ထိန်းချုပ်မှုအချို့ကို GDPR၊ ကယ်လီဖိုးနီးယားပြည်နယ်စားသုံးသူကိုယ်ရေးကိုယ်တာအက်ဥပဒေ (CCPA) မှ ပေးအပ်ထားသော ကိုယ်ရေးကိုယ်တာမူဝါဒများဖြင့် ရရှိနိုင်သော ထိန်းချုပ်မှုအဆင့်တွင် သိသိသာသာ ဆန့်ကျင်ဘက်ဖြစ်သည်။ ) နှင့် အလားတူ အမျိုးသားနှင့် ဒေသဆိုင်ရာ ယန္တရားများ)။

ပရိုဖိုင်ဒေတာ (သွယ်ဝိုက်သော သို့မဟုတ် ခိုးဝှက်သောနည်းလမ်းများဖြင့် ရယူနိုင်သည့်) နှင့် အသုံးပြုသူအကောင့်ဒေတာ (GDPR၊ ကယ်လီဖိုးနီးယားစားသုံးသူကိုယ်ရေးကိုယ်တာအက်ဥပဒေ (CCPA) မှ ထိန်းချုပ်မှုအချို့ကို မကြာခဏလုပ်ဆောင်လေ့ရှိသော ထိန်းချုပ်မှုအချို့ကို GDPR၊ ကယ်လီဖိုးနီးယားပြည်နယ်စားသုံးသူကိုယ်ရေးကိုယ်တာအက်ဥပဒေ (CCPA) မှ ပေးအပ်ထားသော ကိုယ်ရေးကိုယ်တာမူဝါဒများဖြင့် ရရှိနိုင်သော ထိန်းချုပ်မှုအဆင့်တွင် သိသိသာသာ ဆန့်ကျင်ဘက်ဖြစ်သည်။ ) နှင့် အလားတူ အမျိုးသားနှင့် ဒေသဆိုင်ရာ ယန္တရားများ)။

ဒေတာများ

လေ့လာမှုအတွက် ဒေတာရယူရန်၊ စာရေးသူသည် ၎င်းတို့၏ ကိုယ်ရေးကိုယ်တာမူဝါဒများနှင့် လင့်ခ်များအတွက် ဝဘ်ဆိုဒ်များကို ရှာဖွေလေ့လာခဲ့ပြီး ကနဦးရလဒ်ထက် နယ်ပယ်ချဲ့ထွင်ရန် လိုအပ်ကြောင်း မကြာခဏ ရှာဖွေတွေ့ရှိခဲ့ပြီး၊ နောက်ထပ်မူဝါဒများနှင့် ချိတ်ဆက်ပေးသည့် အစိတ်အပိုင်းမဟုတ်သော မူဝါဒများစွာကြောင့် (တစ်ခုစီတိုင်း၊ မိဘ သို့မဟုတ် ဆက်စပ်မူဝါဒနှင့် ယှဉ်တွဲ၍သော်လည်းကောင်း ပြောင်းလဲရန် အလားအလာရှိသည်။)

အဆိုပါ Wayback စက် robots.txt configuration file (စာမျက်နှာများ နှင့် ပတ်သက်သော ဝဘ်မှ ကူးယူခြင်း အညွှန်းရေးခြင်း အေးဂျင့်များအတွက် ညွှန်ကြားချက်များ ပါ၀င်သော စာသားဖိုင်ငယ် ဖိုင်သည် စာမျက်နှာများနှင့် ပတ်သက်သည့် တွားသွားခြင်း သို့မဟုတ် သိမ်းဆည်းခြင်းမှ ပိတ်ဆို့ခံထားရသော မူဝါဒများကို ထည့်သွင်းစဉ်းစားရန် လိုအပ်သော်လည်း၊ အများသူငှာအညွှန်းတွင် မပါဝင်သင့်သော အရာများ)။

Wayback Machine မှ တစ်လလျှင် လျှပ်တစ်ပြက် ဓါတ်ပုံတစ်ပုံ ကို ၎င်း၏ အနေဖြင့် ရယူခဲ့သည်။ CDX API ခွဲခြားသတ်မှတ်နိုင်သော နှင့် စဉ်ဆက်မပြတ် သက်ဆိုင်သောမူဝါဒတစ်ခုစီအတွက် အသုံးပြုခြင်း။ Selenium အောက်ရှိ Firefox. PDF ဖော်မတ်တွင်သာ ရရှိနိုင်သော မူဝါဒများပေါ်တွင် အလင်းအက္ခရာ မှတ်သားမှုကို လုပ်ဆောင်ခြင်းအား ပရောဂျက်အတွက် ထည့်သွင်းစဉ်းစားခြင်း မပြုပါ၊ ၎င်းသည် ရရှိနိုင်သော HTML မူဝါဒများ၏ အရေအတွက် (ပိုမိုများပြားသော) အရေအတွက်ကို ကန့်သတ်ထားသည့် ပရောဂျက်အတွက် ထည့်သွင်းစဉ်းစားခြင်းမပြုပါ။

ပရောဂျက်မှ စိတ်ဝင်စားဖွယ်ရလဒ်တစ်ခုမှာ ညစ်ညမ်းဝဘ်ဆိုဒ်များ၏ ရှင်းလင်းပြတ်သားမှုနှင့် ဖတ်ရှုနိုင်မှုမှာ လေ့လာထားသည့်ကြားကာလတစ်လျှောက်တွင် အမှန်တကယ် တိုးတက်လာသည်- စည်းမျဥ်းစည်းကမ်းနှင့် ရှင်းလင်းပြတ်သားမှုတိုးလာစေရန် တောင်းဆိုမှုများ တိုးပွားလာခြင်းကို မျှော်လင့်နိုင်ဖွယ်ရှိသည်။ ဤစာရွက်စာတမ်းများကို စုဆောင်းရန်အတွက် တက္ကသိုလ်၏ အကြောင်းအရာ-ပိတ်ဆို့ခြင်းဆိုင်ရာ ပရိုတိုကောများကြောင့် လူနေအိမ် IP လိပ်စာများမှ ထပ်လောင်းကောက်ယူမှုများဖြင့် ၎င်းတို့ကို ရယူရန်လိုအပ်ပါသည်။

ကနဦးတွင် စာရွက်စာတမ်း 1,068,683 ခုကို ရရှိခဲ့ပြီး လင့်တစ်ခုစီအတွက် ပျမ်းမျှ မူဝါဒ 120,265 ပုဒ်မ သို့မဟုတ် အပိုဒ်များနှင့် 39.1 ထူးခြားသောမူဝါဒစာသားများပါရှိသော ထူးခြားသောစာရွက်စာတမ်း 4.4 နှင့်ညီမျှသည်။

အင်္ဂလိပ်ဘာသာစကားသာ

အလားတူ မကြာသေးမီက လေ့လာမှုများတွင် အဖြစ်များသည့်အတိုင်း၊ ပရောဂျက်သည် ဒေတာရှင်းလင်းခြင်းအဆင့်အတွင်း စွန့်ပစ်ထားသော အင်္ဂလိပ်မဟုတ်သော ကိုယ်ရေးကိုယ်တာမူဝါဒများကို ပရောဂျက်မှ မဖြေရှင်းနိုင်ခဲ့ပါ။ PYCLD2 အထုပ်။

ကိုယ်ရေးကိုယ်တာမူဝါဒများကို အခြားပစ္စည်းအမျိုးအစားများနှင့် ခွဲခြားရန်၊ ပရောဂျက်သည် အမျိုးအစားခွဲခြားမှုကို အသုံးပြုခဲ့သည်။ 2019 အတွက်တီထွင် University of Wisconsin နှင့် École Polytechnique Fédérale de Lausanne တို့မှ ပူးပေါင်းလုပ်ဆောင်မှုအဖြစ်။

IS-POLICY အမျိုးအစားခွဲခြားမှု၏ ဗိသုကာ။ အရင်းအမြစ်- https://arxiv.org/pdf/1809.08396.pdf

IS-POLICY အမျိုးအစားခွဲခြားမှု၏ ဗိသုကာ။ အရင်းအမြစ်- https://arxiv.org/pdf/1809.08396.pdf

IS-POLICY အမျိုးအစားခွဲခွဲခြားခြင်းကို မူရင်းစာတမ်းတွင်ကဲ့သို့ တူညီသော 1,000-document corpus တွင် လေ့ကျင့်ထားသော်လည်း မူရင်းရင်းမြစ်များ မရရှိနိုင်သောကြောင့် စာရေးသူသည် သင်တန်းအတွက် မူဝါဒမဟုတ်သောစာရွက်စာတမ်းအသစ်များကို ရယူရပါမည်။

စစ်ထုတ်ပြီးနောက်၊ ဒေတာကို 56,416 တစ်မူထူးခြားသော ကိုယ်ရေးကိုယ်တာမူဝါဒများကို လျှော့ချခဲ့သည်။

 

* စာရွက်၏ အတွင်းလိုင်းကိုးကားချက်ကို ဤနေရာတွင် ဟိုက်ပါလင့်ခ်အဖြစ်သို့ ပြောင်းသည်၊ စာလုံးစောင်းပြောင်းခြင်းသည် စာရွက်မှဖြစ်သည်။

၂၀၂၂ ခုနှစ် ဇန်နဝါရီလ ၃၁ ရက်နေ့တွင် ပထမဆုံး ထုတ်ဝေခဲ့သည်။