ဆောင်းပါးတို Local Browser Behavior - Unite.AI ကို အခြေခံ၍ ကြော်ငြာများကို ပိတ်ရန် စက်သင်ယူခြင်းနည်းလမ်း
ကြှနျုပျတို့နှငျ့အတူချိတ်ဆက်ပါ

ဆိုက်ဘာလုံခြုံရေး

Local Browser အပြုအမူအပေါ်အခြေခံ၍ ကြော်ငြာများကိုပိတ်ဆို့ရန် စက်သင်ယူမှုနည်းလမ်း

mm

Published

 on

ဆွစ်ဇာလန်နှင့် အမေရိကန်ရှိ သုတေသီများသည် ၎င်း၏အကြောင်းအရာ သို့မဟုတ် ကွန်ရက်အပြုအမူကို ပိုင်းခြားစိတ်ဖြာခြင်းထက် ယင်းအရာသည် ဘရောက်ဆာနှင့် အပြန်အလှန်တုံ့ပြန်ပုံအပေါ် အခြေခံထားသည့် ဝဘ်ဆိုက်ကြော်ငြာပစ္စည်းကို ရှာဖွေတွေ့ရှိခြင်းအတွက် စက်သင်ယူမှုချဉ်းကပ်မှုအသစ်ကို တီထွင်ခဲ့သည်။ CNAME ဖုံးကွယ်ခြင်း၏မျက်နှာစာတွင် ရေရှည် (အောက်တွင်ကြည့်ပါ)။

ဟုအမည်ပေးထားသည့် WebGraphframework သည် a ကိုအသုံးပြုသည်။ သရုပ်ပြဇယားတယ်လီမက်ထရီ ကြိုးပမ်းမှုများနှင့် ဒေသတွင်း ဘရောက်ဆာ သိုလှောင်မှု အပါအဝင် ကွန်ရက်ကြော်ငြာခြင်း၏ မရှိမဖြစ်လိုအပ်သော လှုပ်ရှားမှုများကို အာရုံစိုက်ခြင်းဖြင့် အရောင်းမြှင့်တင်ရေးအကြောင်းအရာကို ရှာဖွေရန် အခြေခံ AI ကြော်ငြာ-ပိတ်ဆို့ခြင်း ချဉ်းကပ်မှု- တစ်ခုတည်းသော ထိရောက်သော ရှောင်ရန်နည်းလမ်းမှာ အဆိုပါ လုပ်ဆောင်ချက်များကို မလုပ်ဆောင်ရန်ဖြစ်သည်။

ယခင်ချဉ်းကပ်မှုများသည် WebGraph ထက် အနည်းငယ်ပိုမိုမြင့်မားသော ထောက်လှမ်းမှုနှုန်းများကို ရရှိခဲ့သော်လည်း၊ ၎င်းတို့အားလုံးသည် ရှောင်ရန်နည်းပညာများ ကျရောက်နိုင်ခြေရှိပြီး WebGraph သည် ဤမျက်နှာစာတွင် ထွက်ပေါ်လာနိုင်သည့် ပိုမိုရှုပ်ထွေးသော တွေးခေါ်မှုဆိုင်ရာ တုံ့ပြန်မှုများအပါအဝင် ဆန့်ကျင်ဘက်တုံ့ပြန်မှုများကို ရင်ဆိုင်ရာတွင် 100% သမာဓိရှိမှုကို ချဉ်းကပ်နိုင်သည်။ အသစ်အဆန်းကြော်ငြာ-ပိတ်ဆို့ခြင်းနည်းလမ်း။

အဆိုပါစာတမ်းကို ကယ်လီဖိုးနီးယားတက္ကသိုလ်၊ ဒေးဗစ်နှင့် အိုင်အိုဝါတက္ကသိုလ်တို့မှ သုတေသီများနှင့်အတူ ဆွစ်ဇာလန်နိုင်ငံ ဖက်ဒရယ်နည်းပညာတက္ကသိုလ်မှ သုတေသီနှစ်ဦးက ဦးဆောင်ခဲ့သည်။

AdGraph ကိုကျော်လွန်

၎င်းသည် Brave browser ဟုခေါ်သော 2020 သုတေသနပြုမှုမှ ဖွံ့ဖြိုးတိုးတက်မှုတစ်ခုဖြစ်သည်။ AdGraphစာတမ်းသစ်မှ သုတေသီနှစ်ဦးကို ဖော်ပြခဲ့သည်။

ယခင်ချဉ်းကပ်မှုတွင် ဗိသုကာဆိုင်ရာ ဆန်းသစ်တီထွင်မှုများကို ကိုယ်စားပြုသည့် အစက်ချမျဉ်းများဖြင့် AdGraph နှင့် WebGraph တို့ကို နှိုင်းယှဉ်ခြင်း။ အရင်းအမြစ်- https://arxiv.org/pdf/2107.11309.pdf

ယခင်ချဉ်းကပ်မှုတွင် ဗိသုကာဆိုင်ရာ ဆန်းသစ်တီထွင်မှုများကို ကိုယ်စားပြုသည့် အစက်ချမျဉ်းများဖြင့် AdGraph နှင့် WebGraph တို့ကို နှိုင်းယှဉ်ခြင်း။ အရင်းအမြစ်- https://arxiv.org/pdf/2107.11309.pdf

AdGraph သည် (ကြော်ငြာ) အကြောင်းအရာပေါ်တွင် မူတည်သည်။ အင်္ဂါရပ်များစီးပွားဖြစ်ပစ္စည်းကိုရှာဖွေတွေ့ရှိခြင်း၏သော့ချက်တစ်ခုအနေဖြင့်၊ URL များကိုခွဲခြမ်းစိတ်ဖြာမှုမှဆင်းသက်လာသည်။ သို့သော်၊ ဤအင်္ဂါရပ်များသည် ကြော်ငြာ-ထောက်လှမ်းမှုစနစ်များ ရှိနေခြင်းကို ရှာဖွေဖော်ထုတ်ရန်နှင့် ၎င်းတို့ကို ဖျောက်ဖျက်ရန် နည်းလမ်းများကို ဖော်မြူလာရှာဖွေနေသည့် ရန်သူများအတွက် ကျရှုံးမှုဖြစ်နိုင်သည့် တစ်ခုတည်းသောအချက်ကို ကိုယ်စားပြုသည်။ ဒီအကြောင်းအရာကို အားကိုးတယ်။ ဂုဏ်သတ္တိများ AdGraph သည် ၎င်းတို့၏ အားနည်းချက်များကို မျှဝေခြင်းဖြင့် ကိုယ်တိုင်ပြုလုပ်ထားသော စစ်ထုတ်မှုစာရင်းများကို အခြေခံသည့် ချဉ်းကပ်မှုများ၏ စက်ပြင်မှုဗားရှင်းကို အခြေခံအားဖြင့် ဖန်တီးပေးသည်။

CNAME အင်္ကျီဝတ်ခြင်း။

ဝဘ်ဆိုက်တစ်ခု၏ကိုယ်ပိုင်ဒိုမိန်းမှအစပြုသည့်အရာသည် 'ယုံကြည်စိတ်ချရသော' အမျိုးအစားထဲသို့ ကျရောက်သည်၊၊ ဒိုမိန်းကိုယ်တိုင်က ယုံကြည်ရသရွေ့၊ မြင့်မားသောအာဏာရှိဝဘ်ဆိုဒ်တစ်ခုအတွက်၊ ကြော်ငြာလှုံ့ဆော်မှုများ လုပ်ဆောင်ရာတွင် အဖိုးတန်သော ပရီမီယံတစ်ခု ရှိသည် ပေါ်လာ အာဏာပိုင်ဆိုက်ကိုယ်တိုင်က လက်ခံကျင်းပရန်၊ ထိုသို့သောကြော်ငြာများသည် စစ်ထုတ်သည့်အခြေခံကြော်ငြာပိတ်ဆို့ခြင်းစာရင်းများနှင့် 2020 AdGraph ချဉ်းကပ်မှုအထိပင် ခုခံနိုင်စွမ်းရှိသောကြောင့်ဖြစ်သည်။

သို့သော်၊ စိတ်ကြိုက်ကမ်ပိန်းများသည် ညှိနှိုင်းရန်ခက်ခဲသည်၊ အကောင်အထည်ဖော်ရန် စျေးကြီးပြီး လွန်ခဲ့သည့် 25 နှစ်ကျော်က တီထွင်ခဲ့သော ကွန်ရက်ကြော်ငြာမော်ဒယ်၏ ပင်မအခြေခံမူများနှင့် ဆန့်ကျင်ဘက်ဖြစ်ပြီး၊ ပြင်ပကုမ္ပဏီပလက်ဖောင်းတစ်ခုမှ ကုဒ်ကို လက်ခံကျင်းပသည့်ဆိုက်ထဲသို့ တိုက်ရိုက်ထည့်သွင်းလေ့ရှိသည်၊ များသောအားဖြင့် 'လေလံပစ်ခြင်း'၊ သော့ချက်စကားလုံး နှစ်သက်နိုင်မှုနှင့် အခြားအချက်များပေါ်အခြေခံ၍ မိုက်ခရိုစက္ကန့်အတွင်း ကြော်ငြာအပေါက်အပေါက်။

ဝဘ်စာမျက်နှာများရှိ ပြင်ပအဖွဲ့အစည်းပစ္စည်း (ဥပမာ 'alien' domains များတွင် လက်ခံဆောင်ရွက်ပေးသည့် အစိတ်အပိုင်းများအားလုံးနီးပါးသည် ကြော်ငြာပိတ်ဆို့ခြင်းစနစ်များအားလုံးနီးပါးတွင် အဓိကကျသောကြောင့်၊ ကြော်ငြာရှင်များသည် ပြန်လည်တိုက်ခိုက်နေကြပါသည်။ CNAME အင်္ကျီဝတ်နည်းများ ပြီးခဲ့သည့်ငါးနှစ်အတွင်း။ CNAME ဖုံးကွယ်ခြင်းသည် host site ၏ခွဲဒိုမိန်းတစ်ခု (ဥပမာ.com အစား information.example.com) သည် ပြင်ပအဖွဲ့အစည်းကြော်ငြာဖြင့်စီစဉ်ထားသော proxy ad-serving ယန္တရားတစ်ခုဖြစ်ပြီး ၎င်းသည် site ၏စစ်မှန်သောနောက်ဆက်တွဲဖြစ်ကြောင်း CNAME ကခြေရာခံသူများကိုလှည့်ဖြားသည်။ ပံ့ပိုးပေးသူများ

2021 ခုနှစ် မတ်လတွင် လေ့လာမှုတစ်ခု ပြုလုပ်ခဲ့သည်။ ထင်ရှား 22 နှင့် 2018 ခုနှစ်ကြားတွင် CNAME ခိုးယူမှုဖြစ်ရပ်များသည် 2020% တိုးလာပြီး Tranco ၏ ထိပ်တန်းဝဘ်ဆိုဒ် 10 နီးပါးသည် 10,000 ခုနှစ် အောက်တိုဘာလတွင် အနည်းဆုံး CNAME-based tracker တစ်ခုအား အသုံးချလျက်ရှိပါသည်။

URLs များတွင်ယုံကြည်မှုလျှော့စျေး

CNAME လှည့်ဖြားမှုနည်းပညာများတွင် ကြော်ငြာဝန်ဆောင်မှုပေးသည့် လုပ်ငန်းစဉ်တွင် ပါဝင်သည့် URL များကို ခြယ်လှယ်ခြင်း ပါဝင်သည်။ URL ကွင်းဆက်ကို ယုံကြည်သော ကြော်ငြာပိတ်ဆို့ခြင်းစနစ်တိုင်းသည် ခြယ်လှယ်ခြင်းနှင့် တိမ်းရှောင်ခြင်းတို့ကို ခံရမည်ဖြစ်ပါသည်။ ထို့ကြောင့် WebGraph သည် သတ်မှတ်ထားသော တားမြစ်ထားသော သို့မဟုတ် လက်ခံထားသော URL များထက် အသုံးပြုမှုပုံစံများကို ရှာဖွေခြင်း (မေးမြန်းချက်စာကြောင်းများ၊ ကန့်သတ်ချက်အရေအတွက်များနှင့် ကန့်သတ်ချက်အမည်များအပါအဝင်) လုပ်ငန်းစဉ်တစ်ခုတွင် ပံ့ပိုးပေးထားသော URL များကို ကျပန်းပြောင်းလဲပါသည်။

စနစ်သည် ကြော်ငြာဝန်ဆောင်မှုပေးသည့် ဗိသုကာတစ်ခုတွင် ဘုံဖွဲ့စည်းပုံနှစ်ခုကို ထည့်သွင်းစဉ်းစားရန် လိုအပ်သည်- တစ်ခုမှာ၊ အိမ်ရှင်သည် ကြော်ငြာရှင်နှင့် တိုက်ရိုက်ပူးပေါင်းဆောင်ရွက်နေပါသည်။ ကြော်ငြာသူသည် ၎င်း၏ဖောက်သည်များ၏ ခြယ်လှယ်မှုမှ မိမိကိုယ်ကို ကာကွယ်ရန် လိုအပ်သောကြောင့် ကြော်ငြာသူသည် အကန့်အသတ်ဖြင့် ပူးပေါင်းဆောင်ရွက်မှုကို ပံ့ပိုးပေးသည့် ဒုတိယ (ပိုဘုံ) မြင်ကွင်းတစ်ခု။

AdGraph အပါအဝင် စာရင်းအခြေခံချဉ်းကပ်မှုများတွင်၊ ကြော်ငြာဝန်ဆောင်မှုပေးသည့်စနစ်မှ အောင်မြင်သော URL ခြယ်လှယ်မှုသည် ကြော်ငြာအတွက် 'ဒေသခံ' သက်သေအဖြစ် သတ်မှတ်ခြင်းမှာ ပြီးပြည့်စုံလုနီးပါးဖြစ်ပြီး ထို့ကြောင့် ကြော်ငြာအကြောင်းအရာကို စနစ်တကျပိတ်ဆို့ရန် ကြိုးပမ်းမှုအားလုံးနီးပါးကို ရှောင်တိမ်းပါ။

လက်မှတ်နဲ့ ဘာကျန်သေးလဲ။ WebGraph သည် ကြော်ငြာစနစ်များကို အာရုံစိုက်ပြီး ဝဘ်ခြေရာခံသူများ၊ iframes နှင့် ဝဘ် 'နားဆင်သူများ' အကြား ဆက်သွယ်မှုများကဲ့သို့သော ရှုပ်ယှက်ခတ်နေသော တစ်ပိုင်းတစ်ပိုင်းနည်းလမ်းများဖြင့် သတင်းအချက်အလက်မျှဝေရန် လိုအပ်ကြောင်း၊ ဝေါဟာရများအတွက် အဓိပ္ပာယ်ပြည့်ဝသော လုပ်ဆောင်မှုများအတွက် လက်ခံဆောင်ရွက်ပေးသည့်စာမျက်နှာ၏ တိုက်ရိုက်အခြေအနေအား အဆက်မပြတ်ကောက်ယူနေပါသည်။ ကြော်ငြာအတွက် ဝဘ်မက်ထရစ်များ။ ဤလုပ်ဆောင်ချက်တွင် ကွက်ကီးများ သို့မဟုတ် HTML5 အခြေခံ ဒေသသိုလှောင်မှုတွင် ကိန်းရှင်များ သိုလှောင်မှု ပါဝင်သည်။

WebGraph သည် Mozilla ၏ Web Privacy Measurement ကို အသုံးပြုသည် (OpenWPM framework) Firefox တွင်ထိုကဲ့သို့သောလုပ်ဆောင်ချက်ကိုခြေရာခံရန်။ ၎င်းသည် JavaScript အလွှာရှိ လုပ်ဆောင်မှုအားလုံးကို ဖမ်းယူထားပြီး ကွန်ရက်အလွှာတွင် ထွက်နေသော တောင်းဆိုချက်များနှင့် ၎င်းတို့၏ တုံ့ပြန်မှုများအားလုံးကို ဖမ်းယူပါသည်။

ဤနောက်ထပ် စိစစ်မှုသည် AdGraph မှ ယခင်က အဆိုပြုထားသော ဂရပ်ကွန်ရက်သို့ 'သတင်းအချက်အလက်စီးဆင်းမှု' အစွန်းအသစ်များကို မိတ်ဆက်ပေးပြီး WebGraph သည် ဒေသတွင်း လုပ်ဆောင်ချက်အပေါ် အခြေခံ၍ သတင်းအချက်အလက်မျှဝေမှုပုံစံများကို ပြတ်သားစွာ မှတ်တမ်းတင်ပြီး အရေအတွက်ကို ခွင့်ပြုပေးကာ တယ်လီမက်ထရီ သို့မဟုတ် အခြားအင်တာနက်ဆက်သွယ်မှု အမျိုးအစားများအတွက် မူရင်းနှင့် ဦးတည်ရာ URL များကို မခွဲခြားဘဲ၊ ကြော်ငြာဝန်ဆောင်မှုစနစ်များ။

ရလဒ်များ

သုတေသီများသည် Alexa ထိပ်တန်းဆိုက် 10,000 မှယူဆောင်လာသော ဝက်ဘ်ဆိုဒ် 100,000 ကိုစနစ်တကျရှာဖွေရန် OpenWPM ၏ တိုးချဲ့ဗားရှင်းကို အသုံးပြုကာ AdG တွင် ပုံစံတူထားသော ဆုံးဖြတ်ချက်သစ်ပင်အမျိုးအစားခွဲခြားသတ်မှတ်ထားသော ဆိုက် 9,000 ၏ ကျပန်းနမူနာကို ရလဒ်များမပေးပို့မီ ၎င်းတို့၏ဂရပ်ဖစ်ကိုယ်စားပြုမှုများကို သိမ်းဆည်းထားသည်။ မူရင်းဒီဇိုင်းနှင့် လူကြိုက်များသော ကြော်ငြာ-စစ်ထုတ်သည့်စာရင်းများကို အခြေခံအမှန်တရားအဖြစ် အသုံးပြုခြင်း။ ဤနည်းအားဖြင့်၊ core model ကိုလေ့ကျင့်ရန်အတွက် dataset တစ်ခုကိုတည်ဆောက်ခဲ့သည်။

စနစ်သည် 92.33% တိကျမှုဖြင့် AdGraph နှင့် နှိုင်းယှဉ်နိုင်သောရလဒ်များကို ရရှိခဲ့သည်။ သို့သော်လည်း၊ စနစ်သစ်၏ ဆန့်ကျင်ဘက်ခုခံမှုအပေါ် ခံနိုင်ရည်ရှိမှုသည် AdGraph အတွက် လုံးဝနီးပါး ကျရှုံးမှုနှုန်းမှ WebGraph အောက်တွင် 8% သာ ခံနိုင်ရည်ရှိခြင်းသို့ မြင့်တက်လာသည်။

အနာဂတ်ဦးတည်

WebGraph ချဉ်းကပ်မှု၏မျက်နှာတွင် ထောက်လှမ်းမှုကို ရှောင်ရှားရန်အတွက် ကြော်ငြာကွန်ရက်များသည် ၎င်းတို့၏စနစ်များကို သိသိသာသာ ပြန်လည်တည်ဆောက်ရန် လိုအပ်မည်ဖြစ်ကြောင်း စာတမ်းတွင် ဖော်ပြထားပြီး၊ ထိုပြောင်းလဲမှုများသည် ပြင်ပကုမ္ပဏီကြော်ငြာသူများနှင့် ပြင်ပကုမ္ပဏီကြော်ငြာသူများကြား လက်ရှိအခြေနေယုံကြည်မှုဆိုင်ရာ ဆက်ဆံရေးကို ပြန်လည်သုံးသပ်ရန် လိုအပ်ကြောင်း စာတမ်းတွင် ဖော်ပြထားသည်။ ၎င်းတို့၏ ကြော်ငြာများ ပေါ်လာသည့် နေရာများကို လက်ခံဆောင်ရွက်ပေးသည်။

စာတမ်းတွင် WebGraph သည် လက်ရှိတွင် စနစ်မစစ်ဆေးရသေးသော APIs များကို အသုံးပြုနေသည့် ဘရောက်ဆာလက်ဗွေရာ (Canvas element မှတဆင့်) ကဲ့သို့သော နိုင်ငံမဲ့ခြေရာခံခြင်းနည်းပညာများကို ထည့်သွင်းထားခြင်းမရှိကြောင်းကိုလည်း စာတမ်းတွင် မှတ်သားထားသည်။ သုတေသီများသည် အဆိုပါ အပြန်အလှန်ဆက်သွယ်မှုများနှင့် ဒေသဆိုင်ရာ သိုလှောင်မှုဆိုင်ရာ သင်္ကေတများအတွက်လည်း အနာဂတ်တွင် WebGraph ကို ထပ်တိုးနိုင်သည်ဟု သုတေသီများက အကြံပြုထားသည်။