stub Tagħlim Magni vs Sistemi ta' Kunsens tal-Cookie - Unite.AI
Kuntatt magħna

Intelliġenza Artifiċjali

Tagħlim Magni vs Sistemi ta’ Kunsens tal-Cookie

mm
Aġġornata on
Wieħed mill-kubi kriptiċi mill-franchise Hellraiser.

Kollaborazzjoni ġdida ta’ riċerka bejn l-Università ta’ Wisconsin u Google twaqqaf it-tagħlim tal-magni ma’ wieħed mill-aktar fastidji notorji tal-utent tal-web tal-aħħar għaxar snin – l-opaċità u l-użu ħażin ċinika ta’ banners tal-kunsens tal-cookie konformi mal-GDPR.

Titolat CookieEnforcer, il-qafas il-ġdid juża Fehim tat-Test Semantiku biex teżamina s-sinifikat u l-utilità tal-kodiċi sottostanti wara l-popup jew il-banner tal-kunsens tal-cookie, sabiex tipprovdi lill-utent bis-soluzzjoni nieqsa 'klikk waħda' biex jiskonnettja l-cookies kollha verament 'mhux meħtieġa' - inklużi dawk li s-sidien tad-dominju jistgħu preżenti bħala 'essenzjali', anki jekk mhumiex.

CookieEnforcer jeżamina l-kodiċi tal-kunsens tal-cookie mill-websajt www.askubuntu.com. Sors: https://arxiv.org/pdf/2204.04221.pdf

CookieEnforcer jeżamina l-kodiċi tal-kunsens tal-cookie mill-websajt www.askubuntu.com. Sors: https://arxiv.org/pdf/2204.04221.pdf

Is-sistema hija implimentata permezz ta 'plugin tal-web browser installat mill-utent, li huwa kapaċi li japplika regoli definiti mill-utent fi klikk waħda. Ladarba qafas tal-kunsens tal-cookie jidher fuq il-websajt, l-utent jista' jattiva l-plugin, li mbagħad se jkarki l-kodiċi tal-kunsens tal-cookie għal azzjonijiet potenzjali qabel ma jiġġenera JavaScript appost biex jippromulga għażliet f'isem l-utent.

Il-plugin jista 'jiġi ssettjat biex jinfurza awtomatikament il-preferenzi tal-utent, jew inkella jieħu l-każijiet individwalment, li jippermetti lill-utent jaġġusta s-settings qabel is-sottomissjoni finali.

Enforcer tal-cookies fl-azzjoni. Jekk ikun ippreferut, il-plugin tal-Chrome jista' awtomat kompletament dan il-proċess, mingħajr aktar kontribut tal-utent. Ara vidjo inkorporat aktar tard għal aktar dettall. Sors: https://www.youtube.com/watch?v=5NI6Q981quc

Enforcer tal-cookies fl-azzjoni. Jekk ikun ippreferut, il-plugin tal-Chrome jista' awtomat kompletament dan il-proċess, mingħajr aktar kontribut tal-utent. Ara vidjo inkorporat aktar tard għal aktar dettall. Sors: https://www.youtube.com/watch?v=5NI6Q981quc

L-isfida li jiġu analizzati l-għażliet possibbli ta' 'mhux kunsens', li huma tipikament moħbija fi gruppi ta' settings arkani u impenjattivi (minflok dawk faċli għall-utent aċċetta kollox tipiku ta' oqfsa ta' kunsens) huwa mmudellat bħala a sekwenza għal sekwenza kompitu.

F'evalwazzjoni ta' preċiżjoni tarf sa tarf, CookieEnforcer seta' jiġġenera l-passi kollha meħtieġa biex jevita proċeduri kriptiċi ta' kunsens tal-cookies f'91% tal-każijiet studjati, fuq oqsma li ma kinux dehru waqt it-taħriġ tal-mudell tat-tagħlim tal-magni tas-sistema. Studju tal-utent wera aktar li s-sistema tnaqqas b'mod sinifikanti l-isforz tal-utent fin-navigazzjoni tal-moduli tal-kunsens.

il karta li jippreżenta l-metodu huwa intitolat CookieEnforcer: Analiżi u Infurzar Awtomatizzati tal-Avviż tal-Cookie, u ġej minn tliet riċerkaturi fl-Università ta 'Wisconsin f'Madison, u wieħed minn Google Inc.

Arcane Roads to Cookie Kunsens

Sa mill-promulgazzjoni tar-Regolament Ġenerali dwar il-Protezzjoni tad-Dejta (GDPR) fl-2016 u l-Att dwar il-Privatezza tal-Konsumatur tal-Kalifornja (CCPA) fl-2018, websajts li jridu jinvolvu utenti mill-oqsma koperti minn tali leġiżlazzjoni ġew mitluba jipprovdu mekkaniżmi ta’ preferenza tal-cookies (ġeneralment ibbażati fuq l-iskoperta tal-indirizz IP tal-utent bħala prokura tagħhom). pajjiż tal-oriġini).

Madankollu, peress li s-sidien tad-dominji kienu ilhom imdorrijin jiġbru dejta siewja u azzjonabbli tal-utent mill-implimentazzjoni opaka u li normalment ma tidhirx tal-cookies, urew li kienu riluttanti li jipprovdu opt-outs faċli għall-utenti tagħhom li għadhom kif ngħataw is-setgħa.

L-UI default għall-interfaces tal-kunsens tal-cookie (li jidhru l-ewwel darba li utent iżur dominju, jew jekk l-utent ħassar il-cookies għal dak id-dominju) malajr issetilja f' mudelli mudlama iddisinjat biex igħejja lit-telespettatur b'għażliet granulari, li jieħdu ħafna ħin u estensivi fil-każ li jkunu riedu jeżerċitaw id-drittijiet tagħhom għall-kunsens; jew inkella buttuna sempliċi u faċilment aċċessibbli li għażlet lill-utent fil-cookies kollha li s-sid tad-dominju xtaq iħaddem. Din il-kultura ta 'għażliet labirintiċi UI kienet deskritta fi studju wieħed tal-2020 bħala 'kaċċa għall-kenis'.

Id-dokument il-ġdid jikkummenta:

'[L-utenti] jistgħu jsibuha diffiċli biex jeżerċitaw kontroll infurmat tal-cookies għal websajts b'avviżi kkumplikati. Huma ħafna aktar probabbli li jiddependu fuq konfigurazzjonijiet default milli jirfinaw is-settings tal-cookies tagħhom għal kull [websajt]. F'diversi każijiet, dawn is-settings default huma invażivi għall-privatezza u jiffavorixxu lill-fornituri tas-servizz, li jirriżulta fi [riskji] ta' privatezza.'

Kumment fuq wieħed post popolari fil-forum rigward dawn il-prattiki kkaratterizzawhom bħala “konformità malizzjuża”. Id-dwejjaq tal-utent bl-oqfsa tal-kunsens tal-cookies huwa suġġett li jikkonfliġġa lill-pubblikaturi ewlenin, li normalment jistgħu jaffordjaw aktar kopertura jekk ma kinux esposti personalment b'mod daqshekk mill-prattiki tagħhom stess f'dan ir-rigward.

Labirint tipiku ta' għażliet ippreżentat, f'dan il-każ, mill-websajt TechCrunch, ironikament bħala prefazju għal artiklu dwar l-attitudni li qed tinbidel tal-UE għal dak li jikkostitwixxi kunsens għall-cookie. L-identifikaturi tal-URL u l-ganċijiet mehmuża ddisinjati biex jippermettu aktar it-traċċar kienu ta' 262 karattru (imħassar hawn). Buttuna 'tiċħad kollox', filwaqt li hija disponibbli għal ċerti kategoriji ta' cookie, mhix disponibbli għas-sett kollu ta' cookies possibbli; f'dawk il-każijiet eżentati, l-utent għandu jopera kull 'toggle'.

Labirint tipiku ta' għażliet ippreżentati, f'dan il-każ, mill-websajt TechCrunch, ironikament bħala prefazju għal artikolu dwar l-attitudni li qed tinbidel tal-UE għal dak li jikkostitwixxi kunsens għall-cookie. L-identifikaturi tal-URL u l-ganċijiet mehmuża ddisinjati biex jippermettu aktar it-traċċar kienu ta' 262 karattru (imħassar hawn). Buttuna 'tiċħad kollox', filwaqt li hija disponibbli għal ċerti kategoriji ta' cookie, mhix disponibbli għas-sett kollu ta' cookies possibbli; f'dawk il-każijiet eżentati, l-utent għandu jopera kull 'toggle'.

A Karta 2019 mill-Ġermanja sabet li l-maġġoranza tal-viżitaturi tas-sit fid-dominji studjati kienu 'mħeġġa' lejn kunsens wiesa', u li terz biss tal-websajts fil-fatt spjegaw l-għanijiet tal-prattiki tal-ġbir tad-dejta.

F'dawn l-aħħar snin ħarġu għadd ta' plugins tal-web browser, add-ons u estensjonijiet biex jindirizzaw il-problema, bħall- Cookie Quick Manager estensjoni ta' Firefox, u a firxa wiesgħa tal-alternattivi Chrome, filwaqt li l-Unjoni Ewropea hija tfittex li tagħlaq il-lakuni ta' konformità madwar l-arkitetturi tal-kunsens tal-cookie.

Metodu u Dejta

Ir-riċerkaturi tad-dokument il-ġdid kienu determinati li joħolqu qafas ta’ ġestjoni tal-kunsens tal-cookie aktar robust billi jevitaw id-dipendenza fuq kliem prinċipali jew regoli magħmulin bl-idejn, l-approċċ ċentrali ta’ għadd ta’ reċenti simili. Megħjuna mill-ML proġetti.

CookieEnforcer għandu tliet għanijiet: li jittraduċi avviżi u interfaces tal-cookie f'format li jinqara mill-magna; biex tidentifika l-konfigurazzjoni tal-issettjar tal-cookies b'mod li tiddiżattiva l-cookies mhux essenzjali; u biex tapplika awtomatikament restrizzjonijiet addizzjonali mingħajr aktar input mill-utent, jekk mixtieq mill-utent.

Is-sistema tikkonsisti minn komponent backend li jiskopri u janalizza avviżi tal-cookies, u komponent frontend, fil-forma ta’ estensjoni tal-browser, li jiġġenera u jesegwixxi d-diżattivazzjoni ta’ cookies mhux essenzjali (jiġifieri cookies li ma jostakolawx in-navigazzjoni jew l-aċċess għal id-dominju jekk imblukkat).

Il-qafas huwa inkorporat f'estensjoni installata lokalment speċifika għal Chrome li tuża l- Selenju librerija tal-ittestjar tal-web taħt il- ChromeDriver qafas.

Is-sezzjoni backend karatteristiċi moduli għall-iskoperta, analiżi, u mudell ta 'deċiżjoni. Il-modulu ta' analiżi jqis il-bidliet fil-kodiċi introdotti mill-interazzjoni tal-utent, sabiex id-dump tal-kodiċi inizjali ma jsirx invalidu permezz tal-esplorazzjoni simulata tal-utent.

Fehim tal-Lingwa Naturali

Bil-kodiċi żvelat, huwa importanti li CookieEnforcer jifhem l-istat eżistenti ta 'azzjonijiet possibbli li jista' jieħu, peress li l-lingwa wara l-buttuni toggle tista 'tkun ambigwa f'termini ta' benefiċċju għall-utent aħħari.

Għal dan il-għan, ir-riċerkaturi mħarrġa a Transformer tat-Trasferiment Test-To-Text (T5) għall-komponent tad-deċiżjoni tiegħu. Il-mudell T5-Large, li fih 770 miljun parametru, ġie rfinat fuq database tad-dwana ta 'kodiċi ta' input/output (jiġifieri, kodiċi li jiddeskrivi u jippermetti l-funzjonalità ta 'għażliet toggling).

Formattjar tal-kampjun (fuq) u data ta 'taħriġ (taħt) għall-mudell T5. L-eżempju tad-dejta huwa minn www.askubuntu.com.

Formattjar tal-kampjun (fuq) u data ta 'taħriġ (taħt) għall-mudell T5. L-eżempju tad-dejta huwa minn www.askubuntu.com.

Is-sett tad-dejta nħoloq billi ttieħdu kampjuni ta' 300 websajt b'avviżi dwar cookie magħżula minn Tranco's top-50k websajts popolari lista. Il-moduli detector u analizzatur estratt l-għażliet tal-kunsens tal-cookie mill-kodiċi tas-sors runtime tagħhom, u evalwaw l-istati default tagħhom.

Wieħed mir-riċerkaturi mbagħad ittikkettja manwalment is-serje interpretata ta 'klikks meħtieġa biex jiskonnettja l-cookies mhux essenzjali għall-websajts kollha studjati, li rriżulta fi 300 dominju kompletament ittikkettat.

Varjetà fid-dispożizzjoni tal-kodiċi tas-sors fost eżempji mis-sett tad-dejta tad-dwana.

Varjetà fid-dispożizzjoni tal-kodiċi tas-sors fost eżempji mis-sett tad-dejta tad-dwana.

60 websajt twarrbu bħala sett tat-test, u l-mudell T5-Kbir ġie mħarreġ b'rata ta 'tagħlim ta' 0.003 f'daqs ta 'lott ta' 16 għal 20 epoch, b'tul massimu ta 'sekwenza ta' input ta '256 tokens, u tul massimu ta' sekwenza fil-mira. ta' 64. It-tokens kienu ffurmati minn sub-kliem stabbiliti minn Google's SentencePiece tokenizer.

Fl-aħħarnett, l-informazzjoni pproċessata tinħażen f'database lokali u ssir disponibbli għall-parti ta' quddiem tas-sistema. L-awturi ffavorew il- querySelector () Funzjoni HTML fuq l-XML Path Language (XPath) approċċ meħud minn xi proġetti simili preċedenti, peress li XPaths għall-avviżi tal-cookies huma vulnerabbli għal aġġornamenti DOM (jiġifieri l-kodiċi jista' jinbidel wara t-tagħbija inizjali b'reazzjoni għall-interazzjonijiet tal-utent). B'dan il-mod, il-mogħdijiet tal-element jistgħu jinżammu anke meta jkunu dinamiċi u jirrispondu għal fatturi esterni.

Ittestjar u Prestazzjoni

Fil-prattika, CookieEnforcer wera li kien kapaċi jinnaviga xi wħud mill-mudelli skuri l-aktar skuri fis-sett tad-dejta, bħal għażla moħbija fil-qafas tal-kunsens tal-cookie ta’ Ix-Xjenzat il-Ġdid li hija mgħottija minn JavaScript sakemm l-utent espliċitament jitlob li jarah.

L-awturi jikkummentaw:

'Din l-għażla tista' faċilment tintilef mill-utenti peress li jridu jespandu qafas addizzjonali biex jaraw dan. CookieEnforcer mhux biss isib din l-għażla, iżda jifhem ukoll is-semantika u jiddeċiedi li joġġezzjona. Dawn l-eżempji juru li l-mudell jitgħallem il-kuntest u jiġġeneralizza għal eżempji ġodda.'

Ir-riċerkaturi wettqu tliet testijiet, inkluża evalwazzjoni tarf sa tarf tal-prestazzjoni tal-qafas fuq 500 qasam li ma tidhirx (jiġifieri websajts li CookieEnforcer ma kienx imħarreġ speċifikament għalihom), fejn l-awturi jirrappurtaw li seta’ jiskonnettja b’suċċess cookies mhux essenzjali għal 91% tas-siti.

It-tieni test kien jinkludi studju tal-utent onlajn li jkopri 14-il websajt, u bl-użu tal-Iskala tal-Użabilità tas-Sistema (punteġġ) kontra linja bażi manwali. Għal dan it-test, l-awturi jirrappurtaw li CookieEnforcer kiseb punteġġ 15% ogħla mil-linja bażi.

CookieEnforcer jippermetti punteġġ 15% ogħla mill-użu tal-linja bażi (mhux megħjuna), fl-istess ħin awtomat ta 'proċess vexing.

CookieEnforcer jippermetti punteġġ 15% ogħla mill-użu tal-linja bażi (mhux megħjuna), fl-istess ħin awtomat ta 'proċess vexing.

Fl-aħħarnett, il-parametri mħarrġa ta 'CookieEnforcer ġew ittestjati kontra l-aqwa 5000 websajt fl-Istati Uniti u l-Ewropa, biex tiddetermina l-kapaċità tagħha li tinnaviga l-avviżi tal-cookies. L-awturi jgħidu:

'Filwaqt li kejl fuq skala bħal din sar qabel, CookieEnforcer jippermetti fehim aktar profond tal-għażliet lil hinn mill-euristiċi bbażati fuq keyword. B'mod partikolari, insibu li 16.7% tal-websajts fir-Renju Unit li juru avviżi dwar il-cookies ippermettew mill-inqas cookie waħda mhux essenzjali. L-istess numru għall-websajts fl-Istati Uniti huwa 22%.'

L-awturi ħarġu vidjo qasir fuq YouTube li juri lil CookieEnforcer fl-azzjoni:

Cookie Enforcer li jiddiżattiva cookies mhux essenzjali fuq askubuntu.com

 

Ippublikat għall-ewwel darba fit-12 ta' April 2022.