стуб Истраживачи вештачке интелигенције процењују да 97% веб сајтова ЕУ не испуњава ГДПР захтеве за приватност – посебно профилисање корисника – Уните.АИ
Повежите се са нама

Вештачка интелигенција

Истраживачи вештачке интелигенције процењују да 97% веб сајтова ЕУ не испуњава ГДПР захтеве за приватност – посебно профилисање корисника

mm
Ажурирано on

Истраживачи у САД су користили технике машинског учења за проучавање ГДПР политика приватности преко хиљаду репрезентативних веб локација са седиштем у ЕУ. Утврдили су да 97% проучаваних сајтова није испунило бар један захтев регулаторног оквира Европске уније из 2018. године, а да су најмање поштовали регулаторне захтеве у вези са праксом „профилирања корисника“.

У раду се наводи:

„[Пошто] је политика приватности основни комуникациони канал за кориснике да разумеју и контролишу своју приватност, многе компаније су ажурирале своје политике приватности након што је ГДПР примењен. Међутим, већина политика приватности је опширна, пуна жаргона и нејасно описује праксу компанија у вези са подацима и права корисника. Стога је нејасно да ли су у складу са ГДПР-ом.'

Наставља се:

„Наши резултати показују да чак и након што је ГДПР ступио на снагу, 97% веб локација и даље није у складу са најмање једним захтевом ГДПР-а.“

студирати је насловљен Аутоматско откривање ГДПР захтева за откривање података у политици приватности помоћу дубоког активног учења, и долази од три истраживача са Универзитета Вирџиније у Шарлотсвилу.

Приватност Ласт

Област најмање усклађености, према студији, односила се на ГДПР одредбе о профилисању корисника, при чему аутори наводе да је само 15.3% проучаваних сајтова било у потпуности у складу са овим посебним правилом.

Графикон усаглашености међу 9761 веб локацијама проучаваним за истраживање. Извор: хттпс://аркив.орг/пдф/2111.04224.пдф

Графикон усаглашености између ГДПР политика веб локација које су проучаване за истраживање. Извор: хттпс://аркив.орг/пдф/2111.04224.пдф

Профилирање корисника (где се интеракција особе са веб локацијама снима и често се користи за њихово „циљање“ у другим онлајн контекстима, као што је оглашавање) постало је једна од најжешћих контроверзи у технологији од скандала Цамбридге Аналитица.

У уторак кључни одбор Европског парламента Усвојено прва фаза новог Закона о дигиталним тржиштима (ДМА) законодавство, којим би се забранило понашање према малолетницима, изричући новчане казне до 20% од глобалан годишње продаје за компаније које крше права.

Иако су медији примили закон као директан одговор на растући утицај технолошких гиганата као што су Фејсбук и Гугл, сама скала непоштовања коју представља ново истраживање сугерише да велика већина компанија из ЕУ (укључујући ЕУ- резидентне канцеларије америчких компанија које тргују у Европи) су законски изложене глобама ГДПР.

Поред тога, Италија је ове недеље изрекла максималну дозвољену казну од 10 милиона евра (11.2 милиона УСД) против Епла и Гугла због искоришћавања профилисања корисника, између осталих прекршаја.

Датум

Сајтови испитани у новом истраживању су узорковани са 10,000 најбољих веб локација наведених у Куантцаст-у, чије су политике приватности на енглеском извучене путем Иандек претрага на ВПН-овима са седиштем у УК (како би се осигурало да политике нису гео-блокиране) .

Веб локације ЕУ су биле у обавези да обезбеде прописане политике приватности, које покривају 18 централних захтева (погледајте графикон изнад) од када је акт о општој заштити података (ГДПР) ступио на снагу у потпуности у мају 2018.

Истраживачи су ограничили своје издвајање политика приватности на период од августа 2018. надаље, како би доменима омогућило разумно време да објаве потребне политике (услов о којем су унапред знали за најмање годину дана двогодишње фазе развоја ГДПР од 2016).

Процес филтрирања произвео је корпус приватности од 9,761 политике, од којих су истраживачи насумично одабрали 1,080 политика.

Предобрада

Тим је запослио два правна стручњака да обуче четири људска анотатора да означе сваку од 18 могућих политика приватности које налаже ГДПР.

Неки од легалних језика у смерницама покривали су више од једног од 18 захтева, због чега је неопходно користити конволуциону неуронску мрежу (ЦНН) за откривање језичких карактеристика повезаних са сваком политиком.

Први покушај да се обучи модел да идентификује усклађеност на основу језика постигао је 80.5% успеха. Да би побољшали ове резултате, истраживачи су се пријавили Активно учење да побољша перформансе модела користећи мање означене податке. На овај начин било је могуће обучити класификатор ЦНН до тачности од 89.2%, са Ф1 резултат од 0.88 (где је '1' потпуни успех).

Да би осигурали да су уграђивања речи специфична за политику приватности, истраживачи су обучили модел уградње речи без надзора користећи Фацебоок-ов ФастТект Питхон библиотека.

У складу са стандардном праксом, коначни подаци су подељени 80/20 између обучених података и тестних података (тј. насумично одабраних података на основу којих ће се проценити тачност алгоритма). Студија мерења човека у петљи додата је архитектури да би се проценио квалитет резултата.

Архитектура за систем класификатора.

Архитектура за систем класификатора.

У току радног процеса произведен је 11,271 сегмент политике приватности са коментарима од стране људи, од којих су сваки прегледала четири људска анотатора које су обучила два правна стручњака укључена у студију. Тамо где је дошло до неслагања, био је потребан однос слагања од 75% како се подаци не би одбили из укључивања.

Људи у петљи – није било могуће у потпуности аутоматизовати означавање података о политици, иако је активно учење омогућило радни ток заснован на скупу који је пројекат учинио изводљивим.

Људи у петљи – није било могуће у потпуности аутоматизовати означавање података о политици, иако је активно учење омогућило радни ток заснован на скупу који је пројекат учинио изводљивим.

Поред већ наведених резултата, корисници су то открили преносивост – право према ГДПР-у на преношење или извоз података које поседује компанија – било је скоро исто тако лоше служено као и профилисање.

Истраживачи закључују:

„[Захтеви] као што су право корисника на преносивост и пружање контакт информација службеника за заштиту података (контакт ДПО) покривени су са 15.5% и 16.4% веб локација, респективно. Други примарни захтеви, као што су право корисника да уложе жалбу, повуку сагласност, право на приговор и одлуку о адекватности, покривени су од 17-20% веб локација.'

...и настави:

„Чини се да само 3% веб локација у потпуности испуњава 18 захтева. Ови налази указују да многе веб странице још увек не поштују захтеве ГДПР-а.'

 

 

7:26 11 – Појашњен први натпис на графикону. – МА