stub AI судлаачид ЕХ-ны вэбсайтуудын 97% нь GDPR-ийн нууцлалын шаардлагад нийцэхгүй байна гэж тооцоолж байна - Ялангуяа хэрэглэгчийн профайл - Unite.AI
бидэнтэй хамт холбоно

Хиймэл оюун

AI судлаачид ЕХ-ны вэбсайтуудын 97% нь GDPR-ийн нууцлалын шаардлагыг хангаагүй гэж тооцоолж байна - Ялангуяа хэрэглэгчийн профайл

mm
шинэчлэгдсэн on

АНУ-ын судлаачид ЕХ-нд байрладаг мянга гаруй төлөөлөгчийн вэбсайтын GDPR нууцлалын бодлогыг судлахын тулд машин сургалтын техникийг ашигласан. Судалгаанд хамрагдсан сайтуудын 97% нь Европын Холбооны 2018 оны зохицуулалтын тогтолцооны дор хаяж нэг шаардлагыг дагаж мөрдөөгүй, мөн "хэрэглэгчийн профайл" хийх практикийн талаарх зохицуулалтын шаардлагыг хамгийн бага дагаж мөрддөг болохыг тэд олж тогтоосон.

Цаасан дээр:

'[Нууцлалын бодлого] нь хэрэглэгчдэд өөрсдийн нууцлалыг ойлгож, хянахад чухал харилцаа холбооны суваг байдаг тул олон компаниуд GDPR-ийг хэрэгжүүлсний дараа нууцлалын бодлогоо шинэчилсэн. Гэсэн хэдий ч ихэнх нууцлалын бодлого нь нарийн үгтэй, үг хэллэгээр дүүрэн бөгөөд компаниудын өгөгдлийн үйл ажиллагаа, хэрэглэгчдийн эрхийг тодорхойгүй дүрсэлсэн байдаг. Тиймээс тэд GDPR-д нийцэж байгаа эсэх нь тодорхойгүй байна.'

Үргэлжлүүлэн:

"Бидний үр дүнгээс харахад GDPR хүчин төгөлдөр болсон ч вэбсайтуудын 97% нь GDPR-ийн дор хаяж нэг шаардлагыг дагаж мөрддөггүй хэвээр байна."

The судалгаа гэсэн гарчигтай Deep Active Learning ашиглан Нууцлалын бодлого дахь GDPR-ийн мэдээллийг задруулах шаардлагыг автоматаар илрүүлэх, мөн Шарлоттсвилл дахь Виржиниагийн их сургуулийн гурван судлаачаас ирсэн.

Нууцлал Сүүлийн

Судалгаанаас харахад хамгийн бага дагаж мөрддөг газар нь GDPR-тай холбоотой байв заалтууд Хэрэглэгчийн профайлын талаар, зохиогчид судлагдсан сайтуудын зөвхөн 15.3% нь энэ дүрэмд бүрэн нийцэж байна гэж мэдэгджээ.

Судалгаанд хамрагдсан 9761 вэб сайтын нийцлийн график. Эх сурвалж: https://arxiv.org/pdf/2111.04224.pdf

Судалгаанд хамрагдсан вэбсайтуудын GDPR бодлогод нийцсэн байдлын график. Эх сурвалж: https://arxiv.org/pdf/2111.04224.pdf

Хэрэглэгчийн профайлыг тогтоох (хүний ​​вэбсайттай харьцаж буй үйлдлийг бүртгэж, ихэвчлэн зар сурталчилгаа гэх мэт бусад онлайн нөхцөл байдалд "онилох" зорилгоор ашигладаг) нь Cambridge Analytica-ийн дуулианаас хойшхи технологийн хамгийн халуун маргаануудын нэг болсон.

Мягмар гарагт Европын парламентын гол хороо дамжуулсан Дижитал зах зээлийн шинэ хуулийн эхний шат (DMA) насанд хүрээгүй хүүхдийг зан үйлд нь онилохыг хориглосон хууль тогтоомж, 20 хүртэлх хувиар торгох. Дэлхий нийтийн зөрчил гаргасан компаниудын жилийн борлуулалт.

Хэдийгээр энэ хуулийг Facebook, Google зэрэг технологийн аваргуудын нөлөөлөл нэмэгдэж буйтай шууд холбоотой гэж хэвлэл мэдээллийнхэн хүлээн авсан ч шинэ судалгаагаар ЕХ-ны компаниудын дийлэнх нь (түүний дотор ЕХ-ны- Европт худалдаа эрхэлдэг Америкийн компаниудын оршин суудаг оффисууд) хууль ёсны дагуу GDPR торгуультай байдаг.

Нэмж дурдахад, Итали энэ долоо хоногт зөвшөөрөгдөх дээд хэмжээг тогтоов 10 сая евро (11.2 сая ам. доллар) Apple болон Google-ийн эсрэг хэрэглэгчийн профайлыг ашигласан, бусад зөрчлийн хэргээр шүүхэд өгсөн.

Өгөгдөл

Шинэ судалгаанд хамрагдсан сайтуудыг Quantcast-д жагсаасан шилдэг 10,000 вэб сайтаас түүвэрлэн авч, англи хэл дээрх нууцлалын бодлогыг Их Британид суурилсан VPN-ууд дээр Yandex хайлтын системээр хайлт хийсэн (бодлогуудыг гео блоклохгүй байхын тулд) .

ЕХ-ны вэбсайтууд 18 оны 2018-р сард Мэдээлэл Хамгаалах Ерөнхий Зохицуулалт (GDPR) бүрэн хүчин төгөлдөр болсноос хойш XNUMX үндсэн шаардлагыг (дээрх графикийг харна уу) хамарсан нууцлалын тодорхой бодлогыг хангах үүрэгтэй.

Судлаачид 2018 оны 2016-р сараас хойшхи хугацаанд нууцлалын бодлогыг задлах хугацааг хязгаарлаж, домайнуудад шаардлагатай бодлогуудыг хэвлэн нийтлэхэд боломжийн хугацаа олгох (тэд XNUMX жилийн хөгжлийн үе шатны талаар дор хаяж нэг жилийн хугацаанд урьдчилан мэдлэгтэй байх шаардлагатай. XNUMX оноос хойш GDPR).

Шүүлтүүр хийх явцад 9,761 бодлогын нууцлалыг хамгаалах багц бүрдүүлснээс 1,080 бодлогыг судлаачид санамсаргүй байдлаар сонгосон байна.

Урьдчилсан боловсруулалт

Тус баг нь GDPR-аас заасан 18 нууцлалын бодлого тус бүрийг шошголох дөрвөн хүний ​​аннотаторыг сургахын тулд хуулийн хоёр мэргэжилтэн ажиллуулсан.

Бодлогын зарим хууль тогтоомж нь 18 шаардлагын нэгээс илүүг хамарсан тул бодлого бүртэй холбоотой хэлний онцлогийг илрүүлэхийн тулд Convolutional Neural Network (CNN) ашиглах шаардлагатай болсон.

Хэл дээр тулгуурлан дагаж мөрдөхийг тодорхойлох загварыг сургах анхны оролдлого 80.5% амжилтанд хүрсэн. Эдгээр үр дүнг сайжруулахын тулд судлаачид өргөдөл гаргасан Идэвхтэй сурах бага шошготой өгөгдөл ашиглан загварын гүйцэтгэлийг нэмэгдүүлэх. Эдгээрийн тусламжтайгаар CNN ангилагчийг 89.2% нарийвчлалтайгаар сургах боломжтой болсон. F1 оноо 0.88 ("1" нь бүрэн амжилт юм).

Судлаачид үг оруулах нь нууцлалын бодлогод нийцэх эсэхийг шалгахын тулд Facebook-ийн ашиглан хяналтгүй үг оруулах загварыг сургасан. Хурдан текст Python номын сан.

Стандарт практикийн дагуу эцсийн өгөгдлийг бэлтгэгдсэн өгөгдөл болон туршилтын өгөгдөл (өөрөөр хэлбэл алгоритмын нарийвчлалыг үнэлэх санамсаргүй байдлаар сонгосон өгөгдөл) хооронд 80/20 хуваасан. Үр дүнгийн чанарыг үнэлэхийн тулд хүний ​​​​хэмжилтийн судалгааг архитектурт нэмсэн.

Ангилагч системийн архитектур.

Ангилагч системийн архитектур.

Ажлын явцад хүний ​​тайлбартай 11,271 нууцлалын бодлогын сегментийг бэлтгэсэн бөгөөд тус бүрийг судалгаанд хамрагдсан хоёр хуулийн мэргэжилтэн бэлтгэсэн дөрвөн хүний ​​аннотатор хянасан. Санал зөрөлдөөн гарсан тохиолдолд мэдээллийг оруулахаас татгалзахгүйн тулд 75% -ийн зөвшилцлийн харьцаа шаардлагатай байв.

"Хүмүүс-давталт" - Хэдийгээр Active Learning нь усан санд суурилсан ажлын урсгалыг идэвхжүүлж, төслийг хэрэгжүүлэх боломжтой болгосон ч бодлогын өгөгдлийн шошгыг бүрэн автоматжуулах боломжгүй байсан.

"Хүмүүс-давталт" - Хэдийгээр Active Learning нь усан санд суурилсан ажлын урсгалыг идэвхжүүлж, төслийг хэрэгжүүлэх боломжтой болгосон ч бодлогын өгөгдлийн шошгыг бүрэн автоматжуулах боломжгүй байсан.

Өмнө дурьдсан үр дүнгээс гадна хэрэглэгчид үүнийг олж мэдсэн зөөврийн – GDPR-ийн дагуу компанийн эзэмшиж буй өгөгдлийг шилжүүлэх, экспортлох эрх нь профайл хийхтэй адил бараг л хангалтгүй байсан.

Судлаачид дүгнэж байна:

Хэрэглэгчийн зөөвөрлөх эрх, Мэдээлэл хамгаалах ажилтны (DPO холбоо барих) холбоо барих мэдээллийг өгөх зэрэг [шаардлага] 15.5%, 16.4% вэб сайтад тусгагдсан байна. Хэрэглэгчийн Гомдол гаргах эрх, Зөвшөөрлийг буцаах, Эсэргүүцэх эрх, Хангалттай байдлын шийдвэр зэрэг бусад үндсэн шаардлагуудыг 17-20% вэб сайтаар хангадаг.'

…ба үргэлжлүүлэх:

"Вэбсайтуудын ердөө 3% нь 18 шаардлагыг бүрэн хангаж байгаа бололтой. Эдгээр дүгнэлт нь олон вэбсайтууд GDPR-ийн шаардлагыг дагаж мөрдөөгүй хэвээр байгааг харуулж байна.'

 

 

7 оны 26 сарын 11-ны 2021 цаг – Графикийн эхний тайлбарыг тодруулсан. – Ма