ठूंठ एआई शोधकर्ताओं का अनुमान है कि यूरोपीय संघ की 97% वेबसाइटें जीडीपीआर गोपनीयता आवश्यकताओं में विफल रहती हैं - विशेष रूप से उपयोगकर्ता प्रोफाइलिंग - यूनाइट.एआई
हमसे जुडे

Artificial Intelligence

एआई शोधकर्ताओं का अनुमान है कि यूरोपीय संघ की 97% वेबसाइटें जीडीपीआर गोपनीयता आवश्यकताओं में विफल रहती हैं - विशेष रूप से उपयोगकर्ता प्रोफाइलिंग

mm
Updated on

अमेरिका में शोधकर्ताओं ने यूरोपीय संघ में स्थित एक हजार से अधिक प्रतिनिधि वेबसाइटों की जीडीपीआर गोपनीयता नीतियों का अध्ययन करने के लिए मशीन लर्निंग तकनीकों का उपयोग किया है। उन्होंने पाया कि अध्ययन की गई 97% साइटें यूरोपीय संघ के 2018 नियामक ढांचे की कम से कम एक आवश्यकता का अनुपालन करने में विफल रहीं, और उन्होंने 'उपयोगकर्ता प्रोफाइलिंग' के अभ्यास के आसपास नियामक आवश्यकताओं का सबसे कम अनुपालन किया।

पेपर बताता है:

'[चूंकि] गोपनीयता नीति उपयोगकर्ताओं के लिए उनकी गोपनीयता को समझने और नियंत्रित करने के लिए आवश्यक संचार चैनल है, जीडीपीआर लागू होने के बाद कई कंपनियों ने अपनी गोपनीयता नीतियों को अपडेट किया है। हालाँकि, अधिकांश गोपनीयता नीतियाँ शब्दाडंबरपूर्ण हैं, शब्दजाल से भरी हैं, और कंपनियों की डेटा प्रथाओं और उपयोगकर्ताओं के अधिकारों का अस्पष्ट रूप से वर्णन करती हैं। इसलिए, यह स्पष्ट नहीं है कि वे जीडीपीआर का अनुपालन करते हैं या नहीं।'

यह जारी है:

'हमारे नतीजे बताते हैं कि जीडीपीआर लागू होने के बाद भी, 97% वेबसाइटें अभी भी जीडीपीआर की कम से कम एक आवश्यकता का अनुपालन करने में विफल हैं।'

RSI अध्ययन शीर्षक है डीप एक्टिव लर्निंग का उपयोग करके गोपनीयता नीतियों में जीडीपीआर प्रकटीकरण आवश्यकताओं का स्वचालित पता लगाना, और चार्लोट्सविले में वर्जीनिया विश्वविद्यालय के तीन शोधकर्ताओं से आता है।

गोपनीयता अंतिम

अध्ययन के अनुसार, सबसे कम अनुपालन का क्षेत्र जीडीपीआर से संबंधित है शर्तों उपयोगकर्ता प्रोफाइलिंग के बारे में, लेखकों ने कहा कि अध्ययन की गई साइटों में से केवल 15.3% ही इस विशेष नियम के पूर्ण अनुपालन में थीं।

शोध के लिए 9761 वेबसाइटों के बीच अनुपालन का ग्राफ अध्ययन किया गया। स्रोत: https://arxiv.org/pdf/2111.04224.pdf

अनुसंधान के लिए वेबसाइटों की जीडीपीआर नीतियों के बीच अनुपालन का एक ग्राफ का अध्ययन किया गया। स्रोत: https://arxiv.org/pdf/2111.04224.pdf

उपयोगकर्ता प्रोफ़ाइलिंग (जहां वेबसाइटों के साथ किसी व्यक्ति की बातचीत को रिकॉर्ड किया जाता है और अक्सर विज्ञापन जैसे अन्य ऑनलाइन संदर्भों में उन्हें 'लक्षित' करने के लिए उपयोग किया जाता है) कैम्ब्रिज एनालिटिका घोटाले के बाद से तकनीक में सबसे गर्म विवादों में से एक बन गया है।

मंगलवार को यूरोपीय संसद की एक प्रमुख समिति पारित कर दिया नए डिजिटल बाज़ार अधिनियम का पहला चरण (डीएमए) कानून, जो नाबालिगों के व्यवहारिक लक्ष्यीकरण पर प्रतिबंध लगाएगा, 20% तक जुर्माना लगाएगा वैश्विक उल्लंघनकारी कंपनियों के लिए वार्षिक बिक्री।

हालाँकि इस अधिनियम को फेसबुक और गूगल जैसे तकनीकी दिग्गजों के बढ़ते प्रभाव की सीधी प्रतिक्रिया के रूप में मीडिया द्वारा स्वीकार किया गया है, नए शोध द्वारा दर्शाए गए गैर-अनुपालन के व्यापक पैमाने से पता चलता है कि यूरोपीय संघ की अधिकांश कंपनियां (ईयू सहित) (यूरोप में व्यापार करने वाली अमेरिकी कंपनियों के निवासी कार्यालय) कानूनी तौर पर जीडीपीआर जुर्माने के अधीन हैं।

इसके अतिरिक्त, इटली ने इस सप्ताह अधिकतम स्वीकार्य जुर्माना लगाया है 10 मिलियन यूरो का अन्य उल्लंघनों के अलावा उपयोगकर्ता प्रोफाइलिंग का शोषण करने के लिए Apple और Google के विरुद्ध ($11.2 मिलियन USD)।

जानकारी

नए शोध में जांच की गई साइटों को क्वांटकास्ट में सूचीबद्ध शीर्ष 10,000 वेबसाइटों से नमूना लिया गया था, जिनकी अंग्रेजी भाषा की गोपनीयता नीतियों को यूके-आधारित वीपीएन पर यांडेक्स खोजों के माध्यम से निकाला गया था (यह सुनिश्चित करने के लिए कि नीतियां भू-अवरुद्ध नहीं थीं) .

मई 18 में जनरल डेटा प्रोटेक्शन रेगुलेशन (जीडीपीआर) अधिनियम पूर्ण रूप से लागू होने के बाद से यूरोपीय संघ की वेबसाइटें 2018 केंद्रीय आवश्यकताओं (ऊपर ग्राफ़ देखें) को कवर करते हुए निर्धारित गोपनीयता नीतियां प्रदान करने के लिए बाध्य हैं।

शोधकर्ताओं ने गोपनीयता नीतियों के निष्कर्षण को अगस्त 2018 से आगे की अवधि तक सीमित कर दिया, ताकि डोमेन को आवश्यक नीतियों को प्रकाशित करने के लिए उचित समय मिल सके (एक आवश्यकता जिसके बारे में उन्हें दो साल के विकास चरण के कम से कम एक वर्ष के लिए अग्रिम ज्ञान था) 2016 से जीडीपीआर)।

फ़िल्टरिंग प्रक्रिया ने 9,761 नीतियों का एक गोपनीयता कोष तैयार किया, जिसमें से 1,080 नीतियों को शोधकर्ताओं द्वारा यादृच्छिक रूप से चुना गया था।

पूर्व प्रसंस्करण

टीम ने जीडीपीआर द्वारा अनिवार्य 18 संभावित गोपनीयता नीतियों में से प्रत्येक को लेबल करने के लिए चार मानव व्याख्याकारों को प्रशिक्षित करने के लिए दो कानूनी विशेषज्ञों को नियुक्त किया।

नीतियों में कुछ वैधानिकताएं 18 आवश्यकताओं में से एक से अधिक को कवर करती हैं, जिससे प्रत्येक नीति से जुड़ी भाषा सुविधाओं का पता लगाने के लिए कन्वेन्शनल न्यूरल नेटवर्क (सीएनएन) का उपयोग करना आवश्यक हो जाता है।

भाषा के आधार पर अनुपालन की पहचान करने के लिए एक मॉडल को प्रशिक्षित करने के प्रारंभिक प्रयास में 80.5% सफलता हासिल हुई। इन परिणामों को बेहतर बनाने के लिए शोधकर्ताओं ने आवेदन किया सक्रिय अध्ययन कम लेबल वाले डेटा का उपयोग करके मॉडल के प्रदर्शन को बढ़ाने के लिए। इन माध्यमों से क्लासिफायर सीएनएन को 89.2% की सटीकता तक प्रशिक्षित करना संभव था एफ 1 का स्कोर 0.88 का (जहाँ '1' पूर्ण सफलता है)।

यह सुनिश्चित करने के लिए कि शब्द एम्बेडिंग गोपनीयता नीति के लिए विशिष्ट थे, शोधकर्ताओं ने फेसबुक का उपयोग करके एक अप्रशिक्षित शब्द एम्बेडिंग मॉडल को प्रशिक्षित किया फास्ट टेक्स्ट अजगर पुस्तकालय।

मानक अभ्यास के अनुसार, अंतिम डेटा को प्रशिक्षित डेटा और परीक्षण डेटा (यानी यादृच्छिक रूप से चयनित डेटा जिसके आधार पर एल्गोरिदम की सटीकता का आकलन किया जाएगा) के बीच 80/20 विभाजित किया गया था। परिणामों की गुणवत्ता का मूल्यांकन करने के लिए वास्तुकला में एक मानव-इन-द-लूप माप अध्ययन जोड़ा गया था।

क्लासिफायर सिस्टम के लिए आर्किटेक्चर।

क्लासिफायर सिस्टम के लिए आर्किटेक्चर।

वर्कफ़्लो के दौरान, 11,271 मानव-एनोटेटेड गोपनीयता नीति खंड तैयार किए गए थे, जिनमें से प्रत्येक की समीक्षा चार मानव एनोटेटर्स द्वारा की गई थी जिन्हें अध्ययन में शामिल दो कानूनी विशेषज्ञों द्वारा प्रशिक्षित किया गया था। जहां असहमति हुई, डेटा को शामिल करने से अस्वीकार न करने के लिए 75% सहमति अनुपात की आवश्यकता थी।

ह्यूमन-इन-द-लूप - पॉलिसी डेटा की लेबलिंग को पूरी तरह से स्वचालित करना संभव नहीं था, हालांकि सक्रिय लर्निंग ने एक पूल-आधारित वर्कफ़्लो सक्षम किया जिसने परियोजना को व्यवहार्य बना दिया।

ह्यूमन-इन-द-लूप - पॉलिसी डेटा की लेबलिंग को पूरी तरह से स्वचालित करना संभव नहीं था, हालांकि सक्रिय लर्निंग ने एक पूल-आधारित वर्कफ़्लो सक्षम किया जिसने परियोजना को व्यवहार्य बना दिया।

पहले से बताए गए परिणामों के अलावा, उपयोगकर्ताओं को वह भी मिला पोर्टेबिलिटी - किसी कंपनी द्वारा रखे गए डेटा को स्थानांतरित करने या निर्यात करने के लिए जीडीपीआर के तहत अधिकार - प्रोफाइलिंग के समान ही खराब तरीके से परोसा गया था।

शोधकर्ताओं का निष्कर्ष है:

'[आवश्यकताएँ] जैसे उपयोगकर्ताओं का पोर्टेबिलिटी का अधिकार और डेटा सुरक्षा अधिकारी (डीपीओ संपर्क) की संपर्क जानकारी प्रदान करना क्रमशः 15.5% और 16.4% वेबसाइटों द्वारा कवर किया जाता है। अन्य प्राथमिक आवश्यकताएं, जैसे उपयोगकर्ताओं का शिकायत दर्ज करने का अधिकार, सहमति वापस लेने का अधिकार, आपत्ति का अधिकार और पर्याप्त निर्णय लेने का अधिकार, 17-20% वेबसाइटों द्वारा कवर किए जाते हैं।'

…और जारी रखने के लिए:

'ऐसा प्रतीत होता है कि केवल 3% वेबसाइटें ही 18 आवश्यकताओं का पूरी तरह से अनुपालन करती हैं। इन निष्कर्षों से संकेत मिलता है कि कई वेबसाइटें अभी भी जीडीपीआर की आवश्यकताओं का पालन नहीं करती हैं।'

 

 

7/26/11 शाम 2021 बजे - पहला ग्राफ कैप्शन स्पष्ट किया गया। – एम.ए