peň Čo je diferenciálne súkromie? - Spojte sa.AI
Spojte sa s nami

Umelá inteligencia

Čo je diferenciálne súkromie? 

Aktualizované on

Žijeme éru veľkých dát, ktorá ešte viac zamerala pozornosť na tému ochrany osobných údajov. Ľudia produkujú neuveriteľné množstvo údajov každú sekundu a spoločnosti používajú tieto údaje na širokú škálu aplikácií. Pri ukladaní a zdieľaní údajov bezprecedentným tempom musí existovať viac techník ochrany súkromia. 

Rozdielne súkromie je jedným z takýchto prístupov k ochrane osobných údajov a ukázalo sa, že je účinnejšie ako mnohé z našich tradičných metód. Možno ho definovať ako systém na verejné zdieľanie informácií o súbore údajov opisom vzorcov skupín v súbore údajov, pričom sa zadržiavajú informácie o jednotlivcoch v súbore údajov. 

Diferencované súkromie umožňuje výskumníkom a databázovým analytikom získať cenné informácie z databáz bez toho, aby prezradili osobné identifikačné informácie o jednotlivcoch. Je to dôležité, pretože mnohé databázy obsahujú rôzne osobné informácie. 

Ďalším spôsobom, ako sa pozerať na rozdielne súkromie, je vytváranie anonymných údajov vnášaním šumu do súborov údajov. Zavedený šum pomáha chrániť súkromie a zároveň je dostatočne obmedzený, aby analytici mohli spoľahlivo využívať údaje. 

Môžete mať dve takmer identické množiny údajov. Jeden s vašimi osobnými údajmi a jeden bez nich. Pomocou rozdielneho súkromia môžete zabezpečiť, že pravdepodobnosť, že štatistický dotaz prinesie daný výsledok, bude rovnaká bez ohľadu na to, v ktorej databáze sa vykoná.

Ako funguje rozdielové súkromie? 

Rozdielne súkromie funguje tak, že sa do súboru údajov zavedie parameter straty súkromia alebo rozpočtu na súkromie, ktorý sa často označuje ako epsilon (ε). Tieto parametre určujú, koľko šumu alebo náhodnosti sa pridá do množiny nespracovaných údajov. 

Predstavte si napríklad, že máte v množine údajov stĺpec s odpoveďami „Áno“/„Nie“ od jednotlivcov. 

Teraz predpokladajme, že hodíte mincou za každého jednotlivca: 

  • hlavy: odpoveď je ponechaná tak, ako je.
  • Chvosty: otočíte druhýkrát a zaznamenáte odpoveď ako „Áno“, ak ide o hlavu, a „Nie“, ak ide o chvost, bez ohľadu na skutočnú odpoveď. 

Použitím tohto procesu pridáte náhodnosť k údajom. Vďaka veľkému množstvu údajov a informáciám z mechanizmu pridávania šumu zostane súbor údajov presný z hľadiska súhrnných meraní. Súkromie prichádza tým, že umožňuje každému jednotlivcovi vierohodne poprieť svoju skutočnú odpoveď vďaka procesu randomizácie. 

Aj keď ide o zjednodušený príklad rozdielneho súkromia, poskytuje základnú úroveň porozumenia. V aplikáciách v reálnom svete sú algoritmy zložitejšie. 

Je tiež dôležité poznamenať, že rozdielne súkromie môže byť implementované lokálne, kde sa šum pridáva k jednotlivým údajom predtým, ako sa centralizuje v databáze, alebo globálne, kde sa šum pridáva k nespracovaným údajom po ich zhromaždení od jednotlivcov. 

Príklady diferenciálneho súkromia

Rozdielne súkromie sa uplatňuje v širokej škále aplikácií, ako sú systémy odporúčaní, sociálne siete a služby založené na polohe. 

Tu je niekoľko príkladov toho, ako sa veľké spoločnosti spoliehajú na rozdielne súkromie: 

  • jablko používa túto metódu na zhromažďovanie anonymných informácií o používaní zo zariadení, ako sú iPhone a Mac.

  • facebook využíva rozdielne súkromie na zhromažďovanie údajov o správaní, ktoré možno použiť na cielené reklamné kampane.

  • Amazonka spolieha na techniku ​​na získanie prehľadu o personalizovaných nákupných preferenciách a zároveň skrýva citlivé informácie. 

Spoločnosť Apple bola obzvlášť transparentná, pokiaľ ide o používanie rozdielneho súkromia, aby získala prehľad o používateľoch a zároveň chránila ich súkromie. 

„Apple prijal a ďalej rozvíjal techniku ​​známu v akademickom svete ako miestne rozdielne súkromie urobiť niečo skutočne vzrušujúce: získať prehľad o tom, čo mnohí používatelia Apple robia, a zároveň pomôcť zachovať súkromie jednotlivých používateľov. Je to technika, ktorá umožňuje spoločnosti Apple dozvedieť sa o komunite používateľov bez toho, aby sa dozvedela o jednotlivcoch v komunite. Diferenciálne súkromie transformuje informácie zdieľané so spoločnosťou Apple predtým, ako vôbec opustia zariadenie používateľa, takže spoločnosť Apple nikdy nemôže reprodukovať skutočné údaje.

 - Prehľad diferenciálnej ochrany osobných údajov spoločnosti Apple 

Aplikácie diferenciálneho súkromia

Keďže žijeme v tejto dobe veľkých dát, existuje veľa porušení dát, ktoré ohrozujú vlády, organizácie a spoločnosti. Dnešné aplikácie strojového učenia sa zároveň spoliehajú na techniky učenia, ktoré si vyžadujú veľké množstvo tréningových dát, ktoré často pochádzajú od jednotlivcov. Výskumné inštitúcie tiež používajú a zdieľajú údaje s dôvernými informáciami. Nesprávne zverejnenie týchto údajov akýmkoľvek spôsobom môže spôsobiť veľa problémov jednotlivcovi aj organizácii a v závažných prípadoch môže viesť k občianskoprávnej zodpovednosti. 

Formálne modely ochrany osobných údajov, ako je rozdielna ochrana osobných údajov, riešia všetky tieto problémy. Používajú sa na ochranu osobných údajov, polohy v reálnom čase a podobne. 

Použitím rozdielneho súkromia môžu spoločnosti získať prístup k veľkému množstvu citlivých údajov na účely výskumu alebo podnikania bez toho, aby došlo k ohrozeniu údajov. Výskumné inštitúcie môžu tiež vyvinúť špecifické odlišné technológie ochrany osobných údajov na automatizáciu procesov ochrany osobných údajov v komunitách zdieľajúcich cloud, ktoré sú čoraz populárnejšie. 

Prečo používať rozdielne súkromie? 

Diferenciálne súkromie ponúka niekoľko hlavných vlastností, ktoré z neho robia vynikajúci rámec na analýzu súkromných údajov pri súčasnom zabezpečení súkromia: 

  • Kvantifikácia straty súkromia: Diferenciálne mechanizmy a algoritmy na ochranu súkromia môžu merať stratu súkromia, čo umožňuje porovnávanie s inými technikami.

  • zloženie: Keďže môžete kvantifikovať stratu súkromia, môžete ju tiež analyzovať a kontrolovať pomocou viacerých výpočtov, čo umožňuje vývoj rôznych algoritmov.

  • Ochrana osobných údajov skupiny: Okrem individuálnej úrovne vám diferenciálne súkromie umožňuje analyzovať a kontrolovať stratu súkromia medzi väčšími skupinami.

  • Bezpečné pri dodatočnom spracovaní: Rozdielne súkromie nemôže byť poškodené následným spracovaním. Napríklad dátový analytik nemôže vypočítať funkciu výstupu diferenciálneho súkromného algoritmu a zmeniť ho na menej diferenciálne súkromný. 

Výhody diferenciálneho súkromia

Ako sme už spomenuli, rozdielne súkromie je lepšie ako mnohé tradičné techniky ochrany osobných údajov. Ak sú napríklad všetky dostupné informácie identifikované, rozdielna ochrana súkromia uľahčuje identifikáciu všetkých prvkov údajov. Je tiež odolný voči útokom na súkromie na základe pomocných informácií, čím zabraňuje útokom, ktoré je možné vykonať na neidentifikovateľných údajoch. 

Jednou z najväčších výhod rozdielneho súkromia je jeho zloženie, čo znamená, že môžete vypočítať stratu súkromia pri vykonávaní dvoch rozdielne súkromných analýz na rovnakých údajoch. Robí sa to sčítaním jednotlivých strát na súkromí pre tieto dve analýzy. 

Zatiaľ čo rozdielne súkromie je nový nástroj a môže byť ťažké ho dosiahnuť mimo výskumných komunít, ľahko implementovateľné riešenia na ochranu údajov sú čoraz dostupnejšie. V blízkej budúcnosti by sme mali vidieť rastúci počet týchto riešení dostupných pre širšiu verejnosť. 

Alex McFarland je novinár a spisovateľ AI, ktorý skúma najnovší vývoj v oblasti umelej inteligencie. Spolupracoval s množstvom AI startupov a publikácií po celom svete.