Connect with us

Co je Diferenciální Privace?

Umělá inteligence

Co je Diferenciální Privace?

mm

Procházíme érou big data, která ještě více upozorňuje na téma ochrany osobních údajů. Lidé produkují neuvěřitelné množství dat každou sekundu a společnosti tato data využívají pro širokou škálu aplikací. S ukládáním a sdílením dat v bezprecedentním tempu je nutné mít více technik ochrany soukromí. 

Diferenciální privace je jeden z přístupů k ochraně osobních údajů a prokázala se jako účinnější než mnoho našich tradičních metod. Můžeme ji definovat jako systém pro sdílení informací o datové sadě popisující vzorce skupin uvnitř datové sady, zatímco informace o jednotlivých osobách v datové sadě jsou skryty. 

Diferenciální privace umožňuje výzkumníkům a analytikům databází získat cenné informace z databází, aniž by odhalili osobní identifikační informace o jednotlivých osobách. To je kritické, protože mnoho databází obsahuje různé osobní informace. 

Jiným způsobem pohledu na diferenciální privaci je, že vytváří anonymní data injekcí šumu do datových sad. Zaváděný šum pomáhá chránit soukromí, zatímco je dostatečně omezený, aby analytici mohli data spolehlivě použít. 

Můžete mít dvě téměř identické datové sady. Jednu s vašimi osobními údaji a jednu bez nich. S diferenciální privací můžete zajistit, že pravděpodobnost, že statistické dotazy budou produkovat určitý výsledek, je stejná, bez ohledu na to, na které databázi jsou prováděny.

Jak funguje diferenciální privace? 

Diferenciální privace funguje tak, že zavádí parametr ztráty soukromí nebo rozpočtu soukromí, který je často označován jako epsilon (ε), do datové sady. Tyto parametry kontrolují, kolik šumu nebo náhodnosti je přidáno do surové datové sady. 

Například si představte, že máte sloupec v datové sadě s odpověďmi „Ano“/„Ne“ od jednotlivých osob. 

Teď předpokládejme, že jste hodili mincí pro každou osobu: 

  • Hlava: odpověď zůstává stejná.
  • Orel: hodíte druhou mincí, zaznamenáváte odpověď jako „Ano“, pokud je hlava, a „Ne“, pokud je orel, bez ohledu na skutečnou odpověď. 

Pomocí tohoto procesu přidáváte náhodnost do dat. S velkým množstvím dat a informacemi z mechanismu přidávání šumu zůstane datová sada přesná z hlediska agregovaných měření. Soukromí přichází tím, že umožňuje každému jednotlivci popřít svou skutečnou odpověď díky randomizačnímu procesu. 

Ačkoli je to jednoduchý příklad diferenciální privace, poskytuje základní úroveň porozumění. Ve skutečných aplikacích jsou algoritmy složitější. 

Je také důležité poznamenat, že diferenciální privace může být implementována místně, kde je šum přidán do individuálních dat předtím, než jsou centralizována v databázi, nebo globálně, kde je šum přidán do surových dat po jejich sběru od jednotlivých osob. 

Příklady diferenciální privace

Diferenciální privace se aplikuje v širokém spektru aplikací, jako jsou systémy doporučení, sociální sítě a služby založené na lokalitě. 

Zde jsou einige příklady toho, jak velké společnosti využívají diferenciální privaci: 

  • Apple používá tuto metodu pro sběr anonymních přehledů o použití z zařízení, jako jsou iPhone a Mac.

  • Facebook používá diferenciální privaci pro sběr behaviorálních dat, která lze použít pro cílené reklamní kampaně.

  • Amazon spoléhá na tuto techniku pro získání přehledů o personalizovaných nákupních preferencích, zatímco skrývá citlivé informace. 

Apple byl especialmente transparentní ohledně svého využití diferenciální privace pro získání přehledů o uživatelích, zatímco zachovává jejich soukromí. 

“Apple přijal a dále rozvinul techniku známou v akademickém světě jako lokální diferenciální privace, aby udělal něco opravdu vzrušujícího: získat přehled o tom, co dělají mnozí uživatelé Apple, zatímco pomáhá zachovat soukromí jednotlivých uživatelů. Jedná se o techniku, která umožňuje Apple naučit se o uživatelské komunitě, aniž by se učil o jednotlivých osobách v komunitě. Diferenciální privace transformuje informace sdílené s Apple předtím, než opustí zařízení uživatele, takovým způsobem, že Apple nemůže nikdy reprodukovat skutečná data.”

 – Přehled diferenciální privace Apple 

Aplikace diferenciální privace

Jelikož žijeme v éře big data, existuje mnoho úniků dat, které ohrožují vlády, organizace a společnosti. Současně dnešní aplikace strojového učení vyžadují techniky učení, které potřebují velké množství trénovacích dat, často pocházejících od jednotlivých osob. Výzkumné instituce také používají a sdílejí data s důvěrnými informacemi. Nesprávné zveřejnění těchto dat jakýmkoli způsobem může způsobit mnoho problémů pro jednotlivce i organizaci a v závažných případech může vést k občanské odpovědnosti. 

Formální modely ochrany soukromí, jako je diferenciální privace, řeší všechny tyto problémy. Používají se k ochraně osobních informací, reálné polohy a dalšího. 

Pomocí diferenciální privace mohou společnosti získat přístup k velkému množství citlivých dat pro výzkum nebo obchodní účely, aniž by ohrozily data. Výzkumné instituce mohou také vyvinout specifické technologie diferenciální privace pro automatizaci procesů ochrany soukromí v cloudových sdílených komunitách, které se stávají stále populárnějšími. 

Proč používat diferenciální privaci? 

Diferenciální privace nabízí několik hlavních vlastností, které z ní činí vynikající rámec pro analýzu soukromých dat, zatímco zajišťuje ochranu soukromí: 

  • Quantifikace ztráty soukromí: Mechanismy a algoritmy diferenciální privace mohou měřit ztrátu soukromí, což umožňuje srovnání s jinými technikami.

  • Kompozice: Pоскольку můžete kvantifikovat ztrátu soukromí, můžete ji také analyzovat a kontrolovat přes více výpočtů, což umožňuje vývoj různých algoritmů.

  • Skupinová ochrana soukromí: Kromě individuální úrovně diferenciální privace umožňuje analyzovat a kontrolovat ztrátu soukromí ve větších skupinách.

  • Zabezpečení při post-processingu: Diferenciální privace nemůže být poškozena post-processingem. Například analytik dat nemůže vypočítat funkci výstupu algoritmu diferenciální privace a učinit ho méně diferenciálně soukromým. 

Výhody diferenciální privace

Jak jsme již zmínili, diferenciální privace je lepší než mnoho tradičních technik ochrany soukromí. Například, pokud je všechny dostupné informace identifikovatelné, diferenciální privace usnadňuje identifikaci všech prvků dat. Je také odolná vůči útokům na soukromí založeným na pomocných informacích, což brání útokům, které lze provést na deidentifikovaných datech. 

Jednou z největších výhod diferenciální privace je, že je kompoziční, což znamená, že můžete vypočítat ztrátu soukromí provádění dvou různých analýz nad stejnými daty. To se provádí součtem individuálních ztrát soukromí pro obě analýzy. 

Ačkoli je diferenciální privace novým nástrojem a může být obtížné ji dosáhnout mimo výzkumné komunity, snadno implementovatelná řešení pro ochranu dat se stávají stále dostupnějšími. V blízké budoucnosti bychom měli vidět rostoucí počet těchto řešení dostupných širší veřejnosti. 

Alex McFarland je AI novinář a spisovatel, který zkoumá nejnovější vývoj v oblasti umělé inteligence. Spolupracoval s mnoha AI startupy a publikacemi po celém světě.