부본 차등 프라이버시란 무엇입니까? - Unite.AI
Rescale 미팅 예약

인공 지능

차등 프라이버시란 무엇입니까? 

업데이트 on

우리는 데이터 프라이버시라는 주제에 더욱 관심이 집중되는 빅데이터 시대를 살고 있습니다. 인간은 매초 엄청난 양의 데이터를 생성하고 기업은 이 데이터를 다양한 애플리케이션에 사용합니다. 전례 없는 속도로 데이터를 저장하고 공유함에 따라 더 많은 개인 정보 보호 기술이 있어야 합니다. 

차등 프라이버시는 개인 데이터를 보호하기 위한 그러한 접근 방식 중 하나이며 기존의 많은 방법보다 더 효과적인 것으로 입증되었습니다. 데이터 세트의 개인에 대한 정보를 숨기면서 데이터 세트 내의 그룹 패턴을 설명하여 데이터 세트에 대한 정보를 공개적으로 공유하는 시스템으로 정의할 수 있습니다. 

차등 프라이버시를 통해 연구원과 데이터베이스 분석가는 개인에 대한 개인 식별 정보를 누설하지 않고도 데이터베이스에서 귀중한 정보를 얻을 수 있습니다. 많은 데이터베이스에 다양한 개인 정보가 포함되어 있으므로 이는 매우 중요합니다. 

차등 프라이버시를 보는 또 다른 방법은 데이터 세트에 노이즈를 주입하여 익명 데이터를 생성한다는 것입니다. 도입된 노이즈는 분석가가 데이터를 안정적으로 사용할 수 있도록 충분히 제한하면서 프라이버시를 보호하는 데 도움이 됩니다. 

두 개의 거의 동일한 데이터 세트를 가질 수 있습니다. 귀하의 개인 정보가 포함된 것과 포함되지 않은 것입니다. 차등 프라이버시를 사용하면 수행되는 데이터베이스에 관계없이 통계 쿼리가 주어진 결과를 생성할 확률이 동일하도록 보장할 수 있습니다.

차등 프라이버시는 어떻게 작동합니까? 

차등 프라이버시가 작동하는 방식은 종종 엡실론(ε)으로 표시되는 프라이버시 손실 또는 프라이버시 예산 매개변수를 데이터 세트에 도입하는 것입니다. 이러한 매개변수는 원시 데이터 세트에 추가되는 노이즈 또는 무작위성의 양을 제어합니다. 

예를 들어 개인의 "예"/"아니오" 대답이 포함된 열이 데이터 세트에 있다고 가정합니다. 

이제 모든 개인을 위해 동전을 던진다고 가정합니다. 

  • 헤드 : 대답은 그대로 두었습니다.
  • 꼬리 : 실제 답과 상관없이 앞면이면 "예"로, 뒷면이면 "아니오"로 답을 기록합니다. 

이 프로세스를 사용하여 데이터에 임의성을 추가합니다. 많은 양의 데이터와 노이즈 추가 메커니즘의 정보를 통해 데이터 세트는 집계 측정 측면에서 정확합니다. 개인 정보 보호는 무작위화 프로세스 덕분에 모든 개인이 자신의 실제 답변을 그럴듯하게 거부할 수 있도록 합니다. 

이는 차등 프라이버시의 단순한 예이지만 기본 수준의 이해를 제공합니다. 실제 응용 프로그램에서는 알고리즘이 더 복잡합니다. 

차등 프라이버시는 데이터베이스에서 중앙 집중화되기 전에 개별 데이터에 노이즈가 추가되는 로컬 방식으로 구현되거나, 개인으로부터 수집된 후 원시 데이터에 노이즈가 추가되는 글로벌 방식으로 구현될 수 있다는 점도 중요합니다. 

차등 프라이버시의 예

차등 프라이버시는 추천 시스템, 소셜 네트워크 및 위치 기반 서비스와 같은 광범위한 애플리케이션에 적용됩니다. 

다음은 대기업이 차등 프라이버시에 의존하는 방법에 대한 몇 가지 예입니다. 

  • Apple 방법을 사용하여 iPhone 및 Mac과 같은 장치에서 익명의 사용 정보를 수집합니다.

  • 페이스북 차등 프라이버시를 사용하여 대상 광고 캠페인에 사용할 수 있는 행동 데이터를 수집합니다.

  • 아마존 민감한 정보를 숨기면서 개인화된 쇼핑 선호도에 대한 통찰력을 얻는 기술에 의존합니다. 

Apple은 개인 정보를 보호하면서 사용자에 대한 통찰력을 얻기 위해 차등 개인 정보 사용에 대해 특히 투명했습니다. 

“Apple은 학계에서 다음과 같이 알려진 기술을 채택하고 더욱 발전시켰습니다. 로컬 차등 프라이버시 정말 흥미로운 일을 하기 위해: 개별 사용자의 개인 정보를 보호하면서 많은 Apple 사용자가 무엇을 하고 있는지에 대한 통찰력을 얻습니다. Apple이 커뮤니티의 개인에 대해 학습하지 않고 사용자 커뮤니티에 대해 학습할 수 있도록 하는 기술입니다. 차등 프라이버시는 Apple이 진정한 데이터를 재생산할 수 없도록 사용자의 장치를 떠나기 전에 Apple과 공유된 정보를 변환합니다.”

 - Apple의 차등 개인정보 보호 개요 

차등 프라이버시의 적용

우리는 빅데이터 시대에 살고 있기 때문에 정부, 기관, 기업을 위협하는 데이터 침해가 많이 발생하고 있습니다. 동시에 오늘날의 기계 학습 애플리케이션은 개인으로부터 수집되는 대량의 교육 데이터가 필요한 학습 기술에 의존합니다. 연구 기관에서도 기밀 정보가 포함된 데이터를 사용하고 공유합니다. 어떤 방식으로든 이 데이터를 부적절하게 공개하면 개인과 조직 모두에 많은 문제가 발생할 수 있으며, 심한 경우 민사 책임으로 이어질 수 있습니다. 

차등 프라이버시와 같은 공식적인 프라이버시 모델은 이러한 모든 문제를 해결합니다. 개인 정보, 실시간 위치 등을 보호하는 데 사용됩니다. 

차등 프라이버시를 사용함으로써 회사는 데이터를 손상시키지 않고 연구 또는 비즈니스를 위해 많은 양의 민감한 데이터에 액세스할 수 있습니다. 또한 연구 기관은 점점 인기를 얻고 있는 클라우드 공유 커뮤니티에서 개인 정보 보호 프로세스를 자동화하기 위해 특정 차등 개인 정보 보호 기술을 개발할 수 있습니다. 

차등 프라이버시를 사용하는 이유는 무엇입니까? 

차등 프라이버시는 프라이버시를 보장하면서 프라이빗 데이터를 분석하기 위한 탁월한 프레임워크가 되는 몇 가지 주요 속성을 제공합니다. 

  • 프라이버시 손실의 정량화: 차등 프라이버시 메커니즘 및 알고리즘은 프라이버시 손실을 측정할 수 있으므로 다른 기술과 비교할 수 있습니다.

  • 구성 : 개인 정보 손실을 정량화할 수 있기 때문에 여러 계산을 통해 이를 분석하고 제어할 수 있으므로 다양한 알고리즘을 개발할 수 있습니다.

  • 그룹 개인정보 보호: 개인 수준 외에도 차등 프라이버시를 통해 더 큰 그룹 간의 프라이버시 손실을 분석하고 제어할 수 있습니다.

  • 사후 처리에서 보안: 차등 프라이버시는 사후 처리로 인해 손상될 수 없습니다. 예를 들어, 데이터 분석가는 차등 비공개 알고리즘의 출력 함수를 계산하고 차등 비공개 알고리즘을 덜 설정할 수 없습니다. 

차등 프라이버시의 이점

앞에서 언급했듯이 차등 프라이버시는 많은 기존 프라이버시 기술보다 낫습니다. 예를 들어 사용 가능한 모든 정보가 식별 정보인 경우 차등 프라이버시를 통해 데이터의 모든 요소를 ​​보다 쉽게 ​​식별할 수 있습니다. 또한 보조 정보를 기반으로 한 개인 정보 공격에 저항하여 비식별 데이터에 대한 공격을 방지합니다. 

개인 정보 차등의 가장 큰 이점 중 하나는 구성적이라는 것입니다. 즉, 동일한 데이터에 대해 차등 개인 정보 분석을 두 번 수행하여 개인 정보 손실을 계산할 수 있습니다. 이것은 두 분석에 대한 개인 정보 손실을 합산하여 수행됩니다. 

개인 정보 차등 보호는 새로운 도구이며 연구 커뮤니티 외부에서 달성하기 어려울 수 있지만 데이터 개인 정보 보호를 위한 구현하기 쉬운 솔루션에 대한 접근성이 높아지고 있습니다. 가까운 장래에 우리는 더 많은 대중이 사용할 수 있는 이러한 솔루션의 수가 증가하는 것을 보게 될 것입니다. 

Alex McFarland는 인공 지능의 최신 개발을 탐구하는 AI 저널리스트이자 작가입니다. 그는 전 세계 수많은 AI 스타트업 및 출판물과 협력해 왔습니다.