toco O que é Privacidade Diferencial? - Unite.AI
Entre em contato

Inteligência artificial

O que é Privacidade Diferencial? 

Atualização do on

Estamos vivendo a era do big data, que tem focado ainda mais atenção no tema da privacidade de dados. Os seres humanos produzem uma quantidade incrível de dados a cada segundo, e as empresas usam esses dados para uma ampla gama de aplicações. Com o armazenamento e compartilhamento de dados em um ritmo sem precedentes, deve haver mais técnicas de proteção de privacidade. 

A privacidade diferencial é uma dessas abordagens para proteger dados pessoais e provou ser mais eficaz do que muitos de nossos métodos tradicionais. Pode ser definido como um sistema para compartilhar publicamente informações sobre um conjunto de dados, descrevendo padrões de grupos dentro do conjunto de dados, enquanto retém informações sobre os indivíduos no conjunto de dados. 

A privacidade diferencial permite que pesquisadores e analistas de banco de dados obtenham informações valiosas dos bancos de dados sem divulgar as informações de identificação pessoal dos indivíduos. Isso é crítico, pois muitos bancos de dados contêm uma variedade de informações pessoais. 

Outra maneira de ver a privacidade diferencial é que ela cria dados anônimos injetando ruído nos conjuntos de dados. O ruído introduzido ajuda a proteger a privacidade enquanto ainda é limitado o suficiente para que os analistas possam usar os dados de forma confiável. 

Você pode ter dois conjuntos de dados quase idênticos. Um com suas informações pessoais e outro sem. Com a privacidade diferencial, você pode garantir que a probabilidade de uma consulta estatística produzir um determinado resultado seja a mesma, independentemente do banco de dados em que é executada.

Como funciona a privacidade diferencial? 

A maneira como a privacidade diferencial funciona é introduzindo uma perda de privacidade ou um parâmetro de orçamento de privacidade, que geralmente é denotado como epsilon (ε), no conjunto de dados. Esses parâmetros controlam quanto ruído ou aleatoriedade é adicionado ao conjunto de dados brutos. 

Por exemplo, imagine que você tenha uma coluna no conjunto de dados com respostas “Sim”/”Não” de indivíduos. 

Agora, suponha que você jogue uma moeda para cada indivíduo: 

  • Cabeças: a resposta é deixada como está.
  • Caudas: você lança uma segunda vez, registrando a resposta como "Sim" se for cara e "Não" se for coroa, independentemente da resposta real. 

Ao usar esse processo, você adiciona aleatoriedade aos dados. Com uma grande quantidade de dados e as informações do mecanismo de adição de ruído, o conjunto de dados permanecerá preciso em termos de medições agregadas. A privacidade vem ao permitir que cada indivíduo negue de forma plausível sua resposta real, graças ao processo de randomização. 

Embora este seja um exemplo simplista de privacidade diferencial, ele fornece um nível básico de compreensão. Em aplicações do mundo real, os algoritmos são mais complexos. 

Também é importante observar que a privacidade diferencial pode ser implementada localmente, onde o ruído é adicionado aos dados individuais antes de serem centralizados no banco de dados, ou globalmente, onde o ruído é adicionado aos dados brutos após serem coletados dos indivíduos. 

Exemplos de Privacidade Diferenciada

A privacidade diferencial é aplicada em uma ampla gama de aplicativos, como sistemas de recomendação, redes sociais e serviços baseados em localização. 

Aqui estão alguns exemplos de como as grandes empresas confiam na privacidade diferencial: 

  • Apple usa o método para coletar insights de uso anônimos de dispositivos como IPhones e Macs.

  • Facebook usa privacidade diferencial para coletar dados comportamentais que podem ser usados ​​para campanhas publicitárias direcionadas.

  • Amazon depende da técnica para obter informações sobre preferências de compras personalizadas enquanto oculta informações confidenciais. 

A Apple tem sido especialmente transparente sobre o uso de privacidade diferencial para obter informações sobre os usuários, preservando sua privacidade. 

“A Apple adotou e desenvolveu ainda mais uma técnica conhecida no mundo acadêmico como privacidade diferencial local para fazer algo realmente empolgante: obter informações sobre o que muitos usuários da Apple estão fazendo e, ao mesmo tempo, ajudar a preservar a privacidade de usuários individuais. É uma técnica que permite à Apple aprender sobre a comunidade de usuários sem aprender sobre os indivíduos da comunidade. A privacidade diferencial transforma as informações compartilhadas com a Apple antes mesmo de deixar o dispositivo do usuário, de forma que a Apple nunca possa reproduzir os dados verdadeiros.”

 - Visão geral de privacidade diferencial da Apple 

Aplicações de Privacidade Diferencial

Como vivemos nesta era de big data, existem muitas violações de dados que ameaçam governos, organizações e empresas. Ao mesmo tempo, as aplicações atuais de aprendizado de máquina dependem de técnicas de aprendizado que exigem grandes quantidades de dados de treinamento, muitas vezes provenientes de indivíduos. As instituições de pesquisa também utilizam e compartilham dados com informações confidenciais. A divulgação inadequada desses dados, de qualquer forma, pode causar muitos problemas tanto para o indivíduo quanto para a organização e, em casos graves, pode levar à responsabilidade civil. 

Modelos formais de privacidade, como privacidade diferencial, abordam todos esses problemas. Eles são usados ​​para proteger informações pessoais, localização em tempo real e muito mais. 

Ao usar a privacidade diferencial, as empresas podem acessar uma grande quantidade de dados confidenciais para pesquisa ou negócios sem comprometer os dados. Instituições de pesquisa também podem desenvolver tecnologias de privacidade diferenciadas específicas para automatizar processos de privacidade em comunidades de compartilhamento em nuvem, que estão se tornando cada vez mais populares. 

Por que usar a privacidade diferencial? 

A privacidade diferencial oferece algumas propriedades principais que a tornam uma excelente estrutura para analisar dados privados e, ao mesmo tempo, garantir a privacidade: 

  • Quantificação da perda de privacidade: Mecanismos e algoritmos diferenciais de privacidade podem medir a perda de privacidade, o que permite compará-la com outras técnicas.

  • composição: Como você pode quantificar a perda de privacidade, também pode analisá-la e controlá-la em vários cálculos, permitindo o desenvolvimento de diferentes algoritmos.

  • Privacidade do grupo: Além do nível individual, a privacidade diferencial permite analisar e controlar a perda de privacidade entre grupos maiores.

  • Seguro no pós-processamento: A privacidade diferencial não pode ser prejudicada pelo pós-processamento. Por exemplo, um analista de dados não pode calcular uma função da saída de um algoritmo privado diferencial e torná-lo menos privado diferencial. 

Benefícios da Privacidade Diferencial

Como mencionamos anteriormente, a privacidade diferencial é melhor do que muitas técnicas tradicionais de privacidade. Por exemplo, se todas as informações disponíveis forem informações identificadas, a privacidade diferencial facilita a identificação de todos os elementos dos dados. Também é resistente a ataques de privacidade baseados em informações auxiliares, impedindo ataques que possam ser realizados em dados não identificados. 

Um dos maiores benefícios da privacidade diferencial é que ela é composicional, o que significa que você pode calcular a perda de privacidade ao conduzir duas análises privadas diferenciadas sobre os mesmos dados. Isso é feito somando as perdas de privacidade individuais para as duas análises. 

Embora a privacidade diferencial seja uma ferramenta nova e possa ser difícil de alcançar fora das comunidades de pesquisa, soluções fáceis de implementar para privacidade de dados estão se tornando mais acessíveis. Em um futuro próximo, devemos ver um número crescente dessas soluções disponíveis para um público mais amplo. 

Alex McFarland é um jornalista e escritor de IA que explora os mais recentes desenvolvimentos em inteligência artificial. Ele colaborou com inúmeras startups e publicações de IA em todo o mundo.