存根 什么是差异隐私? - 联合人工智能
关注我们.

人工智能

什么是差异隐私? 

更新 on

我们正处于大数据时代,数据隐私问题更加受到关注。 人类每秒产生大量数据,公司将这些数据用于广泛的应用。 随着数据以前所未有的速度存储和共享,必须有更多的隐私保护技术。 

差异隐私就是保护个人数据的一种方法,事实证明它比许多传统方法更有效。 它可以被定义为一个通过描述数据集中的群体模式而公开共享数据集信息的系统,同时保留有关数据集中个体的信息。 

差异隐私使研究人员和数据库分析师能够从数据库中获取有价值的信息,而无需泄露个人的个人识别信息。 这一点至关重要,因为许多数据库包含各种个人信息。 

看待差异隐私的另一种方式是,它通过向数据集中注入噪声来创建匿名数据。 引入的噪声有助于保护隐私,同时仍然受到足够的限制,以便分析人员可以可靠地使用数据。 

您可以拥有两个几乎相同的数据集。 一份包含您的个人信息,一份不包含您的个人信息。 通过差异隐私,您可以确保统计查询产生给定结果的概率是相同的,无论在哪个数据库上执行。

差异隐私如何发挥作用? 

差分隐私的工作方式是向数据集引入隐私损失或隐私预算参数,该参数通常表示为 epsilon (ε)。 这些参数控制向原始数据集添加多少噪声或随机性。 

例如,假设数据集中有一列包含个人的“是”/“否”答案。 

现在,假设您为每个人抛一枚硬币: 

  • 头: 答案保持原样。
  • 尾巴: 你第二次翻转,如果正面则记录为“是”,如果反面则记录为“否”,无论真正的答案是什么。 

通过使用此过程,您可以为数据添加随机性。 凭借大量数据和来自噪声添加机制的信息,数据集在聚合测量方面将保持准确。 通过随机化过程,每个人都可以合理地否认他们的真实答案,从而实现隐私。 

虽然这是差异隐私的一个简单示例,但它提供了基本的理解。 在实际应用中,算法更加复杂。 

还需要注意的是,差异隐私可以在本地实施,即在集中到数据库之前将噪声添加到个人数据中,也可以在全局实施,即在从个人收集原始数据后将噪声添加到原始数据中。 

差异隐私的例子

差异隐私广泛应用于推荐系统、社交网络和基于位置的服务等应用中。 

以下是大公司如何依赖差异隐私的一些示例: 

  • Apple 使用该方法从 iPhone 和 Mac 等设备收集匿名使用情况见解。

  • Facebook 使用差异隐私来收集可用于有针对性的广告活动的行为数据。

  • Amazon 依靠该技术来深入了解个性化购物偏好,同时隐藏敏感信息。 

苹果公司在使用差异隐私来深入了解用户的同时保护他们的隐私方面一直特别透明。 

“苹果公司采用并进一步开发了一种在学术界被称为“ 本地差分隐私 做一些真正令人兴奋的事情:深入了解许多 Apple 用户在做什么,同时帮助保护个人用户的隐私。 这项技术使 Apple 能够了解用户社区,而无需了解社区中的个人。 差异隐私会在与 Apple 共享的信息离开用户设备之前对其进行转换,以便 Apple 永远无法复制真实数据。”

 – Apple 的差异隐私概述 

差分隐私的应用

由于我们生活在这个大数据时代,存在许多威胁政府、组织和公司的数据泄露事件。与此同时,当今的机器学习应用程序依赖于需要大量训练数据的学习技术,而这些数据通常来自个人。研究机构还使用和共享包含机密信息的数据。以任何方式不当披露这些数据都会给个人和组织带来许多问题,在严重的情况下,可能会导致民事责任。 

诸如差分隐私之类的正式隐私模型可以解决所有这些问题。 它们用于保护个人信息、实时位置等。 

通过使用差异隐私,公司可以访问大量敏感数据以进行研究或业务,而不会损害数据。 研究机构还可以开发特定的差分隐私技术,以自动化云共享社区中的隐私流程,这些技术正变得越来越流行。 

为什么要使用差异隐私? 

差异隐私提供了一些主要属性,使其成为分析私有数据同时确保隐私的优秀框架: 

  • 隐私损失的量化: 差分隐私机制和算法可以衡量隐私损失,这使其能够与其他技术进行比较。

  • 组成: 由于您可以量化隐私损失,因此您还可以通过多次计算来分析和控制它,从而能够开发不同的算法。

  • 团体隐私: 除了个人层面之外,差异隐私还使您能够分析和控制更大群体之间的隐私丢失。

  • 后处理安全: 后处理不会损害差异隐私。 例如,数据分析师无法计算差分私有算法的输出函数并将其降低差分私有性。 

差异隐私的好处

正如我们前面提到的,差分隐私比许多传统的隐私技术更好。 例如,如果所有可用信息都是已识别信息,则差分隐私可以更轻松地识别数据的所有元素。 它还可以抵抗基于辅助信息的隐私攻击,防止对去识别化数据进行的攻击。 

差分隐私的最大好处之一是它是组合的,这意味着您可以计算对同一数据进行两次差分隐私分析的隐私损失。 这是通过总结两次分析的个人隐私损失来完成的。 

虽然差异隐私是一种新工具,在研究界之外很难实现,但易于实施的数据隐私解决方案正变得越来越容易获得。 在不久的将来,我们应该会看到越来越多的此类解决方案可供更广泛的公众使用。 

Alex McFarland 是一位人工智能记者和作家,致力于探索人工智能的最新发展。他与全球众多人工智能初创公司和出版物合作。