访谈
私人AI的帕特里夏·泰恩(Patricia Thaine)- 专访系列

帕特里夏·泰恩(Patricia Thaine)是私人AI(Private AI)的联合创始人和首席执行官,多伦多大学计算机科学博士候选人,并在向量研究所(Vector Institute)担任研究员,研究隐私保护的自然语言处理,重点关注应用密码学。她还研究计算方法用于失落语言的解读。
帕特里夏获得了加拿大自然科学和工程研究委员会(NSERC)研究生奖学金,皇家银行研究生奖学金,特里克西·沃斯利计算机科学研究生奖学金和安大略省研究生奖学金。她有八年的研究和软件开发经验,包括在麦吉尔语言发展实验室,多伦多大学计算语言学实验室,多伦多大学语言学系和加拿大公共卫生机构。
是什么最初吸引你学习计算机科学?
解决问题和创造力的结合。就像一门手艺。你可以看到自己的产品创意变成现实,就像木匠制作家具一样。我曾经听到有人说:编程是终极的创造工具。事实上,你构建的产品可以扩大规模并被世界各地的人使用,这是一个非常棒的附加值。
您能否讨论Private AI的创立故事及其起源,以及您观察到缺乏易于集成的隐私保护工具?
通过言语和书写,我们产生和传输了一些最敏感的信息给我们使用的公司。当我们考虑要构建哪些NLP产品时,有一层隐私保护需要集成,但这在市场上并不存在。要使用隐私保护解决方案,公司需要将用户数据传输给第三方,使用不太合适的开源解决方案,或者在内部构建解决方案,但他们几乎没有隐私保护方面的专业知识。因此,我们决定专注于为需要隐私增强技术输出易于使用的开发人员和AI团队创建最佳产品。
为什么隐私保护AI很重要?
大约80%的信息是非结构化的,AI是唯一能够理解这些数据的方式。它可以用于好的目的,例如帮助检测老年人口的跌倒,或者用于坏的目的,例如对代表性不足的群体进行个人资料和跟踪。确保我们创建的软件中内置隐私保护,使得AI更难以被用于有害的方式。
隐私如何成为竞争优势?
有很多原因,以下是几个:
- 越来越多的用户关心隐私,随着消费者变得更加了解,这种担忧正在增长:70%的消费者担心他们的数据隐私。
- 如果您拥有适当的数据保护和数据隐私协议以及技术,开展业务会更加容易。
- 当您以隐私保护的方式构建产品时,您更好地跟踪服务中的漏洞点,特别是通过数据最小化,您正在消除不需要的数据,这些数据可能会在发生网络攻击时给您带来麻烦。
您能否讨论训练数据隐私的重要性以及为什么它容易被逆向工程?
这是一个很好的问题,需要更多的教育。简而言之,机器学习模型会记住信息。模型越大,记住的边缘情况就越多。这意味着模型在训练时接触到的信息可以在生产中输出。这已在多篇研究论文中被证明,包括Secret Sharer:评估和测试神经网络中的无意记忆和从大型语言模型中提取训练数据。
还已被证明,个人信息可以从词嵌入中提取,对于那些对此持怀疑态度的人,还有一个丑闻本年,当一个韩国恋爱聊天机器人在与其他用户的聊天中写出用户详细信息时。
您对联邦学习和用户隐私有什么看法?
联邦学习是一个很好的开始,当使用案例允许时。然而,从特定用户的设备发送到云的权重更新中仍然可以提取有关用户输入的信息,因此将联邦学习与其他隐私增强技术(差分隐私和同态加密/安全多方计算)结合起来很重要。每种隐私增强技术都必须根据使用案例进行选择——没有一种技术可以解决所有问题。我们在这里概述了决策树。一个大优势是您永远不会将原始数据发送到设备外。一个大缺点是,如果您需要调试系统或查看它是否被正确训练,获取数据将变得更加困难。联邦学习是一个很好的开始,研究和行业都在努力解决未解决的问题。
Private AI如何使开发人员能够仅需几行代码即可将隐私分析集成到他们的产品中?
我们的技术以REST API的形式运行,我们的用户向其发送带有要红actable、去识别或用真实数据伪装/增强的文本的POST请求。一些客户发送需要红actable的呼叫记录,以便成为PCI合规,而其他客户发送整个聊天记录,以便稍后用于训练聊天机器人、情感分析器或其他NLP模型。我们的用户还可以选择要保留或使用的实体,甚至可以用作元数据来跟踪个人数据存储的位置。我们消除了训练一个准确的系统来检测和替换真实数据中的个人信息的痛苦。
为什么IoT设备的隐私是一个当前的问题,您对解决这个问题有什么看法?
最终,解决隐私问题的最佳方法取决于使用案例,IoT设备也不例外。虽然某些使用案例可能依赖于边缘部署、边缘推理和隐私保护的联邦学习(例如,智能城市中的众包感知),但其他使用案例可能需要依赖于数据聚合和匿名化(例如,能源使用信息)。话虽如此,IoT设备是隐私和安全必须齐头并进的典型例子。这些设备容易受到网络攻击,因此隐私增强技术只能做这么多而不能修复核心设备漏洞。另一方面,没有考虑到用户隐私的方法,来自我们家中的信息可能会被无限制地共享给未知方,使得保证信息安全变得极为困难。我们需要在两个方面改进:设备安全和用户隐私。欧盟委员会正在起草关于IoT设备安全的法案,这可能会促使设备制造商认真对待消费者安全和隐私的责任。
您是否还有其他关于Private AI的信息想要分享?
我们是一群专家,拥有隐私、自然语言、口语、图像处理、在低资源环境中部署机器学习模型的专业知识,得到了M12(微软的风险投资基金)的支持。
我们确保我们创建的产品,不仅高度准确,而且计算效率高,因此您不会在月底因云账单而感到惊讶。另外,我们的客户数据永远不会被转移到我们这里——一切都在他们自己的环境中处理。
感谢这次精彩的采访,更多信息请访问Private AI。












