访谈

Patricia Thaine，Private AI 的 CEO – 采访系列

Published October 19, 2021

Updated April 28, 2026

Antoine Tardif, CEO & Founder of Unite.AI

Patricia Thaine 是 Private AI 的联合创始人和 CEO，一位多伦多大学计算机科学博士候选人，也是 Vector Institute 的研究员，研究方向为保密自然语言处理，重点关注应用密码学。她还研究计算方法来破解失传语言。
Patricia 获得了 NSERC 研究生奖学金， RBC 研究生奖学金， Beatrice “Trixie” Worsley 计算机科学研究生奖学金和安大略省研究生奖学金。她拥有八年的研究和软件开发经验，包括在麦吉尔语言发展实验室，多伦多大学计算语言学实验室，多伦多大学语言学系和加拿大公共卫生机构。
是什么最初吸引你学习计算机科学？
问题解决和创造力的结合。就像一门手艺。你可以看到自己的产品创意变为现实，就像一位木匠制作家具一样。我曾经听到有人说：编程是终极的创造工具。事实上，你构建的产品可以扩大规模，并被世界各地的人使用，这是一个非常棒的额外收获。
您能否讨论 Private AI 的起源故事，以及它如何源于您对当前缺乏易于集成的保密工具的观察？
通过言语和书写，我们产生和传输了一些最敏感的信息。当我们考虑要构建哪些 NLP 产品时，有一层我们必须集成的保密层，这层在市场上根本不存在。要使用保密解决方案，公司要么需要将用户数据转移到第三方，要么使用不太适合保护用户保密性的次级开源解决方案，要么使用非常有限的保密专业知识在内部构建解决方案。因此，我们决定专注于为需要保密技术输出轻松满足其需求的开发人员和 AI 团队创建最好的产品。
为什么保密 AI 很重要？
大约 80% 的信息是无结构的，AI 是理解这些数据的唯一方法。它可以被用于好的目的，例如帮助检测老年人群体的跌倒，也可以被用于坏的目的，例如对代表性不足的群体进行个人资料和跟踪。确保我们创建的软件中内置保密功能，使得 AI 更难以被用于有害的方式。
保密如何成为竞争优势？
有很多原因，以下是几个：

越来越多的用户关心保密问题，随着消费者变得更加受教育，这个问题变得越来越重要：70% 的消费者担心其数据的保密性。
如果您拥有适当的数据保护和数据保密协议以及技术，那么与其他企业进行业务往来会变得更加容易。
当您以保密的方式构建产品时，您可以更好地跟踪服务中的漏洞点，特别是通过数据最小化，您可以消除不必要的数据，并在发生网络攻击时避免麻烦。

您能否讨论训练数据保密的重要性以及为什么它容易被逆向工程？
这是一个很好的问题，需要更多的教育。简而言之，机器学习模型会记住信息。模型越大，记住的信息越多。这意味着模型在训练过程中接触到的信息可以在生产中被泄露。这已经在几篇研究论文中被证明，包括 秘密共享者：评估和测试神经网络中的意外记忆 和 从大型语言模型中提取训练数据。
还证明了可以从词向量中提取个人信息，对于任何怀疑这是一个真正问题的人，还有一个丑闻，当一款韩国恋爱机器人在与其他用户的聊天中写出用户详细信息时。
您对联邦学习和用户保密性的看法是什么？
联邦学习是一个很好的开始，但当用例允许时。然而，仍然可以从特定用户设备发送到云的权重更新中提取有关用户输入的信息，因此，需要将联邦学习与其他保密增强技术（差分保密和同态加密/安全多方计算）结合使用。每种保密增强技术都必须根据用例进行选择 – 没有任何一种技术可以用作锤子来解决所有问题。我们在这里概述了决策树。一个很大的好处是，您永远不会将原始数据发送到您的设备之外。一个很大的缺点是，如果您需要数据来调试系统或查看系统是否被正确训练，那么获得数据将变得更加困难。联邦学习是一个很好的开始，但仍然有很多未解决的问题，研究和行业都在努力解决这些问题。
Private AI 如何使开发人员能够仅需几行代码即可集成保密分析以确保保密性？
我们的技术以 REST API 的形式运行，我们的用户向 API 发送带有要红actable、去识别或用真实数据伪装/增强的文本的 POST 请求。一些客户通过 API 发送需要红actable 的呼叫记录以满足 PCI 合规性要求，而其他客户发送整个聊天记录，以便稍后可以使用这些信息来训练聊天机器人、情感分析器或其他 NLP 模型。我们的用户还可以选择需要保留或用作元数据来跟踪个人数据存储位置的实体。我们消除了训练一个准确的系统来检测和替换混乱数据中的个人信息的痛苦。
为什么 IoT 设备的保密性目前是一个问题，您对解决这个问题的看法是什么？
最终，解决保密问题的最佳方法是非常依赖于用例的，IoT 设备也不例外。虽然某些用例可能依赖于边缘部署、边缘推理和保密的联邦学习（例如，智能城市中的众包感知），但其他用例可能需要依赖于数据聚合和匿名化（例如，能源使用信息）。话虽如此，IoT 设备是保密和安全必须并行的典型例子。这些设备对网络攻击的安全性非常差，因此保密增强技术只能在不解决核心设备漏洞的情况下做这么多。另一方面，如果不考虑用户保密性的方法，来自我们家中的信息可以在未经检查的情况下与未知方共享，这使得保证信息的安全性变得非常困难。我们在这里有两个需要改进的方面，欧盟委员会正在起草的关于 IoT 设备安全的草案立法可能会成为促使设备制造商认真对待消费者安全和保密责任的催化剂。
您是否有其他关于 Private AI 的信息想要分享？
我们是一群保密、自然语言、口语、图像处理、低资源环境中机器学习模型部署方面的专家，得到 M12（微软的风险投资基金）的支持。
我们确保我们创建的产品不仅高度准确，而且计算效率也很高，因此您不会在月底收到一大笔云计算账单。另外，我们的客户数据永远不会被转移到我们这里 – 所有处理都在客户自己的环境中进行。
感谢这次精彩的采访，更多信息请访问 Private AI。

Unite.AI

Patricia Thaine，Private AI 的 CEO – 采访系列

You may like