Connect with us

访谈

Mike Capps,Diveplane 联合创始人兼 CEO – 采访系列

mm

迈克尔·卡普斯博士是一位知名技术专家和Diveplane公司的CEO。在联合创立Diveplane之前,迈克在电子游戏行业中有着传奇般的职业生涯,他曾担任Epic Games的总裁,Epic Games是《堡垒之夜》和《战争与和平》等热门游戏的开发商。他的任期内,公司获得了数百个年度游戏奖项,数十个会议主题演讲,一个终身成就奖,以及在美国最高法院成功为电子游戏辩护的自由言论权。

Diveplane 提供跨多个行业的AI驱动的商业解决方案。凭借六项专利获得批准和多项待批专利,Diveplane的可理解AI提供了对AI政策和数据隐私策略的完全理解和决策透明度。

您成功地从电子游戏行业的成功职业生涯中退休,是什么启发您从退休中走出来,专注于AI?

制作游戏很有趣,但至少在那时,这不是一个理想的职业,特别是当您有一个新家庭的时候。我一直忙于董事会和顾问职位,但这并不能带来满足感。所以,我列出了三个我可能能够影响的世界性问题清单,其中包括黑盒子AI系统的普遍存在。我的计划是花一年时间研究每个问题,但几周后,我的聪明朋友Chris Hazard告诉我,他已经秘密地开发了一个透明、完全可解释的AI平台。于是,我们就到了今天。

Diveplane的使命是将人类带入AI,可以详细说明这意味着什么?

这里,我们使用“人类”来意味着“人性”或“同情心”。为了确保AI模型中包含人类的最佳品质,您不能只是训练、测试,然后希望一切都没问题。

我们需要仔细审查输入数据、模型本身和模型的输出,并确保它反映了我们人类的最佳品质。大多数使用历史或现实世界数据训练的系统第一次不太可能是正确的,而且它们不一定是无偏见的。我们相信,消除模型中的偏见(即统计错误和偏见)的唯一方法是透明度、可审计性和人类可理解的解释的结合。

Diveplane的核心技术称为REACTOR,它与传统的机器学习可解释性方法相比有什么独特之处?

机器学习通常涉及使用数据构建一个模型来做出特定类型的决策。这些决策可能包括为车辆转向轮选择的角度,是否批准或拒绝购买或将其标记为欺诈,或者向某人推荐哪个产品。如果您想了解模型如何做出决策,您通常需要问它许多类似的决策,然后尝试预测模型本身可能会做什么。机器学习技术要么在提供的见解类型上有限,要么反映模型做出决策的实际情况,要么准确率较低。

使用REACTOR则完全不同。REACTOR表征您的数据的不确定性,您的数据就成为模型。您不需要为每种决策类型构建一个模型,您只需要问REACTOR您想让它做出什么决策——它可以与数据相关的任何内容,并且REACTOR查询需要什么数据来做出特定的决策。REACTOR始终可以向您展示它使用的数据、数据与答案的关系、不确定性的每个方面、反事实推理以及您可能想要提出的任何其他问题。由于数据就是模型,您可以编辑数据,REACTOR将立即更新。它可以向您展示是否有任何异常数据用于决策,并追踪对数据和其来源的每个编辑。REACTOR使用概率理论,意味着我们可以告诉您其操作的每个部分的测量单位。最后,您可以使用仅决策所依据的数据和不确定性来重现和验证任何决策,使用相对简单的数学,而无需使用REACTOR。

REACTOR能够在保持高度竞争性准确率的同时执行所有这些操作,特别适用于小型和稀疏数据集。

GEMINAI是一款构建数据集数字孪生的产品,这具体意味着什么,以及它如何确保数据隐私?

当您将数据集输入GEMINAI时,它会对数据的统计形状有深入的了解。您可以使用它来创建一个合成的孪生体,类似于原始数据的结构,但所有记录都是新创建的。然而,统计形状是相同的。例如,原始数据集和合成数据集中的患者心率平均值将几乎相同,所有其他统计数据也将相同。因此,使用孪生体进行的任何数据分析,包括训练机器学习模型,都将给出与原始数据相同的答案。

如果有人在原始数据中有记录,在合成孪生体中就不会有他们的记录。我们不仅仅是删除名称——我们确保在信息空间中没有任何记录“接近”他们的记录(以及所有其他记录)。即,在原始集和合成集中都没有可识别的记录。

这意味着,合成数据集可以更自由地共享,而无需担心不当共享机密信息。无论是个人财务交易、患者健康信息、机密数据, 只要数据的统计信息不机密,合成孪生体就不是机密的。

为什么GEMINAI比使用差分隐私更好?

差分隐私是一组保持任何个人对统计数据影响的概率仅在一个小范围内的技术,是几乎任何数据隐私解决方案的基本组成部分。然而,当差分隐私单独使用时,需要管理数据的隐私预算,并为每个查询添加足够的噪音。一旦使用了这个预算,数据就不能再次使用而不冒着隐私风险。

一种克服这个预算的方法是将全部隐私预算一次性应用于训练一个机器学习模型来生成合成数据。这个想法是,这个使用差分隐私训练的模型可以相对安全地使用。然而,正确应用差分隐私可能很棘手,特别是当不同个体的数据量不同,存在更复杂的关系时,例如同一户口的人。并且,使用此模型生成的合成数据可能会因过于相似而包含实际数据,这可能会被个人声称为自己的数据。

GEMINAI通过在合成数据时结合多种隐私技术来解决这些问题。它使用了一种适用于广泛数据类型的差分隐私的实用形式。它建立在我们的REACTOR引擎之上,因此它还知道任何数据片段可能被混淆的概率,并合成数据以确保它始终与最相似的原始数据有足够的差异。另外,它将每个字段、每个数据片段视为潜在的敏感或识别信息,因此它对传统上不认为是敏感的字段(但可能唯一识别个体,例如24小时便利店中2点至3点之间的唯一交易)应用差分隐私的实际形式。我们经常将其称为隐私交叉切割。

GEMINAI能够实现几乎所有目的的高准确率,生成的数据看起来像原始数据,但防止任何人找到合成数据中过于相似的记录。

Diveplane在数据与信任联盟的共同创立中发挥了重要作用,这个联盟是什么?

这是一个由技术CEO组成的绝佳团体,共同开发和采用负责任的数据和AI实践。世界级的组织,如IBM、强生公司、万事达卡、UPS、沃尔玛和Diveplane。我们为能够参与早期阶段而感到自豪,也为我们在倡议方面共同取得的成就感到自豪。

Diveplane最近成功完成了A轮融资,这将对公司的未来产生什么影响?

我们很幸运能够在企业项目中取得成功,但一次性改变世界是很困难的。我们将利用这项支持来建立我们的团队,分享我们的信息,并将可理解的AI推广到尽可能多的地方!

您还想分享关于Diveplane的其他信息吗?

Diveplane致力于确保AI在普及的同时做得正确。我们致力于公平、透明和可理解的AI,主动展示驱动决策的因素,并远离AI中的“黑盒”心态,这可能是不公平的、不道德的和有偏见的。我们相信,解释性是AI的未来,我们很高兴能够在推动这一进程中发挥关键作用!

感谢这次精彩的采访,希望了解更多的读者可以访问Diveplane

安托万是一位具有远见的领导者和Unite.AI的创始合伙人,他被对塑造和推广AI和机器人人的未来充满不动摇的热情所驱动。作为一位连续创业者,他相信AI将对社会产生与电力一样的颠覆性影响,他经常被听到对颠覆性技术和AGI的潜力大加赞赏。

作为一位未来学家,他致力于探索这些创新将如何塑造我们的世界。另外,他也是Securities.io的创始人,这是一个专注于投资于重新定义未来和重塑整个行业的尖端技术的平台。