访谈

格拉迪恩实验室的Dimitri Masin,CEO兼联合创始人 – 采访系列

mm

Dimitri Masin 是格拉迪恩实验室(Gradient Labs)的CEO和联合创始人,格拉迪恩实验室是一家人工智能初创公司,专门为金融服务等监管行业打造自主的客户支持代理。 在2023年创立格拉迪恩实验室之前,马辛曾在Monzo银行担任高级领导职位,包括数据科学、金融犯罪和欺诈的副总裁,此前他曾在谷歌工作。 在他的领导下,格拉迪恩实验室迅速获得了关注,在推出五个月内就实现了100万英镑的年度经常性收入。 马辛的重点是开发将高性能与严格的监管合规性相结合的人工智能系统,使复杂的客户运营能够安全、可扩展地自动化。

是什么启发你在Monzo取得成功后创立格拉迪恩实验室?

在Monzo,我们花了几年时间致力于客户支持自动化,通常针对的是10%的效率提升。 但是2023年初,我们见证了GPT-4的发布,这是一次重大的技术突破。 突然,通过人工智能可以完全自主地自动化70-80%的重复性工作。

这种技术突破激发了我们创立格拉迪恩实验室的想法。 在我的职业生涯中,我见过两次这样的革命浪潮:移动革命(早期的职业生涯)和现在的人工智能。 当你意识到自己处于这样一个变革的中间时,这种变革将完全改变世界的运作方式,你必须抓住这一刻。 我们的团队知道——现在就是时候了。

在Monzo,你帮助公司经历了快速的增长。从那段经历中,你学到了什么最大的教训,现在你将这些教训应用于格拉迪恩实验室?

首先,平衡自主权和方向。 在Monzo,我们最初认为人们只需要自主权——这就是最能激励他们的东西。 然而,这种观点现在看来过于简单化。 我相信人们也重视指导。真正的自主权不是告诉人们“做你想做的事情”,而是提供明确的方向,同时给予他们自由来解决明确定义的问题的方式。

第二,顶级人才需要顶级薪酬。 如果你旨在招聘某个职能领域的前5%,你必须相应地支付薪酬。 否则,大型科技公司会在发现你有被低薪的顶级人才时将他们挖走。

第三,不要重新发明轮子。 在Monzo,我们尝试创建创新性的工作结构、薪酬系统和职业阶梯。 关键的收获是:不要浪费精力创新组织基础——成千上万的公司已经建立了最佳实践。 我仍然看到LinkedIn关于“取消所有职称和等级制度”的帖子——我已经多次看到这种情况,最终几乎所有公司都会恢复到传统的结构。

格拉迪恩实验室专注于监管行业,这些行业传统上具有复杂的需求。您如何构建一个可以在这种环境中有效运行的AI代理(如Otto)?

我们采取了一种非传统的方法,拒绝了快速发布和迭代的建议。 相反,我们在发布Otto之前花了14个月的时间,保持了非常高的质量标准。 我们需要创建银行和金融机构可以信任来完全自主地处理其支持的东西。

我们没有构建副驾驶——我们构建了客户支持的端到端自动化。 由于我们在金融服务领域的背景,我们有一个内部基准来评估质量,而无需依赖客户反馈。 这使我们能够在快速迭代的同时痴迷于质量。 没有活跃的客户,我们可以更大胆地迈出步伐,自由地打破和重建,最终在发布时提供更好的产品。

Otto不仅可以回答简单的问题,还可以处理复杂的工作流程。您能否详细介绍Otto如何处理典型AI代理可能会失败的多步骤或高风险任务?

我们围绕标准操作程序(SOP)的概念构建了Otto——基本上是用简单的英语编写的指导文档,详细说明如何处理特定问题,类似于你会给人类代理的内容。

两项关键的架构决策使Otto特别适合处理复杂的工作流程:

首先,我们限制了工具的暴露。 人工智能代理的常见故障模式是从太多选项中选择错误。 对于每个程序,我们只向Otto暴露一小部分相关工具。 例如,在卡片更换工作流程中,Otto可能只看到1-2个工具,而不是系统中注册的所有30个工具。 这通过减少决策空间大大提高了准确性。

第二,我们重建了典型的AI助手基础设施,以实现广泛的推理链。 与其简单地将程序扔给OpenAI或Anthropic助手,我们的架构允许在输入和输出之间进行多个处理步骤。 这使得更深入的推理和更可靠的结果成为可能。

格拉迪恩实验室提到了在客户支持中实现“超人类质量”。对您来说,“超人类质量”是什么意思,您如何在内部衡量它?

超人类质量意味着提供的客户支持质量明显优于人类能够实现的水平。 以下三个例子说明了这一点:

首先,全面知识。 人工智能代理可以处理大量信息,并对公司及其流程有详细的了解。 相比之下,人类通常只会学习信息的一个小子集,当他们不知道某些东西时,他们必须查阅知识库或将问题升级给同事。 这导致了一个令人沮丧的体验,客户被转介到不同的团队。 另一方面,人工智能代理对公司及其流程有深入的理解,可以提供一致的、端到端的答案——无需升级。

第二,非懒惰的查找——人工智能快速收集信息。 虽然人类会尝试通过在对话开始之前询问客户问题来节省时间,但人工智能会主动检查账户信息、标志、警报和错误消息。 因此,当客户模糊地说“我有X问题”时,人工智能可以立即提供解决方案,而不是问多个澄清问题。

最后,耐心和质量的一致性。 与人类不同,人类面临一定数量的回复每小时的压力,我们的AI保持一致的高质量、耐心和简洁的沟通。 它会耐心地回答问题,根据需要回答,且不会匆忙。

我们主要通过客户满意度评分来衡量这一点。 对于所有当前客户,我们的CSAT评分平均为80%-90%——通常高于他们的人类团队。

您故意避免将格拉迪恩实验室与单一的LLM提供商绑定。为什么这个选择很重要,它如何影响客户的性能和可靠性?

过去两年里,我们观察到我们最大的性能改进来自于我们能够在OpenAI或Anthropic发布更快、更好或更准确的模型时切换到下一个最佳模型。 模型敏捷性是关键因素。

这种灵活性使我们能够在管理成本的同时持续改进质量。 一些任务需要更强大的模型,而其他任务则需要较少的模型。 我们的架构使我们能够随着时间的推移适应和演变,选择每种情况下的最佳模型。

最终,我们将支持在客户基础设施上托管的私有开源LLM。 由于我们的架构,这将是一个直接的过渡,这对于可能对模型部署有特定要求的银行来说尤为重要。

格拉迪恩实验室不仅仅是在构建聊天机器人——您还旨在处理后台流程。使用人工智能自动化此类任务的最大技术或运营挑战是什么?

有两类不同的流程,每类都有其自身的挑战:

对于较简单的流程,技术基本上已经存在。 主要的挑战是集成——连接到金融机构使用的许多定制的后端系统和工具,因为大多数客户运营都涉及多个内部系统。

对于复杂的流程,仍然存在着重大的技术挑战。 这些流程通常需要人类花费6-12个月的时间来培养专业知识,例如欺诈调查或洗钱评估。 这里的挑战是知识转移——如何为人工智能代理提供相同的领域专业知识?这是每个人在这个领域都在尝试解决的一个难题。

格拉迪恩实验室如何平衡人工智能速度和效率的需求与监管行业的严格合规性要求?

这当然是一个平衡,但在对话层面上,我们的代理只是花更多时间思考。 它评估多个因素:我是否理解客户正在询问什么?我是否给出了正确的答案?客户是否显示出脆弱的迹象?客户是否想提交投诉?

这种深思熟虑的方法增加了延迟——我们的中位回复时间可能是15-20秒。 但是对于我们合作的金融机构来说,这是一个公平的交易。 15秒的回复速度仍然比人类的回复速度快得多,而质量保证对于我们合作的监管公司来说是远远更重要的。

您是否预见未来AI代理不仅被信任用于支持,还会被用于金融机构内部的更高风险的决策任务?

金融机构在当前的生成式人工智能浪潮之前已经在使用更传统的人工智能技术进行高风险决策。 我认为真正的机会在于编排——不是做出决策,而是协调整个过程。

例如,客户上传文件,人工智能代理将其路由到验证系统,收到有效性确认,然后触发相应的操作和客户通信。 这是人工智能代理擅长的编排功能。

对于最高风险的决策本身,我在近期内看不到太大的变化。 这些模型需要可解释性、偏差预防和通过模型风险委员会的批准。 大型语言模型将在这些背景下面临重大的合规挑战。

您认为在接下来的3-5年内,人工智能将如何改变银行、金融科技公司和其他监管行业的客户体验?

我看到了五种主要趋势正在改变客户体验:

首先,真正的全渠道交互。 想象一下在您的银行应用程序中开始聊天,然后无缝地切换到同一个AI代理的语音。 语音、呼叫和聊天将融合成一个单一的连续体验。

第二,自适应的UI,尽量减少应用程序内的导航。 客户将简单地表达他们的需求:“请增加我的限制”——然后通过对话立即执行该操作。

第三,更好的单位经济效益。 支持和运营是巨大的成本中心。 降低这些成本可能会使银行能够服务以前不盈利的客户,或者将节省的成本传递给用户——尤其是在欠发达地区。

第四,支持的质量将变得异常。 目前,拥有少数客户的初创公司可以提供个性化的支持,但质量通常会随着公司的增长而下降。 人工智能使得支持变得可扩展,而不仅仅是可能的。

最后,客户支持将从令人沮丧的必要性转变为真正有帮助的服务。 它将不再被视为劳动密集型的基础设施成本,而是被视为有价值的、有效的客户接触点,能够增强整体体验。

感谢这次精彩的采访,希望了解更多的读者可以访问格拉迪恩实验室

安托万是一位具有远见的领导者和Unite.AI的联合创始人,他对塑造和推广人工智能和机器人技术的未来充满热情。作为一位连续创业者,他相信人工智能将对社会产生电力的影响一样的颠覆性影响,并经常被发现对颠覆性技术和通用人工智能的潜力大肆赞扬。

作为一位未来学家,他致力于探索这些创新将如何塑造我们的世界。另外,他还是Securities.io的创始人,这是一个专注于投资尖端技术的平台,这些技术正在重新定义未来并重塑整个行业。