访谈

以赛亚·N·格兰特,Bland联合创始人兼首席执行官 – 采访系列

mm

以赛亚·N·格兰特,Bland联合创始人兼首席执行官,是一位创业者和工程师,他的背景融合了技术执行、早期创业经验和长期的社会影响工作。在创立当前公司之前,他曾参与Z Fellows和Y Combinator,曾在Lantern工作,并创立了San Diego Chill,一家非营利组织,曾为帮助有发展障碍的儿童获得体育机会而筹集了250万美元,获得了全国认可,并继续在董事会层面参与其中。

Bland专注于为AI驱动的电话呼叫构建基础设施,使企业能够部署语音代理来处理客户支持、销售和运营工作流程。该平台旨在通过提供可编程的语音交互、实时响应和与业务系统的深度集成来替换或增强传统的呼叫中心,从而成为公司自动化与客户沟通的核心层。

您在青少年时期创立了San Diego Chill,以便为有发展障碍的儿童提供体育机会,这是在您进入Y Combinator或创立Bland之前。这种早期的经历如何影响您在创立一家语音优先的AI公司时的思维方式,这家公司现在处于企业和客户之间的位置?

我一生和工作都专注于建设。从小,我就有着把想法变为现实的渴望。一旦某个想法或对世界的看法出现在我的脑海中,我就无法忽视它。建立San Diego Chill不仅教会了我如何创建和管理一个组织,还教会了我我们的行为对他人的影响。能够通过创建一个原本不存在的组织来回报社会,是非常有意义的事情。我从Chill中学到的教训和价值观每天都伴随着我。

在2023年经历了YC之后,您为什么认为企业语音基础设施仍然存在根本性问题,需要构建一个端到端的系统,而不是在传统的IVR工具上添加LLM?

想想你上次使用银行聊天机器人。可能你等待的时间比应该等待的时间长,得到的答案没有解决你实际提出的问题,最后你还是打了电话。然后一个机器人语音引导你通过一个菜单,你不想要的选项,按0也没有任何用处。

银行花了数十亿美元使这种体验成为可能,聊天机器人在客户满意度方面排名最后,仅为29%,低于电子邮件,低于呼叫中心,人们已经抱怨呼叫中心了。

这种情况已经持续了二十年。企业一直试图让客户远离他们的员工。客户一直试图联系到一个人。双方都没有赢。

问题不在于公司不想解决这个问题。他们只是无法以良好的体验来扩大规模。每月处理一百万个呼叫的呼叫中心是一个昂贵且难以运营的系统,质量也往往不一致。

发生了什么变化的是,AI终于使得解决呼叫成为可能,而不仅仅是路由或转移呼叫。不是电话树,不是等待音乐,而是一个能够理解客户问题并解决它的代理。

但是,这只在系统从头到尾为实时语音构建时才有效。当你在传统的IVR工具上添加LLM或拼凑第三方服务时,延迟就会出现,系统的可靠性就会降低。对话就会中断。

这就是为什么我们专注于从头到尾构建基础设施。语音只有感觉到立即和自然时才有效。如果没有这种感觉,客户就会挂断电话。

Bland采取了不寻常的步骤,内部构建和托管自己的TTS、推理和转录堆栈。您在依赖第三方API时看到的权衡是什么,最终促使您拥有整个语音基础设施层?

每一层外包都会增加延迟和增加风险。

大多数语音AI平台都是转售商。他们使用第三方转录,添加第三方模型,通过第三方TTS路由,并将结果交给您。这可能在受控的演示中有效,但在呼叫量激增或链条中的某个环节出现问题时,很少能正常工作。

还有一个数据问题。基础模型提供商,如OpenAI,使用客户数据来训练模型。他们说企业许可证不同。也许它们确实不同。但这种不确定性足以让许多安全和合规团队感到不舒服。

当您自托管整个堆栈——转录、推理、TTS、编排——时,您控制每一毫秒和每个模型更新。客户数据保持在客户的生态系统内。它不会触及第三方训练管道,不会通过您无法审计的基础设施传递,也不会移动,除非客户决定这样做。

您可以为每个企业客户提供专用基础设施,因此其他公司的激增不会影响他们的性能。当出现问题时,您可以实际解决它,而不是等待供应商的供应商。

对于受监管的行业,一些客户需要在自己的VPC或本地环境中拥有整个堆栈。这只有当供应商实际拥有他们正在部署的内容时才有可能。

传统的联系中心自动化主要专注于将简单的支持呼叫转移。为什么您决定优先考虑长尾、复杂的客户交互,而不是首先优化基于体积的自动化?

传统的联系中心自动化主要专注于将简单的支持呼叫转移。为什么您优先考虑复杂的长尾交互,而不是首先优化高体积用例?

我们采取了相反的方法。如果我们可以可靠地处理最复杂和最敏感的呼叫,那么其他事情就会变得简单。目标不是构建演示,而是提供全面的呼叫解决方案。这需要低延迟、高可靠性的系统,可以处理定义真正客户对话的边缘情况。

您的代理越来越多地被集成到CRM和运营数据库中,以便在呼叫结束时解决问题。语音本地自动化如何改变企业工作流的架构,与基于聊天的副驾驶相比?

传统系统通常不相互通信。CRM、调度工具和计费平台是孤立的。没有这些系统的访问权限,语音代理只能回答一般问题,不能做更多的事情。

它无法查看账户、更新记录或预订预约。它收集信息并将其移交给他人。与此同时,人类代表花费时间处理不应该由人处理的工作:记录呼叫记录、手动安排预约、拉取报告以确定谁需要后续跟进。

深度集成使得端到端解决成为可能。没有它,您只会自动化问候,而不是整个呼叫。

最近的Soulja Boy语音克隆演示强调了对话代理如何超越内部运营,扩展到品牌面向的体验。您是否认为企业语音代理将演变成面向客户的数字代表,能够在整个销售、支持和营销渠道中持续运行?

绝对如此。我们设想一个世界,每个客户都能与他们最喜欢和最重要的企业建立个人关系。重要的是,AI不仅仅是“有趣”的东西,还能真正解决客户最复杂的问题。

实时语音引入了延迟、幻觉和身份挑战,这些在基于文本的AI部署中不存在。您在构建需要在不到一秒内响应的代理时遇到的最困难的技术约束是什么,同时还要保持对话的准确性?

延迟。这就是大多数演示失败的地方。

如果聊天机器人需要三秒钟才能响应,用户会等待。如果语音代理在您完成说话后停顿,交谈已经破裂了。响应需要在400毫秒内返回。大多数平台无法做到这一点,因为它们正在拼凑多个第三方服务,每个服务都增加了延迟。

但延迟只是部分原因。真正的客户呼叫以演示中从未捕捉到的方式混乱。人们在句子中间打断。背景噪音切入。呼叫者切换语言。请求模糊。能够在生产环境中坚持的语音AI在不失去上下文的情况下处理中断,适应对话脱离脚本,并且不会听起来像缓冲。

客户不会将语音AI与其他机器人进行比较。他们将其与与人交谈进行比较。这就是标准。

人工智能系统在交互过程中如何代表自己正变得越来越受到审查。企业在部署几乎与人类员工无法区分的对话代理时,应该如何思考透明度问题?

我们坚信对最终用户的诚实和透明。虽然一些法规是繁琐和扼杀的,但任何形式的欺骗都是不可接受的。我们与企业合作,开发基于与客户信任的基础上的无缝体验。

当企业开始处理数百万个客户交互时,什么样的运营挑战通常会首先出现,当公司从试点部署转向生产规模部署时?

在实践中,有几件事情很重要。首先是模块化提示架构。单一的提示几乎不可能调试。当一个呼叫出错时,您需要确定它发生的确切位置和原因,而不是盯着一面墙的指令,试图弄清楚哪一行代码引起了问题。

完全可观察性同样重要。呼叫后总结是不够的。您需要对代理在每次交互的每个点上正在做什么有实时的可见性。

护栏也是必不可少的,尤其是在受监管的行业。代理必须在政策范围内运行。这不是可选的。如果它不能运行,需要有一个优雅的回退。

最后,还有知识管理。代理需要访问专有数据,例如产品、政策和程序。该平台还应在实际呼叫中自动显示知识缺口,而不是在客户投诉后几周内显示。

展望未来,您是否认为企业语音代理将仍然是特定任务的工具,还是会演变成能够自主管理通过对话启动的整个业务流程的通用AI代理?

如果我只有答案!我认为语音代理将在整个业务栈中发展,但不太可能看到整个业务由语音代理运行。话虽如此,我确实相信人类将能够从AI代理那里获得瞬间、准确和更全面的服务,超过他们今天所获得的。事实上,我们相信,当这种情况发生时,将会有更多的电话呼叫。不是更少。

感谢这次精彩的采访,希望了解更多的读者可以访问Bland

安托万是一位具有远见的领导者和Unite.AI的创始合伙人,他被对塑造和推广AI和机器人人的未来充满不动摇的热情所驱动。作为一位连续创业者,他相信AI将对社会产生与电力一样的颠覆性影响,他经常被听到对颠覆性技术和AGI的潜力大加赞赏。

作为一位未来学家,他致力于探索这些创新将如何塑造我们的世界。另外,他也是Securities.io的创始人,这是一个专注于投资于重新定义未来和重塑整个行业的尖端技术的平台。