Connect with us

Anderson 视角

AI 可以帮助您更快地接触到真实的人

mm
A stock-style image of a smashed domestic landline phone, where the receiver has been thrust into the main phone body. Qwen, Qwen Edit 5209, Firefly V3 et al.

新的研究表明,开源的 ChatGPT 风格的 AI 设置可以潜在地使用自然语言将呼叫者路由到呼叫中心的正确人员,无需遵循令人沮丧的菜单选择,这些选择每周都不同,似乎故意阻碍。

 

试图在呼叫中心接触到真实的人可能是一种令人沮丧的经历,因为需要以缓慢的速度导航多个选择选项 – 通常无法确定哪个选项适合您的案例。如果没有一个选项适合,经验丰富的用户往往会采用 技巧和变通方法 来获得人类顾问的访问权限,并摆脱 ‘选项地狱’。 我们中的很多人都会认识到这是一个更或 менее ‘战斗’ 和用户不友好的体验。

不出所料,呼叫中心处于 前线,即被 AI 系统增强或取代;尽管有些人建议采取 谨慎的方法,但呼叫中心 AI 自动化仍然是 低垂的果实,成为科技头条和 AI 基础创新早期 ROI 的前景。

封闭的商店

但有一些领域,开源原则和免费可用的数据很少被应用或可用,这是其中之一。这是有道理的:任何有兴趣自动化其客户响应系统的公司都将对分享其数据、方法或企业知识产权的兴趣有限或为零。

一方面,分享这些资源将使他们在竞争中失去优势;更重要的是,考虑到 AI 在循环中的系统容易 泄露 特权信息,这在法律上是有风险的。

这导致了一些投资雄厚的玩家独立地开发 AI 辅助的呼叫中心响应系统;以及许多 B2B 初创公司和成熟玩家 尽力满足日益增长的对 AI 驱动的客户响应能力的需求。

PolyAI 语音助手为虚构公司 'Augusta Lawn Care' 打开客户服务呼叫,利用大量训练对话来自动化响应,通过现有的呼叫中心基础设施。来源:收集于 https://www.unite.ai/best-ai-phone-platforms/

PolyAI 语音助手为虚构公司 ‘Augusta Lawn Care’ 打开客户服务呼叫,利用大量训练对话来自动化响应,通过现有的呼叫中心基础设施。 来源

此外,消除导航呼叫中心迷宫的挫败感已经证明是研究工作的催化剂 – 尽管大多数此类出版物往往发生在 Arxiv 和其他开源研究出版网络之外,符合 IVR 开发的通常保密性质。

相反,关于 AI 自动化客户响应系统的研究、数据和商业智能都被严密保护,几乎没有开源选项可用 – 即使使用 FOSS 系统和数据提供了一个合法的选择,也是值得怀疑的。

本地呼叫

考虑到这一点,看到一篇新的论文从哥伦比亚尝试将 IVR 从其企业金库中解放出来,至少有一点令人耳目一新。 新工作,一个简洁的标题为 Beyond IVR Touch-Tones: Customer Intent Routing using LLMs,来自 Bogotá 的 Universidad Distrital Francisco José de Caldas 的一名研究人员,声称这是第一个使用大型语言模型 (LLMs) 生成工作方案的非闭源项目,用于客户意图路由 (CIR) 系统。

与其尝试获取真实的呼叫数据或专有菜单树,不如从头开始使用三个 AI 模型:一个用于发明现实的呼叫中心菜单;另一个用于模拟数百个呼叫者投诉;第三个用于模拟聊天机器人,尝试将投诉路由到正确的目的地。

结果是一个完全合成但令人信服的测试床,包含一个虚构的电信公司,以及 920 个不同的用户查询,允许实验绕过法律风险,同时探索当前 AI 如何解释模糊、凌乱的语音,并将呼叫者连接到正确的人。

测试表明,该方案的系统可以将自由形式的呼叫者投诉与正确的呼叫中心目的地匹配,准确率最高可达 89.13%,特别是当给出 ‘扁平化’ 的菜单选项而不是冗长的描述时(稍后会详细介绍)。

该研究还发现,当呼叫者使用更随意或更变幻的语言时,AI 更容易出错;但有些错误发生的原因不是因为 AI 没有理解,而是因为电话菜单本身令人困惑。

新项目的一部分共享的客户交互示例。[来源] https://figshare.com/articles/dataset/Beyond_IVR_Touch-Tones_Customer_Intent_Routing_using_LLMs/30118690

新项目的一部分共享的客户交互示例。 来源

该项目的数据已 公开提供

方法

三部分方法的第一个模型创建了一个详细的电话菜单,用于虚构的电信公司;第二个生成了独特的呼叫者消息 – 一些简单的,其他的重新措辞或更随意 – 以模拟人们在呼叫寻求帮助时实际说话的方式。关于这一点,项目一开始生成了 920 个示例。

第三个模型的任务是将每个呼叫者连接到正确的部门,仅基于消息和菜单的版本。这一方案允许实验完全可重复,同时避免了对真实呼叫数据或暴露客户信息的需求:

三部分方法中选择的三个系统。[来源] https://arxiv.org/pdf/2510.21715

三部分方法中选择的三个系统。 来源


机器学习作家,人类图像合成领域专家。曾任 Metaphysic.ai 研究内容负责人。
个人网站: martinanderson.ai
联系: [email protected]
Twitter:@manders_ai