访谈

沙龙·本-列维,AudioCodes 全球销售和业务发展副总裁,联系中心 – 采访系列

mm

沙龙·本-列维,AudioCodes 全球销售和业务发展副总裁,联系中心,是一位具有超过 25 年经验的资深通信技术高管,曾在销售、营销、业务发展和联系中心创新等领域工作。 在 AudioCodes 任职超过 20 年期间,他曾担任多个高级领导职务,专注于推动企业通信、客户体验解决方案和 AI 驱动的联系中心技术的增长。 在加入 AudioCodes 之前,他曾在 NICE Systems 工作,获得了宝贵的客户参与和企业软件经验。 在他的整个职业生涯中,本-列维专注于帮助组织通过云通信、自动化和对话式 AI 现代化客户互动,使他成为联系中心技术演变的知名声音。

AudioCodes 是一家专门从事企业语音、联系中心和 AI 驱动的客户体验解决方案的通信技术公司。 该公司成立于 1993 年,已经从语音网络和 VoIP 基础设施提供商演变成为智能语音通信的领导者,帮助组织跨云、混合和本地环境现代化客户和员工互动。 其产品组合包括语音 AI 平台、对话式 AI 解决方案、会话边界控制器、Microsoft Teams 语音集成、CPaaS 产品、联系中心现代化工具等。 通过诸如 VoiceAI Connect 和 Live Hub 等平台,AudioCodes 启用企业部署语音机器人、AI 代理、代理助手功能、对话式 IVR 解决方案和实时通信服务,同时与现有的电话和联系中心基础设施集成。 其技术被全球的企业和服务提供商使用,以提高客户体验、自动化工作流程和支持数字化转型计划。

您在 AudioCodes 任职超过 20 年,经历了从嵌入式系统工程到领导生产力应用的转变。 这段经历如何塑造您对在企业环境中实现可靠的语音 AI 的看法?

我从多个角度看到了企业通信,并且这段经历强化了一个核心教训:可靠性必须从系统的每一层开始构建。

在嵌入式系统上工作教会我,细节决定一切,小的技术决策会对生产环境产生巨大的影响。 延迟、音频质量、转录准确性、自然转换和每一个元素都必须以可靠性为考虑因素进行设计,因为如果任何一个元素失败,整个系统就会失败。 如果系统只在理想条件下工作,您就不能声称语音 AI 系统是有效的。

转入领导职位使这一点更加明显。 企业支持成千上万的用户,跨越复杂的基础设施,具有严格的正常运行时间要求。 如果系统在试验中表现良好,但在实际负载下性能下降,则意味着该系统并没有解决问题。

这最终是我职业生涯所教会我的:企业环境中语音 AI 的标准是信任。 而信任只有在组织可以依赖系统可靠地执行并成为其关键业务流程的一部分时才会建立。

许多组织已经尝试使用聊天机器人,但语音引入了一个不同的复杂性层次。 将文本基于 AI 转移到完全对话式语音系统的最大技术挑战是什么?

最大挑战是企业语音环境的复杂性,这些环境通常被分成单独的“岛屿”,需要在基于 SIP 的电话协议和基于 AI 的 HTTP/SSE API 之间进行调解。 这甚至涉及到人员。 很少有工程师同时了解 SIP 和 HTTP/SSE。 另外,与文本系统不同,语音需要实时处理和编排,包括在这些系统之间无缝通信时将不同协议转换。 这种增加的紧迫性和互操作性使得从技术角度提供平滑的对话式体验更加具有挑战性。 延迟、背景噪音、口音和交叉对话现在被加入到混合中。 这些变量在文本中不存在。

AudioCodes 专注于连接传统电话系统和现代 AI 平台。 您能解释一下 VoiceAI Connect 等解决方案如何将传统基础设施与先进的 AI 模型集成吗?

VoiceAI Connect 是连接传统客户联系点(电话号码、SIP 中继和联系中心电话)直接到第三方对话式 AI 平台(如 Google CX Agent Studio、Amazon Lex、Microsoft Copilot 和其他 30 多个平台)的桥梁。 它处理复杂的实时语音编排,包括语音转文本和文本转语音以及机器人框架路由,允许企业混合和匹配并轻松地使用其选择的 AI 机器人进行语音启用,而无需放弃其传统的电话设置。 传统平台通常缺乏从其媒体服务器到新的语音 AI 产品的 API 集成。 我们通过连接到其 SIP 电话接口并连接到现代 AI 接口来绕过它。

企业通常难以将语音 AI 从试验项目扩展到整个组织。 阻止语音 AI 扩展的关键架构或运营障碍是什么?

语音 AI 仍在不断演变。 企业试验一种 AI 技术时,一个更新、更好的技术就会出现。 由于 AudioCodes 不断集成到最新的语音 AI 解决方案中,因此允许企业混合和匹配并使其环境未来化。 AudioCodes 的编排允许它们尝试不同的机器人用于不同的目的,考虑到性能、成本、语言和合规性。 这增加了成功转移到生产的机会。

其他生产编排考虑因素与可扩展性、业务连续性和连接到全球各地的多个联系中心环境有关。

在实际部署中,AI 驱动的呼叫体验从终端用户的角度来看是什么样的,人类般的交互在规模上实现得如何?

我们有几个非常大的客户,他们从 2020 年和 2021 年开始与我们合作。 他们证明了人类般的交互在规模上已经很好地发挥作用。 现实生活中的用例包括客户面向的任务,如呼叫转移、预约安排和资金转移,以及面向代理的工具,如 AI 呼叫摘要、实时知识指导和实时语音翻译。

对于终端用户,AI 驱动的呼叫体验感觉无缝。 与其导航僵硬的菜单树(按 1 进行此操作,按 2 进行此操作),呼叫者可以自然地用自己的话语通过对话式 IVR(交互式语音应答)系统与之交互,这些系统可以理解意图并做出相应的反应。 这从第一时间创建了更直观和更高效的交互。

虽然该行业尚未达到完全的人类般复杂交互,但这些功能使企业更接近于实现这一目标。 通过将 AI 和自动化与人力支持相结合,企业可以提供更准确和更个性化的体验。

语音 AI 依赖于语音识别、自然语言理解和实时处理。 您认为当前面临的最大瓶颈在哪里,以及如何解决这些瓶颈?

大型企业在采用语音 AI 时面临的最大瓶颈是集成。 根据 Opus Research 的一份最近报告,只有 38% 的企业表示成本是采用语音 AI 的障碍。 然而,65% 的企业表示集成到现有系统中是障碍,60% 的企业表示集成复杂性是障碍。

CCaaS 供应商越来越多地通过阻止集成或使其在财务上不可行来提高自带机器人模型的壁垒。 旧系统通常没有更新的 API 集成。 像 AudioCodes 的 Voice AI Connect 之类的解决方案连接到现有的联系中心环境,使用标准的 SIP,并且具有与超过 30 个语音 AI 机器人框架和超过 20 个语音转文本(STT)和文本转语音(TTS)引擎的 AIP 集成,消除了手动编写这些 API 的需要。

同一份报告强调了整体性能质量(语音质量、对话流程等)是减缓采用速度的最大原因(72%)。 Voice AI Connect 允许混合和匹配机器人框架、STT 和 TTS 以优化实现,因为并非每个 AI 都适合每个用例,并且还需要对术语和语言进行变体。 此外,AI 行业正在迅速发展,需要轻松切换到新的 AI 提供商,因为技术在不断改进。

集成应该是低延迟、经济且易于部署的。 它还应该增强安全性和调试,确保业务连续性,并提供本地选项。

AudioCodes 推广了一种灵活的方法,连接多个 AI 和语音提供商。 在构建强大和未来证明的语音 AI 系统时,供应商的灵活性有多重要?

供应商的灵活性至关重要,因为企业很少在单一供应商的环境中运作,并且市场上有许多不同的 AI、语音、电话和通信解决方案。 为了创建真正的统一语音 AI 战略,组织需要将这些不同的解决方案聚集在一起,并在所有这些解决方案中确保互操作性,同时优化成本、延迟、用例性能、语言支持和术语。

灵活的方法允许企业与多个供应商集成,选择不同用例的正确技术,并适应市场的发展。

在金融或医疗保健等受监管行业中,收集和分析语音交互数据与典型的基于云的 AI 工作流程相比如何?

语音数据处理受严格的隐私和合规性要求的约束,这大大限制了基于云的 AI 工具的使用。 为此,许多受监管的组织采用本地部署,以确保敏感数据保持在受控环境中,并且永远不会离开其基础设施。

合规性标准还要求语音交互被记录和存储在特定的格式中,以便于审计,并且具有高度准确、逐字的转录,以满足审计要求。 例如,在金融领域,交易公司必须存储每次记录的呼叫和转录,正如所说的那样,以备监管审计——数据不能被修改或总结。 在医疗保健领域,处理患者呼叫的提供者必须保持录音和转录完全安全且符合 HIPAA 标准。 在所有情况下,数据通常需要在本地处理,以防止将受保护的信息暴露给外部云服务。

随着企业开始部署可以采取行动而不仅仅是响应的 AI 代理,语音接口在客户服务和内部运营中的角色如何转变?

语音接口正在从被动工具演变为主动、智能的系统,可以实时分析和采取行动。 而不是简单地记录或路由对话,AI 驱动的语音系统现在可以理解意图并立即采取行动,例如解决客户问题、触发后台流程或帮助员工解决 IT 问题。 这种转变尤其强大,因为语音通常是第一个也是最自然的联系点。

AI 代理现在可以主动联系人类主管——例如,批准为客户提供折扣。 它们还可以采取直接行动,例如将项目添加到客户的网络购物车中。 它们还可以与具有专门技能的其他机器人合作,例如分析客户共享的照片以更好地理解上下文。 每一个都代表了以前不存在的复杂性水平。

展望未来,您是否认为语音将成为企业 AI 系统的主要接口,还是将保持为更广泛的多模式体验的一部分?

让我用一个个人例子来说明我的观点。 我有两个十几岁的孩子。 他们更愿意不与人类客户服务代表互动。 然而,他们更愿意与机器人交谈,而不是与其进行文本对话。 语音已经成为人类数百万年的自然沟通方式。 它比键盘或鼠标更受欢迎,至少在心灵感应成为现实之前都是如此。

感谢这次精彩的采访,希望读者能够通过访问 AudioCodes 了解更多信息。

安托万是一位具有远见的领导者和Unite.AI的联合创始人,他对塑造和推广人工智能和机器人技术的未来充满热情。作为一位连续创业者,他相信人工智能将对社会产生电力的影响一样的颠覆性影响,并经常被发现对颠覆性技术和通用人工智能的潜力大肆赞扬。

作为一位未来学家,他致力于探索这些创新将如何塑造我们的世界。另外,他还是Securities.io的创始人,这是一个专注于投资尖端技术的平台,这些技术正在重新定义未来并重塑整个行业。