面试
Dimitris Vassos,Omilia 首席执行官、联合创始人兼首席架构师 – 访谈系列

Dimitris Vassos 是首席执行官、联合创始人兼首席架构师 奥米莉亚是一家全球对话智能公司,为北美、加拿大和欧洲的公司和组织提供先进的自动语音识别解决方案。 Dimitris 在应用语音和人工智能技术领域拥有丰富的经验,特别是自然语言理解 (NLU)、语音识别和语音生物识别技术。
人工智能最初吸引您的是什么?
从我还是个孩子的时候起,人机界面就让我着迷。 1984 年,我拥有了第一台家用电脑。 我记得我已经对其进行了编程,以使用声音识别来控制我们的家庭照明。 当时,还没有可用的语音识别技术,所以我让它识别声音模式(即鼓掌)。
在学习期间,我了解了语音信号处理,并立即将其视为最有前途的人机界面技术。 我的使命是让机器利用自然语言理解来理解人类。
创立 Omilia 的灵感是什么?
我的第一份工作是在 IBM 的语音解决方案部门工作。 我正在开发和提供用于自动电话查询的语音交互解决方案。 很快,我意识到现有的技术和产品可以做得更好。 经过几年的挫折后,我决定把事情掌握在自己手中。 就在那时,我遇到了我的合作伙伴 Pelias,我们创立了 Omilia,其使命是重塑语音自动化行业。
Omilia Conversational AI 目前提供哪些解决方案?
Omilia 提供类人的人机通信体验和技术,帮助企业改善客户服务体验。 我们的主要解决方案有:
- 通过语音和文本渠道提供对话式 AI 自助客户服务
- 使用语音生物识别技术进行客户 ID 和身份验证
- 专注于客户服务的转录服务
Omilia 云平台 (OCP) 提供即用型微服务,使公司能够将我们最先进的功能集成到他们的客户服务流程中,同时为那些希望从我们团队的服务中受益的公司提供关键解决方案。在部署大规模对话式人工智能解决方案方面拥有超过 15 年的丰富经验。
我们在市场上的与众不同之处在于,我们的能力随着时间的推移而不断发展,凭借丰富的经验,我们处于领先地位,提供强大的解决方案,带来真正的商业价值。
您能否讨论一下全球客户使用不同语言和不同口音/发音时可能面临的一些语音识别挑战?
语言是一种由人们定义并受其国家或社区影响的交流系统。 因此,口音和发音成为任何语言的重要组成部分。 因此,为人工智能技术开发一种语言需要从一群母语人士那里收集大量口语样本,并用它来训练我们的人工智能模型。 执行此过程需要相当大的努力。 我们多元化的客户促使我们战略性地投资于建立各种语言的能力。 如今,我们的解决方案支持超过 24 种语言,我们积累的前期投资和资产非常可观。
为什么您认为语音生物识别技术很重要?
在客户服务中,呼叫者体验中最具挑战性的部分也许是身份验证——客户代表验证呼叫者身份的过程。 我们都曾致电各个联络中心,并花时间回答旨在证明我们身份的琐碎问题。 问题的一方面是,如今任何人都可以轻松发现此类个人信息,从而损害了身份验证过程的安全性。 同时,身份验证过程本身通常非常乏味、冗长,给客户体验增添了挫败感。
语音生物识别技术解决了这个问题。 虽然一个人的声纹并不是 100% 唯一且安全,但它比基于知识的信息更加准确和安全。 如果做得好,语音生物识别技术可以提供更令人满意的客户体验。 对我来说,“正确完成”的定义是为客户提供无缝服务。
在 Omilia,好的技术是看不见的技术。 这是指导我们的产品和服务的设计原则。 借助我们的 deepVB 解决方案,我们从客户说话的前几秒开始就实现了超高的准确率,而无需客户说出任何具体内容。 这是一项创新突破,解决了传统生物识别部署繁琐的注册流程和冗长的语音样本的问题。 Omilia 的语音生物识别技术可在所有语音通道上无缝运行。
语音生物识别技术是客户服务体验的重要组成部分,它使身份验证过程变得无缝,从而提高整体客户体验和商业价值。
语音生物识别技术在市场上的部署往往不佳,Omilia 如何应对这一挑战?
部署语音生物识别服务时最常见的错误是围绕技术的局限性来设计客户体验。 这是错误的。 如果客户完全按照设计的方式使用该技术,没有偏差,它会表现良好,但现实是客户有自己的目标,他们在通话中要完成的目标,技术要么可以满足这些目标,要么不是。 解决方案必须围绕客户体验进行设计,而不是相反。
目前,市场上大多数客户服务领域的生物识别技术部署尚未实现其承诺的效益。在联络中心,大多数部署依赖于落后的传统技术,而这些技术已经跟不上时代步伐。与语音自助服务一样,在 Omilia,我们始终坚持追求卓越的客户体验。因此,我们着手定义这种体验应该是什么样子,以及实现这种体验的技术应该具备哪些功能。最终成果就是我们的 deepVB 引擎,它是我们服务和解决方案的核心,它不仅利用了最新的深度学习技术,还与我们的语音识别引擎和对话管理器协同工作,能够智能地从交互情境中获取信息。我们解决了对话身份验证问题,而不仅仅是语音生物识别。
能够理解语音分析中的意图可能很棘手,Omilia 为何能够如此成功地做到这一点?
古希腊人有句俗话:“好东西是通过劳动获得的”。这对于我们在 Omilia 所做的一切都是如此,对于我们的自然语言技术来说也是如此。 15 年多以来,我们一直在精心设计、构建和完善一种独特的自然语言理解 (NLU) 方法,这不是一项单一技术,而是多种技术方法的组合,所有技术方法融合在一起以提供会话式 NLU用于客户服务。对话式 AI 公司不断寻找最佳的机器学习算法来解决 NLU 问题。然而,大多数时候,产生影响的并不是实验室中最好的算法。为我们带来的成果是利用最好的工具,加倍努力寻找现实世界问题的解决方案,而不是技术问题。
我经常提醒我们的团队我们花了多长时间才到达这里。 并发展我们拥有的技术能力。 我们之所以成功,是因为我们被要求解决公司及其客户所遇到的问题,而不是仅仅关注技术。
对话式人工智能正在成为一个竞争异常激烈的行业,您认为 Omilia 与竞争产品的区别是什么?
对话式人工智能的领域非常广泛,在不同的市场和行业中以不同的方式应用。 实际上,只有少数供应商能够提供复杂的解决方案,能够与 Omilia 活跃的领域中最先进的解决方案竞争。 Omilia 就是其中之一。
Omilia 最大的优势是声音和对话。 我们可以通过各种沟通渠道与客户进行实时、不受限制的对话,并提供超准确和一流的客户体验。 我们已经这样做了很多年,我们的经验使我们能够实现迄今为止世界上最多数量的对话式语音自助服务解决方案部署。
《Forrester New Wave》2019 年报告评估了对话式人工智能领域的客户服务发现,Omilia 最强的产品差异化在于其全渠道、语音和语音、垂直专业化(针对特定行业的预训练模型)以及安全性和身份验证,可实现无缝识别和身份验证。客户,否则这会成为客户服务的一个高摩擦点。
哪些类型的企业在使用 Omilia 产品?
Omilia 在超过 16 个国家/地区开展业务,为金融、电信、保险、医疗保健、能源、零售、公用事业、公共部门和交通运输等客户服务互动量较大的行业的跨国公司提供服务。 Omilia 能够在 96 种 ASR 语言中实现 24% 的语义准确性,并在确保防止消费者欺诈的同时大规模实现这一目标,这使得 Omilia 成为少数几家能够通过类人对话体验满足高客户服务需求的公司之一,为公司节省了数百万美元美元。
Omilia 的产品适合所有大小企业。 我们通过基于云的 OCP miniApps® 产品为中端市场客户提供服务,我们认为这对对话式 AI 领域来说是真正的颠覆。 我们为任何规模的公司提供先进的对话式语音和文本自助服务,只需单击按钮即可零编码。 现在,任何公司都可以提供最高水平的客户服务,而以前只有大型企业客户才能负担得起。
感谢您接受采访,想要了解更多信息的读者可以访问 奥米莉亚.












