人工智能
唐凌佳博士,Clinc 首席技术官和联合创始人 – 采访系列

唐凌佳博士是 Clinc 的首席技术官和联合创始人,也是密歇根大学的计算机科学教授。唐博士在构建大规模生产基础设施用于智能应用方面的研究在学术界广泛受到认可和尊重。在为微软和谷歌工作的同时,凌佳获得了弗吉尼亚大学的计算机科学博士学位。凌佳最近获得了包括 ISCA 名人堂、Facebook 研究奖和谷歌研究奖在内的多项著名奖项。
您最初是什么时候对 AI 产生了兴趣的?您是什么时候决定要创办一家 AI 公司的?
在 2000 年代中期,我正在进行有关大规模系统的研究,这些系统支持各种应用程序,我们如何设计服务器作为软件系统来更高效地运行这些应用程序。当时,我们正在从传统的 Web 应用程序转向更依赖机器学习的功能。这时,我开始关注与 AI 相关的算法,并对从根本上了解 AI 应用程序的工作原理产生了兴趣。之后,我所在的研究团队决定转型,基本上构建了自己的 AI 应用程序作为基准来研究,这就是我们发表了第一批研究论文和开发了我们的第一个产品 Sirius 的原因——一个开源的端到端语音和视觉个人助手。
作为开源软件,Sirius 允许人们自己构建对话式虚拟助手。当时,这对于普通公众来说是一种非常有限的能力,实际上只被大公司如谷歌和苹果控制。然而,我们意识到,当我们发布软件并看到它在第一周内就有数万次下载时,我们正在填补一个关键的空白。这是我们意识到这种软件有巨大市场需求的转折点。
2015 年,我们以能够为每个开发者、公司、想要构建虚拟助手的人提供专长、工具和创新能力为目标,推出了 Clinc。
Clinc 提供的对话式 AI 解决方案不依赖于关键词或脚本。您能否详细介绍这是如何实现的?在此过程中,需要克服哪些自然语言处理(NLP)挑战?
Clinc 与其他对话式 AI 平台的区别在于其底层的 AI 算法,使其具有“人类在房间”的体验,能够理解凌乱和未经脚本的语言。这使得对话式流程能够纠正和“治愈”人类对话中的错误,并能够理解复杂的对话流程——人类能够理解的对话。相比之下,语音转文本的词语匹配算法,Clinc 分析了用户输入的数十个因素,包括词语、情感、意图、语气、时间、位置和关系,并利用这些因素提供一个代表其训练的大脑中提取的知识的答案。例如,如果我问我的虚拟助手:“我在汉堡上花了多少钱?”它需要理解我正在询问金钱和支出,我正在询问关于汉堡的具体问题,汉堡是一种食物,应该与我最近在餐厅的支出相匹配。
实现这种理解水平并非易事。一般来说,我们将对话式 AI 分为两个组件:自然语言理解(NLU)和对话管理。因此,我们需要克服的挑战是如何构建一个能够准确提取关键信息并预测用户询问的系统。
我们通过上下文、自上而下的 NLU 实现了这一点,这种 NLU 被训练为直观的,以便与对话的自然流程保持一致,理解俚语和上下文。这与具有自上而下、基于规则的 NLP 方法的竞争性解决方案不同,这些方法不允许对话式“治愈”,如果客户犯了错误,竞争性解决方案会让他们从头开始,浪费时间并只会让用户感到沮丧。我们还使用众包来提取我们的语言数据,以创建一个更丰富、更多样化的数据集,可以立即用于训练 AI 模型。
您能否讨论 Clinc AI 系统中如何使用深度学习?
Clinc 采用了深度学习的混合方法,我们在一定程度上使用传统的老式模型,并在需要时利用深度学习。具体来说,我们使用深度学习来理解词语和语言,以确定对话流程。一般来说,我们的整个对话是深度学习和符号 AI 的结合。我们还没有使用深度学习进行语言生成,因为当谈到我们的客户(主要在银行业)时,有很多法规规定虚拟助手可以和不能对客户说什么。因此,仍然存在很多不确定性,关于深度学习是否能够遵循这些语言限制。
就目前而言,我不认为对话式 AI 社区完全准备好完全采用深度学习,而学术界已经完全接受了深度学习。我期待看到新模型能做什么。
对于希望将 AI 的响应定制为针对特定受众的公司,流程是什么?您能否提供一些 Clinc 当前被客户使用的例子?
我们允许客户以他们喜欢的方式构建和许可平台,或者以完全构建和训练好的聊天机器人 Finie 为基础,进行定制并将其集成到他们的应用程序或消息服务中。Finie 可以处理与余额、交易、支出历史、查找 ATM、转账等相关的事务。
我最喜欢的客户如何将 Clinc 的 AI 定制为针对特定受众的例子是土耳其最大私营银行 İşbank。2018 年,İşbank 向我们寻求开发他们的数字银行助手 Maxi。为了赋予 Maxi 独特的个性,İşbank 举办了 14 个焦点小组,以衡量银行客户在虚拟助手中想要哪些特征和技能。他们还雇佣了一位配音演员用土耳其语朗读与银行任务相关的句子。İşbank 的对话式银行团队根据人们如何表达自己的需求,提出了这些句子。在我们的建议下,该团队通过众包市场(如亚马逊 Mechanical Turk)向参与者支付报酬,以提供不同方式表达相同问题的句子,例如请求查看余额(“我的余额是多少”,“我账户里有多少钱”,“显示我的现金”)或支付账单(“支付我的账单”,“账单支付”)。
这个例子真正展示了 İşbank 致力于为客户提供数字银行助手,以帮助他们更好地管理自己的账户。凭借 Clinc,İşbank 向 750 万人推出了 Maxi,并且自推出以来,已有 550 万用户采用,平均每用户有 9.8 次交互。近几个月,随着土耳其的新冠肺炎病例增加,İşbank迅速训练 Maxi 以响应与新冠肺炎相关的查询。自 2020 年 3 月以来,Maxi 已回答了超过 120 万个客户查询,使用量增加了 62%。
您会对那些对学习 AI 感兴趣但由于这是一个男性主导的领域而犹豫是否要参与的女性说些什么?
首先,我不认为有任何理由认为 AI 是一个男性主导的领域。我认为有很多女性 AI 先驱者正在做出重大贡献。AI 与社会政策结合是一个独特的领域,具有对人们日常生活产生重大影响的潜力。这也是一个需要更多多样化见解的领域,尤其是考虑到围绕 AI 偏见的种族和性别对话。我相信,拥有一个范围广泛的 AI 开发者社区将继续对社会和政策产生不成比例的影响。
对于那些有兴趣加入 AI 领域的女性,我强烈推荐,尤其是如果你对产生影响感兴趣。AI 在这些年里经历了如此多的增长和创新,这确实是一个令人兴奋的时期,成为其中的一部分。
您是否还有其他关于 Clinc 的内容想要分享?
Clinc 目前正在取得巨大的进步。个人而言,我刚刚步入 Clinc 的首席技术官角色,我非常兴奋能够专注于如何与开发者和数据科学家合作,以扩大我们的技术的覆盖范围。展望未来,我看到对 AI 驱动应用程序的需求正在转变,以使没有数年数据科学经验和机器学习背景的人也能够使用它们。例如,你不需要拥有平面设计学位就能使用 Photoshop。我认为 AI 正在朝着这个方向发展,即没有 AI 或机器学习培训的开发者也将能够实现结果并产生高质量的应用程序。总的来说,我们想重申,我们不仅致力于最终用户,也致力于对我们的解决方案感兴趣的开发者,无论他们的水平如何。
感谢这次精彩的采访,我期待着您的进展。任何想要了解更多的人都可以访问 Clinc。












