访谈

MeetKai 元宇宙的 CEO 与联合创始人詹姆斯·卡普兰 – 采访系列

发布于 2022年1月21日

更新于 2026年5月24日

作者

Antoine Tardif, Unite.AI 首席执行官兼创始人

詹姆斯·卡普兰是 MeetKai 的 CEO 与联合创始人，MeetKai 是一家位于洛杉矶的公司，专注于人工智能、虚拟现实和对话式搜索。MeetKai 正在全球范围内通过 iOS、Google Play 和 AppGallery 部署其技术，目前领先于其他公司，拥有前所未有的功能。其对话式人工智能可以理解更复杂的语言，并在自然对话中提供个性化的结果，涉及多个主题和不同的现实。

您在 6 岁时就对人工智能产生了兴趣，如何第一次接触到这项技术？

我对人工智能的介绍来自视频游戏。首先，是通过试图理解游戏《俄勒冈小道》中的人工智能工作原理 — 虽然这不是非常智能，但仍然是一种人工智能。从那里开始，我对人工智能的兴趣进一步增长，因为我开始玩大型多人在线角色扮演游戏（MMORPG）。我真的喜欢玩在线游戏，但我讨厌为物品而努力。这就是为什么我开始编写机器人程序。

您编写的第一个人工智能应用程序是什么？

为大型多人在线角色扮演游戏编写机器人程序是我第一次涉足人工智能开发。起初，我的机器人程序非常简单，更加类似于宏而不是人工智能。但是随着我年龄的增长和游戏中的机器人检测变得更加完善，这需要机器人程序更加类似于玩家。我一直喜欢编写机器人程序 — 我甚至编写了一个机器人程序来赢得泰勒·斯威夫特的比赛（她实际上来演出！）。同样，我也编写了第一个宝可梦 Go 机器人程序，遗憾的是，当我失去兴趣并停止规避检测时，很多人被禁用了。

您在 2018 年推出了 MeetKai，此前您对当前的人工智能语音助手感到沮丧。为什么大多数人工智能助手提供的体验如此平庸？

问题的核心在于，大多数人工智能助手过度依赖外部 API 来实现功能。即使他们控制了实现，例如 Alexa 的电子商务搜索，他们也会遭受同样的问题。简单来说，如何期望一个语音助手变得聪明，当它所做的只是将语音转换为文本，然后将该文本放入基于文本的搜索引擎中？我们以创建一个“跳跃式”人工智能助手为目标，通过控制整个语音助手的端到端处理管道。我们开发了一个对话式搜索引擎，而不是基于关键词的搜索引擎，以支持更复杂的查询和对话。其他助手之所以体验平庸，是因为他们无法在这些限制因素之上构建多回合对话支持。虽然我们的目标是实现这一点，但我们仍然处于技术扩展的非常早期阶段，以满足现有玩家的相同数量的领域。

在构建最先进的语音助手体验中，自然语言理解和自然语言处理面临哪些挑战？

下一代自然语言理解（NLU）面临的主要挑战之一是超越意图和实体。目前的大多数 NLU 采用传统的语言理解方法。每个输入语句都被归类为意图，然后使用序列标注模型对语句中的标记进行实体标注。我可以列举出几十个这种标准方法的问题。然而，最关键的问题是：

上下文无关的意图分类无法处理多回合对话。大多数方法只关心被转录的原始文本，而不关心上下文 — 不关心用户是谁，不关心用户喜欢什么，只关心用户刚刚问了什么。这在用户说出简短的语句时尤其重要。例如，如果有人说“cosmopolitan”，它可能指的是饮料或杂志，严重依赖于说话的人。
实体识别模型在处理非分类值时效果很差。由于新实体不在数据集中，无法快速适应，因此大型语言模型无法快速适应野外的新实体。人工智能需要更复杂的方法来识别实体，考虑到更深层次的上下文。例如，用户的位置应该大大影响某事物是否是餐厅名称还是其他东西。
实体关系没有被很好地考虑。我的最喜欢的例子是，大多数搜索引擎在处理否定时经常失败。尝试在其他语音助手上搜索没有浪漫的电影，你就会明白我的意思。

目前，大多数语音助手只是将语音转换为文本并进行谷歌搜索。MeetKai 的人工智能如何与此不同？

MeetKai 和谷歌在搜索方面的主要区别在于，我们使用更丰富的语言理解模型来搜索项目本身，而不是仅仅搜索网页。当你搜索“汤姆·克鲁斯没有动作的电影”时，谷歌正在寻找包含这些令牌的页面（汤姆·克鲁斯、电影、动作）。在 MeetKai，我们正确地理解汤姆·克鲁斯是一个演员，电影是他们正在寻找的媒体类别，而动作是他们不想要的类型。有了这个，我们可以进行更智能的搜索。

MeetKai 最近推出了其首个生活方式虚拟现实世界：MeetKai 元宇宙。您能否讨论这个应用程序的具体内容？

大多数元宇宙公司都专注于人与人之间的交互。除此之外，内容也大多是卡通式的或仅仅是 360° 视频。我们的目标是专注于一个完全不同的角度 — 人与人工智能的交互。我们正在开发一个元宇宙，其中您交互的角色都由我们的尖端对话式人工智能驱动。另外，我们正在努力进行环境的程序生成，使其看起来更加真实和沉浸式。我们元宇宙中可供探索的两个初始世界是针对两个初始用例：冥想和博物馆。在前者中，我们数字化了一个咏春专家，并首次创建了一个能够指导用户使用革命性冥想技巧进入放松状态的人工智能角色。在后者中，我们创建了一个不断增长的艺术博物馆，并提供了一个能够回答关于艺术空间的问题并提供游览的人工智能策展人。

MeetKai 元宇宙中人工智能的使用示例有哪些？

我们在三个地方使用人工智能：

为元宇宙中的每个角色提供对话能力。
通过语音指导动态创建可供用户使用的内容。这些内容的示例包括冥想课程和艺术画廊游览，我们的初始两种体验中都有这些内容。
程序化地创建 3D 空间，而不是需要手动布局。

您对语音助手的未来有什么展望？

为了拥有未来，语音助手需要演变成比基于命令的系统更复杂的东西。这意味着需要在许多特定领域拥有深厚的专业知识和能力。我认为，构建不同领域的特定语音助手将是构建全智能元助手的关键。这与我们看到的自语音助手进入该领域以来尝试“一次性做所有事情”的方法形成鲜明对比。

关于 MeetKai 或 MeetKai 元宇宙，还有您想分享的内容吗？

我们仍然处于元宇宙路线图的非常早期阶段。我们的最终目标是能够复制现实世界中的任何体验，并超越它。这意味着我们希望消除限制这些体验的成本和时间因素。元宇宙可以让我们过上更丰富的生活，而不是取代它们。我们仍然有几个技术挑战需要解决，但我们有一个明确的里程碑计划，假设硬件继续改进，我们正在与硬件合作伙伴密切合作，以确保虚拟现实领域的快速发展。除了虚拟现实之外，我们还希望能够在虚拟现实之外提供元宇宙体验。我们将在未来几个月内宣布更多关于此的信息。

感谢这次精彩的采访，我期待跟进您在元宇宙版本上的进展。希望了解更多的读者可以访问 MeetKai。

Antoine Tardif, Unite.AI 首席执行官兼创始人

安托万是一位具有远见的领导者和Unite.AI的联合创始人，他对塑造和推广人工智能和机器人技术的未来充满热情。作为一位连续创业者，他相信人工智能将对社会产生电力的影响一样的颠覆性影响，并经常被发现对颠覆性技术和通用人工智能的潜力大肆赞扬。

作为一位未来学家，他致力于探索这些创新将如何塑造我们的世界。另外，他还是Securities.io的创始人，这是一个专注于投资尖端技术的平台，这些技术正在重新定义未来并重塑整个行业。

Unite.AI

MeetKai 元宇宙的 CEO 与联合创始人詹姆斯·卡普兰 – 采访系列

发现更多