访谈
Ivan Crewkov CEO & Co-Founder of Buddy AI – Interview Series

Ivan Crewkov 是 Buddy AI 的 CEO 和联合创始人,Buddy AI 是世界上第一个针对儿童的对话式 AI 教练,旨在确保所有学生都能获得 1:1 英语辅导。搬到美国后,Ivan 的幼儿女儿难以学习英语,这激发了他创造 Buddy 的灵感,Buddy 是一个孩子们可以通过生成式 AI 与之对话的虚拟角色。
自 2020 年推出以来,Buddy 应用程序获得了多个奖项,并在应用商店的儿童和教育类别中排名第一,全球下载量超过 3600 万次。
2014 年,您推出了 Cubic.ai,这是最早的智能音箱和智能家居语音助手应用程序之一。您从这次经历中获得了哪些关键的收获?
我不确定我能否为推出 Cubic.ai 承担信用。我在公司成立一年后加入,并因我的贡献而获得了联合创始人的头衔。
以下是我的收获:
- 硬件很难,但有人必须去做。为硬件初创公司获得风险投资非常困难。唯一使事情变得稍微容易的事情是众筹。
- 语音优先产品的领域非常广泛和多样化。适用于智能家居的方法不适用于早期学习,从技术到用户体验设计。
您能否分享 Buddy 的起源故事,以及它如何源自您家从西伯利亚搬到美国?
带着 Cubic.ai,我于 2014 年从西伯利亚搬到美国,并带来了我的家人。我的大女儿 Sofia 开始在加利福尼亚州山景城的一所幼儿园学习英语,年龄才 4 岁。Sofia 在幼儿园的前 3-5 个月里很难开始说英语。我们很担心,因为她不能和大多数同学交朋友和一起玩,因为语言障碍。我们开始寻找方法帮助她学习说话。
很明显,针对儿童的语言应用程序不教孩子们说话(并且随着时间的推移,一切都保持不变),而像 Duolingo 这样的针对成人的语言应用程序不适用于儿童,因为用户体验不佳。所以,我们开始在连接孩子与视频会议直播教师的平台上上课。例如,Cambly、VipKid、Novakid、GoStudent 等。随着我观察 Sofia 与直播教师在线学习,我看到了 1:1 关注和主动说话练习的好处,但也看到了这些程序的一般缺点。
例如,随着在线辅导平台和在线学校的扩张,他们不得不雇用没有教学儿童背景、技能或甚至适当的英语水平的人。因此,为了确保一定的教育质量,在线平台和学校严格编写课程和教学计划,教师必须使用预先录制的练习,包括音频和视频片段。因此,不幸的是,在许多平台上,导师基本上像机器人一样工作。
尽管如此,网络辅导仍然是大多数人学习英语的唯一方式,尤其是在非英语国家。但部分是由于教师短缺,它对大多数家庭来说太昂贵了。与直播教师学习是少数家庭可以负担得起的高级教育服务。
我的联合创始人和我意识到,AI 辅导是提供 1:1 英语口语辅导给全球每个孩子的唯一可扩展方式。很快,我们了解到这也是从教育角度来看最好的方式。当我们考虑 Buddy 的早期原型时,我们受到教育领域中虚拟人类研究的启发。
学术研究表明,具有教育意义的动画代理具有教育优势和传统学习工具和环境的优越性。例如,参见 面对面交互与教育代理,二十年后,一篇 2016 年的文章,概述了该领域并引用了许多相关材料。以下是其中一段话:
“特别是,元分析发现,代理可以增强学习,与不具有代理的学习环境相比。 […] 也许最有趣的发现是,正式教育中,教育代理似乎对年幼的学习者比对年长的学习者更有效。 […] 研究发现,例如,与教育代理交互的学生表现出更强的学习成果,当 1) 教育代理说话而不是通过文本进行交流,2) 教育代理使用类似人类的手势,3) 教育代理以对话方式而不是正式方式进行交流,4) 教育代理使用礼貌的而不是直接的措辞。”
这加强了我们对多模态 AI 辅导方法的信心。我们决定 Buddy 将是一个多模态 AI 辅导员 – 一个能够进行语音识别和自然语言处理的动画教育代理。从本质上讲,AI 辅导系统由三个主要技术组成:
- 自动语音识别(ASR)和分析,使我们能够处理和分析学生的语音。
- 自然语言处理(NLP),自然语言理解和对话管理,处理学生语音的内容并产生下一个响应。响应包括口头和非口头组件。
- 具身动画虚拟角色,提供听觉反馈并回放系统的响应。角色是程序动画的 – 系统从 NLP 响应中创建动画。
这三个组件对于我们的方法至关重要,因为只有结合起来,它们才使我们能够建立一个吸引人、交互式的辅导员并提供成功的教育体验。
我的女儿 Sofia 和我的联合创始人的儿子 Arseny 成为了 Buddy 的第一个用户。Sofia 使用了 Buddy 的早期版本,直到一年级。
几年后,我的小女儿 Alisa 在三岁时开始使用 Buddy,当时她进入了幼儿园。现在,她在过渡幼儿园,每天几乎都在和 Buddy 玩。当 Alisa 开始学习时,她有几个语音问题,所以 Buddy 大多数时候都无法理解她。但是在几周的练习后,不仅她的英语,而且她的语音也提高了,因为她尽力让 Buddy 理解她。
为什么传统的第二语言教学方法如此无效?
今天,我们专注于解决与语音相关的特定教育问题:
- 大多数传统教育工具专注于教授其他语言技能,如阅读或写作。
- 儿童语言应用程序不教授口语技能。
- 一些成人语言应用程序提供使用 AI 进行口语练习,但这些服务不适用于儿童,因为用户体验、安全问题和隐私法规的限制。
- 直播导师对大多数家庭来说太昂贵了。不幸的是,许多导师没有教学培训或英语水平。
Buddy 是一个多模态 AI 辅导员。
- 它优于传统学习应用程序,因为它在很多方面像一个直播教师。让我引用我们的顾问之一,亚历克斯·德萨特尼克博士,伦敦大学学院博士:
“基于语音的虚拟导师。这个概念听起来很简单,但背后有科学依据。从学习心理学的角度来看,虚拟的说话角色是教师的体现。这种方法产生了一个叫做认知信任的效果,增强了学生的动力和参与度,并提高了学习成果。”
- Buddy 在某些方面甚至优于人类教师。Buddy 不会评判,这使得一些孩子更容易开始与 Buddy 交谈,而不是与教师交谈。这就是为什么今天,许多导师使用 Buddy 作为破冰工具,帮助孩子们克服恐惧和不适感,开始说语言。
Buddy 旨在帮助教师,而不是取代他们。
我认为这很重要。Buddy 可以帮助教师自动化他们工作中枯燥的部分 – 提供定期练习。我们希望赋予学校教师权力。Buddy 就像一队导师和教师助理,为每个孩子在课堂上进行个别辅导,并向课堂教师报告。
您能否讨论一下 Buddy 如何使用游戏化元素让孩子们对学习保持兴趣?
趣事:Buddy 的移动应用程序在 2023 年被下载了 2200 万次,其中超过 70% 的下载来自孩子。对于孩子们来说,我们的应用程序是一个游戏,他们在其中与 Buddy 玩,Buddy 是他们的谈话虚拟朋友和一个流行的 YouTuber。孩子们下载应用程序,并说服父母为订阅付费,解释说 Buddy 是一名教师。
为了使这种方法有效,我们正在设计 Buddy 成为一个带有故事和宇宙的游戏。我们与好莱坞角色设计师和作家合作,创造 Buddy 和他的故事。我们有一支非常强大的游戏设计团队,与我们的教育工作者密切合作,将课程和练习转化为 Buddy 世界中的迷你游戏。
Buddy 在教学第二语言方面还有哪些其他核心功能使其如此强大?
我们的核心功能真正专注于 Buddy 作为多模态 AI 辅导员:
- 语音识别
- 对话式 AI
- 角色视觉行为
Buddy 使用哪些机器学习算法?
我们正在开发整个技术栈,共同努力以实现我们的多模态 AI 辅导方法。
- BSR(Buddy 的语音识别)是一种专有的语音识别引擎,专门用于处理口音儿童的语音,并遵守 COPPA 等法规。
- BLM(Buddy 的语言模型)- 面向儿童的对话式 AI 引擎。安全、快速、免费使用。它专注于特定的教育功能,并且比大型语言模型更不通用。
- BABE(Buddy 的角色行为引擎)。该技术根据对话的上下文生成我们的角色视觉行为。Buddy 理解何时需要微笑、改变颜色或戴上一个傻帽子。
许多语音识别系统在处理口音时,尤其是对于年幼的儿童,存在困难。Buddy 如何克服这些挑战?
通过开发我们的专有语音识别技术 BSR。
我们的独特受众和市场需要开发专有技术。Buddy 必须能够识别年幼的英语作为外语学习者(EFL)具有强烈口音的语音。另一个复杂因素是,初学者从学习单独的、通常很短的单词开始,这些单词在没有上下文的情况下很难识别。最后,儿童市场受到高度监管,语音识别受《儿童在线隐私保护法》(COPPA)的约束,因为语音录音被视为 个人可识别信息(PII)。
BSR 处理具有不同口音的儿童语音,这些语音是在各种移动设备上使用不同质量的麦克风产生的,并且在各种现实生活环境中伴随着各种背景噪音。并且,它在设计上符合 COPPA。
在全球范围内工作,我们成功积累了一组独特的数据集来训练我们的模型。今天,BSR 在识别和理解口音儿童语音方面优于商业现成解决方案。
您如何计划扩大市场渗透率,以针对可能不熟悉 AI 技术的父母?
Buddy 在 AI 成为热门词之前就已经取得了成功,我们的大多数用户都不是典型的早期技术采用者。我们成功解决了一个重要的教育问题,碰巧我们正在使用 AI 来实现它。
尽管如此,我们面临的一个挑战是让父母认真对待与 Buddy 学习,就像与直播导师一样 – 不要跳过课程,坚持时间表等。当前的 AI 革命似乎正在帮助我们。
我会说,我们的下一步是与教师和学校更密切地合作。我们正在与巴西的一所学校进行试点合作,并正在与十几所其他教育机构讨论合作。
您对 AI 辅导员和教育的未来有什么展望?
AI 辅导员是解决人类最大的教育问题 – 全球教师短缺的最佳和唯一可扩展的方式。我们需要大约 6900 万名新教师来满足基本的学习需求。对于需要 1:1 辅导的科目,如语言学习,问题更加严重。
AI 革命加速了 AI 辅导员的开发,尽管主要是在成人领域使用现成解决方案,而早期学习仍然严重不足。我们为成为儿童 AI 辅导员的先驱者感到自豪。
关于我们的未来,Buddy 从语言学习辅导员开始,但从长远来看,它将成为一个教孩子多个科目的 AI 辅导平台,年龄范围从 3 到 12 岁。我们已经开始推出我们的第一个非语言课程 – 美国儿童的入学准备课程。我们将 Buddy 视为孩子的学习助手,伴随孩子从 3、4 岁长大,并在多年内教授多个课程。
感谢这次精彩的采访,希望了解更多的读者可以访问 Buddy AI。












