Connect with us

人工智能

Paolo Pirjanian,Embodied 的 CEO 和创始人 – 采访系列

mm

Paolo Pirjanian 是一位出生于伊朗的亚美尼亚人,青少年时期移居丹麦。从小,他就对计算机产生了浓厚的兴趣,并开始在卧室里编程。获得机器人学博士学位后,Paolo 成为了消费者机器人领域的早期领袖,他拥有 16 多年的开发和商业化尖端家庭机器人的经验。他曾在 NASA JPL 工作,并在 iRobot、Evolution Robotics 等公司领导世界级团队。2016 年,Paolo 创立了 Embodied, Inc,旨在建立社会和情感智能的数字伴侣,以改善护理和健康,并支持人们每天过上更好的生活。

是什么吸引你最初对 AI 和机器人感兴趣?

我对 AI 和机器人的迷恋可以追溯到我的童年。我被迫从一个国家搬到另一个国家,直到我们的家庭搬到丹麦。偶然发现了一台计算机,我对它产生了浓厚的兴趣,于是开始整天整夜地编程。我的父母以为我抑郁或吸毒,但事实并非如此。我只是对计算机完全着迷!

同一时期,我在电视上看了一部皮克斯的纪录片。皮克斯正在展示他们的第一部动画短片 Luxo Jr.,一部关于两个台灯在玩球的两分钟短片。我被它深深吸引,并对计算机能够在电视上生成如此可爱的角色而感到惊讶,这些角色在我心中唤起了如此多的情感。从那时起,我决定去学校学习机器人学,最后获得了博士学位。

我然后搬到美国,在 NASA 工作,开发火星探测车,这是我儿时的梦想工作。后来,我转向创业,开发 SLAM 导航技术,这项技术现在使 iRobot 的产品成为可能。

回顾过去,我意识到我的整个旅程的灵感实际上来自皮克斯的短片动画,将生命注入无生命的物体。因此,我们创建了 Embodied,以将生命注入机器人,让它们能够与人交互,专注于帮助儿童发展社交情感。

 

你是什么时候开始构思 Evolution Robotics 的概念的?

Evolution Robotics 最初由 Idealab 的 Bill Gross 于 2001 年创立,旨在成为机器人领域的微软,这是一个非常早期且过于雄心勃勃的愿景,最后失败了。我是 Evolution Robotics 的首席技术官和总经理,在其失败后,我与 Idealab 协商,将我们团队开发的一些核心技术剥离出来,开始了一家新公司。2008 年,新实体 Evolution Robotics 开始开发使用我们的核心导航技术(包括 NorthStar 和 vSLAM)的产品,这些技术是空间映射和自主导航的开创性方法,类似于我们在自动驾驶汽车中看到的,但针对低成本的消费电子产品。

我们开发了一系列用于自动清扫和拖地的产品,称为 Mint,我们于 2010 年推出了该产品。到 2011 年,我们迅速增长到 2500 万美元的销售额,并于 2012 年被 iRobot 收购,原因是我们的产品收入和导航技术 vSLAM,现在为 iRobot 的 Roomba 和 Braava 产品线提供动力。

 

在那时,你成为了 iRobot 的首席技术官。你能否讨论一下你在 iRobot 的经历以及你从中获得的经验?

作为 iRobot 的首席技术官,我能够快速将 vSLAM 集成到 Roomba 产品线中,推出了一款新型号的产品,可以系统地覆盖整个地板计划而不会错过任何一点。这有助于公司保持领先于竞争对手,如戴森,它正在推出系统清洁解决方案。vSLAM 现在是 iRobot 旗舰产品线 Roomba 和 Braava 的一个重要组成部分。

我喜欢与 iRobot 的首席执行官 Colin Angel 密切合作,帮助制定战略方向,使 Roomba 成为连接家庭生态系统的核心,Roomba 的空间意识使其在理解地板计划和成为所有连接设备之间的连接组织方面具有独特的位置。这个战略似乎在我 2015 年离开后仍然有效。

此外,我们决定专注于消费者机器人业务,以帮助 iRobot 维持其全球领导地位。这导致了国防业务的剥离和退出其他外围业务,以使公司专注于消费者业务。

此外,我们不得不重组公司,以支持软件重的战略和连接产品。这需要公司文化的转变,以采用更敏捷和迭代的方法。

我在 iRobot 学到的东西很多,但有一件事让我印象深刻,那就是团队文化的力量。保持敏捷和致力于使命可能是任何公司最重要的竞争优势,超过任何专利组合和商业秘密。如果你有一支高绩效的团队,他们感到赋权和受到明确目标的激励,他们将很难被阻止。

 

您目前是 Embodied 的创始人兼首席执行官。您能否讨论一下创立这家公司的灵感来源?

我真的很喜欢在 iRobot 的时候,当时我们正在开展很多令人兴奋的项目,并推动机器人的边界。能够将商业成功的机器人推向市场,这些机器人可以执行有用的物理任务,例如吸尘地板,这是一件令人兴奋的事情。

然而,在我脑海的深处,我知道我仍然有一个终身的梦想要实现——建立社会和情感智能的机器人伴侣,以改善护理和健康,并增强我们的日常生活。我知道我们正处于技术交互方式的转折点。因此,我决定辞去 iRobot 的职务,创立 Embodied。

当我们开始 Embodied 时,我们从一开始就重新思考和革新人类与机器的交互方式,超越简单的口头命令,实现下一代计算,并赋予新一代机器以流畅的社交交互能力。具体来说,第一个产品是专注于建立一个动画伴侣,以帮助儿童通过游戏式学习建立社交情感技能。这个伴侣将被称为 Moxie。Moxie 是一款新型的机器人,它具有理解和表达情绪的能力,具有富有情感的语音、可信的面部表情和肢体语言,利用人类心理学和神经科学来建立更深层次的联系。为此,我们汇集了一支充满热情的领导者团队,来自工程、技术、娱乐、游戏设计和儿童发展等领域。过去四年中,Embodied 不懈努力地将所有最新的技术结合起来,将 Moxie 命名为生活,并且团队很高兴终于能够将其交付给需要一个支持健康儿童发展的飞行员的家庭。

 

机器人初创公司面临的一些独特的创业挑战是什么?

做不可能的事情很有趣,但也可能有点可怕。我们知道,如果我们想革新人类与机器的交互方式,我们将不得不解决以前没有解决过的问题。其中一些问题包括:

  1. 平板屏幕在设备上,我们想让设备变得生动。那么,我们如何创建一个更逼真的、圆润的、不是二维的面部?
  2. 当前的对话引擎只允许非常有限的对话,那么我们如何创建一个允许更自然对话的解决方案?
  3. 我们不希望声音听起来很机器人,那么我们如何使声音听起来自然,具有语境相关的语调和抑扬?
  4. 我们知道眼神接触非常重要,那么我们如何利用计算机视觉来确保可靠的眼球跟踪能力?

所有这些关于 Moxie 的特性的问题都导致了许多最先进的技术创新。

首先,投影和圆润的面部。统计数据开始积累,表明过多的屏幕时间可能对正在发育的大脑产生毁灭性的影响。更糟糕的是,大多数儿童的科技设备都具有数字屏幕显示。因此,我们决定投资更多的精力来使 Moxie 的面部完全投影,这使我们能够创建一个具有自然曲线边缘的圆润面部屏幕,而不是平面显示器。这使得与 Moxie 的交互感觉更生动、更真实、更可信。事实上,只有通过 Moxie 的 3D 面部外观,才能实现 Moxie 与孩子真正的眼神接触。因此,与 Moxie 的交互不仅保护孩子免受过多的屏幕时间,还使交互体验感觉更真实。

第二,会话引擎。到目前为止,智能扬声器和语音助手需要重复使用唤醒词来启动命令。Moxie 的会话引擎不同。它遵循自然的会话流程,并在不使用唤醒词(如“嘿 Siri”或“Ok Google”)的情况下响应典型的通信流程。先进的自然语言处理使 Moxie 能够无缝地识别、理解和生成语言,使交互感觉更个人化、更自然。

第三,语音合成。Moxie 的声音没有大多数机器人和语音助手中发现的机器人语音和单调的声音。相反,Moxie 使用自然和富有情感的语调,这有助于传达更广泛的情感。这增强了 Moxie 可以参与的社交情感课程的范围,同时也为交互增加了生命力和可信度。

第四,眼睛。最重要的特征之一是 Moxie 的大型动画眼睛。创新眼球跟踪技术使 Moxie 即使孩子在房间里移动,也能保持眼神接触。这项眼球跟踪功能不仅创建了令人难以置信的生动交互,还帮助孩子练习眼神接触。此外,大型动画眼睛有助于夸大情感交流,使孩子更容易识别某些情感。练习眼神接触和理解情感是社交情感课程中的两个关键发展目标。

最后,这些技术特性使得与 Moxie 的交互感觉真实和自然。Moxie 的多模态感官融合使 Moxie 感知环境和用户。Moxie 的计算机视觉和眼球跟踪技术有助于在孩子移动时保持眼神接触。机器学习有助于 Moxie 学习用户的偏好和需求,并识别人员、地点和事物。特别放置的麦克风使 Moxie 能够听到声音来自的方向并轻松转向声音来源。触摸传感器使 Moxie 能够识别拥抱和握手。所有这些部分共同组成,使体验非常真实。

 

有什么东西使 Moxie 对儿童来说是完美的?

通过 Moxie,儿童可以每天参与有意义的游戏,内容由儿童发展和早期儿童教育的最佳实践告知。每周都会有一个不同的主题,例如仁慈、友谊、同理心或尊重,儿童被委托帮助 Moxie 完成探索人类经历、想法和生活技能的任务。这些任务包括创造性的非结构化游戏,例如绘画,通过呼吸练习和冥想实践正念,阅读与 Moxie,探索如何对他人友善。Moxie 鼓励好奇心,儿童发现周围的世界和人。所有这些活动帮助儿童学习和安全地练习基本的生活技能,例如轮流、眼神接触、积极倾听、情绪调节、同理心、人际关系管理和解决问题。

Embodied 还与 Encyclopaedia Britannica 和 Merriam-Webster 合作,将 Merriam-Webster 的儿童词典集成到 Moxie 中,允许 Moxie 为儿童提供年龄适宜的定义和相关信息,以帮助他们学习和理解新词和概念的含义。这是 Embodied 与 Moxie 合作的首次尝试,实现了 Britannica 和 Merriam-Webster 共同的使命,即激发好奇心和学习的乐趣。

Embodied 还开发了一个完整的生态系统,以帮助父母支持他们的孩子与 Moxie 的旅程,并允许孩子以安全和父母批准的方式扩展他们对 Moxie 的使用:

  • Embodied Moxie 父母应用程序提供了一个仪表板,帮助父母了解他们的孩子与 Moxie 的发展进度。该应用程序将提供有关孩子的社交、情感和认知发展的关键见解,通过他们与 Moxie 的活动。该应用程序还为父母提供了有价值的建议和技巧,以增强他们的孩子与 Moxie 的体验和进度。
  • 一个在线儿童门户网站(称为全球机器人实验室,或 G.R.L.)提供了额外的活动、游戏和故事,以增强与 Moxie 的体验。
  • 每月的 Moxie 任务包是邮件,旨在让孩子参与与 Moxie 的新活动,并提供有趣的物品,如交易卡和贴纸。

随着时间的推移,Moxie 会了解更多关于孩子的信息,以更好地个性化其内容,以帮助每个孩子实现其个体发展目标。Embodied 采取了谨慎的步骤,以确保以高标准的隐私和安全性处理由儿童和家庭提供的信息。我们打算让 Moxie 完全符合 COPPA(儿童在线隐私保护法)安全港认证,这样父母就可以放心地知道 Moxie 采用了领先的数据完整性和安全程序,其系统定期审计以确保完全遵守。另外,个人可识别数据和敏感信息使用最高级别的安全性加密,只有父母才能访问唯一的解密密钥。

 

与 Moxie 相关的自然语言处理面临的一些挑战是什么?

在 Embodied,我们努力重新定义人类与机器的交互方式,特别是在对话中通过自然语言处理。因此,我们决定创建 SocialXTM,这是一个平台,允许儿童通过自然交互(例如面部表情、对话、肢体语言等)与 Moxie 交互,唤起信任、同理心和动力,以及更深层次的参与,以促进发展技能。通过 SocialXTM,Embodied 正在引入一种新的机器人类别:动画伴侣。“动画”意味着赋予生命,SocialXTM 允许 Moxie 体现出人类的最佳品质,以一种新的和先进的技术形式,能够激发新的学习方式。

自然语言处理是我们自然对话引擎的核心,我们不知疲倦地努力创造了对话引擎的许多独特功能。

我们关注的一个关键功能是 Moxie 能够专注于与单个用户的对话,并将背景对话和声音分离出来,因此 Moxie 只响应用户。这使得交互更加专注和个性化。这是解决所谓的“鸡尾酒会问题”的解决方案。当你在一个鸡尾酒会上,有很多人在房间里说话时,你试图与一个人交谈,这对人类来说并不太难。对于计算机来说,这是非常困难的。我们如何确保 Moxie 只响应单个用户说的话,而不会被背景噪音、对话、电视等分散注意力?我们通过以下方式解决这个问题:

  1. 我们使用我们的视觉系统来识别谁正在看着和面对 Moxie。
  2. 我们在 Moxie 的前面有多个麦克风,告诉我们声音来自哪里。
  3. 我们可以使用机器学习来匹配声音与 Moxie 前面的说话者。这使我们能够过滤掉其他对话并专注于单个用户。

通常,市场上的对话代理都避免了“鸡尾酒会问题”,通过使用唤醒词,例如“嘿(设备)”,后面跟着一个问题。这个唤醒词允许对话代理监听唤醒词并仅在唤醒词被说出时响应。然而,由于 Moxie 可以专注于单个用户,因此 Moxie 不需要唤醒词来激活响应。

我们希望确保 Moxie 的对话引擎足够先进,可以在语境中意识到对话响应。这允许更细致入微的对话。例如,Moxie 可以理解“我不知道”和“不”的不同含义。

 

您是否还有其他关于 Moxie 或 Embodied 的事情要分享?

我们已经致力于这个项目四年了,拥有一个不知疲倦的团队,他们不知疲倦地努力将使 Moxie 成为现实的惊人发明带到生活中。现在,我们很高兴终于能够将 Moxie 带给家庭,帮助他们的孩子进行社交情感发展。所以,我们期待这段旅程!

感谢这次采访,我喜欢听您最初如何被一部短篇皮克斯电影所启发,以及您如何追求您一生的热情。希望了解更多或想要订购 Moxie 的读者可以访问 Embodied, Inc

安托万是一位具有远见的领导者和Unite.AI的创始合伙人,他被对塑造和推广AI和机器人人的未来充满不动摇的热情所驱动。作为一位连续创业者,他相信AI将对社会产生与电力一样的颠覆性影响,他经常被听到对颠覆性技术和AGI的潜力大加赞赏。

作为一位未来学家,他致力于探索这些创新将如何塑造我们的世界。另外,他也是Securities.io的创始人,这是一个专注于投资于重新定义未来和重塑整个行业的尖端技术的平台。