通用人工智能
索菲亚机器人是否使用人工智能,还是营销噱头?

如果您一直关注人工智能的发展,您可能已经听说过Hanson Robotics的索菲亚人形机器人。从营销角度来看,索菲亚具有变革性,她曾经有过与威尔·史密斯的浪漫邂逅,她曾出现在吉米·法伦的今夜秀中,以及无数其他媒体露面。甚至,当沙特阿拉伯否认女性平等权利时,授予索菲亚公民身份,引发了全球争议。
可能看起来奇怪的是,索菲亚很少在严肃的AI辩论中被讨论,即使她忙于安排公共露面,并在区块链会议上展示自己。要了解这一点的原因,需要探索其两位古怪代表的历史。
谁是大卫·汉森?
大卫·汉森是Hanson Robotics的创始人和CEO。
大卫在德克萨斯州达拉斯长大,阅读艾萨克·阿西莫夫和菲利普·K·迪克的作品。 艾萨克·阿西莫夫是一位科幻作家,他通过从1940年到1993年写了37个科幻短篇和六部小说,推广了机器人技术,这些作品中都有正电子机器人。由威尔·史密斯主演的我,机器人电影就是基于其中一个短篇故事。虽然索菲亚的外观与这些科幻作品的封面和插图非常相似,但她是以奥黛丽·赫本和汉森的妻子为原型。
大卫从小就追求艺术和创造力。他拥有罗德岛设计学校的美术学士学位,专业是电影/动画/视频,并获得了德克萨斯大学达拉斯分校的交互艺术和工程博士学位。
然后,他在华特迪士尼公司担任想象工程师。在迪士尼工作期间,他从事主题公园的雕塑和机器人技术的开发。
作为一名精美艺术家,大卫在包括雷纳索菲亚博物馆、东京现代艺术博物馆和库珀休伊特设计博物馆在内的艺术博物馆展出过他的作品。汉森的大型雕塑在亚特兰蒂斯度假村、环球影城冒险岛和几家迪士尼主题公园中都有展示。
1995年,大卫设计了一个与自己相似的机器人头部,这个头部由人远程控制。这一远程机器人操作是索菲亚的前身,也是理解索菲亚背后的技术可能更多的是一种幻觉而不是AI或机器学习的关键。
大卫完全理解拥有一个外观非威胁性和友好的机器人的人形机器人的重要性。应该给大卫创造出了一款能够以有限和预编程的方式与人类互动的机器人,并能捕捉人类想象力的机器人应有的赞扬。
从大卫的背景来看,很明显他在索菲亚的美学方面发挥了重要作用。问题仍然是索菲亚使用什么样的AI?以及这是否是在通往AGI(人工一般智能)的道路上,如其另一个古怪的发言人本·格尔茨尔所声称的那样?
谁是本·格尔茨尔?
本·格尔茨尔是一位杰出的全栈AI研究人员,AI软件公司Novamente LLC的首席科学家和董事长;OpenCog基金会的董事长;以及奇点大学的顾问。他曾是创建索菲亚的Hanson Robotics公司的首席科学家。他目前是SingularityNET的CEO和创始人。
本·格尔茨尔看起来像一个古怪的天才,当你看他演讲时,很明显他非常博学。他与他的朋友雷·库兹韦尔分享相同的观点,这些观点在雷的开创性著作奇点临近中有所体现。本·格尔茨尔认为AGI即将到来,正如雷预测的那样,2045年将是奇点的大致时间表,一个标志着人类智能和非生物智能融合的事件。
奇点是本·格尔茨尔存在的焦点,以至于他在2017年创立了SingularityNET。正如公司网站上所述:
SingularityNET是一个由去中心化协议驱动的全栈AI解决方案。我们聚集了机器学习和区块链领域的领先专家,以便民主化地访问AI技术。现在任何人都可以利用一个全球性的AI算法、服务和代理网络。
SingularityNET在2017年通过所谓的首次代币发行(ICO)筹集了资金。筹资的时机非常好,因为它正值ICO热潮,仅用了不到60秒就筹集了总计3600万美元。投资者将获得AGI代币,AGI代币在理论上将提供以下好处:
AGI代币是SingularityNET的一个关键方面,它可以以多种方式使用。它将使网络参与者之间能够进行交易,实现AI代理之间的价值交换,赋予网络社区以“仁慈”的行动,并使网络能够自我治理。
这就是为什么本·格尔茨尔经常在加密货币和区块链活动中演讲的原因。AGI代币是SingularityNET的筹资手段,索菲亚与SingularityNET的关联非常简单。索菲亚在这些活动中展示,以保持投资者的兴趣。这就是SingularityNET和索菲亚之间的关系描述:
SingularityNET诞生于一个集体的意愿,即分配AI的力量。索菲亚,这个世界上最富有表情的机器人,是我们第一个用例。今天,她使用多个AI模块来看到、听到和富有同情心地做出反应。她的许多底层AI模块将在SingularityNET上开源。
换句话说,SingularityNET将自己与索菲亚联系起来以筹集资金,索菲亚可能会在某个时候使用SingularityNET托管的AI模块。虽然索菲亚看起来确实使用了一些形式的AI,但它似乎非常基本。然而,索菲亚是一个平台,能够更换或移除AI模块,这意味着她当前的AI水平不能代表未来的性能。
索菲亚是否被预编程?
当你观看索菲亚在舞台上的表演时,有迹象表明我们可能被一场精心策划的魔术表演所迷惑。本·格尔茨尔尤其擅长快速演讲,他用自己的智慧吸引你,并且给索菲亚很少的真正的自由联想的发言时间。
如果索菲亚像声称的那样聪明,你会想给她大部分的演讲时间,投资者会争相抢占门票。
索菲亚经常被推着上场,这表明她缺乏移动能力。她似乎也缺乏对周围环境的感知,她无法专注于任何一个物体。她眨眼很多,随机微笑,并做出其他随机的面部表情。
还有一种缺乏输入技术。当构建AGI时,通常认为输入设备对于形成涌现意识很重要。需要一个“自我”的概念,因为相关知识和功能会根据系统的经验逐渐发展。基于索菲亚缺乏移动性和输入机制,这似乎是被忽略的东西。她的唯一输入似乎是听觉的,可能还有一些基本的计算机视觉。
还有一个问题,就是她所有的对话都是预先编写的。如果你想为活动预订索菲亚,你需要提前五个问题,这些问题需要由组织者预先批准。问题需要按照特定的顺序提问。这意味着根据预设的问题,索菲亚只是在重复预先录制的回应。这就是为什么她给出的答案总是如此有趣的原因,它们的设计目的是在观众中引起情感反应,而答案是由人使用索菲亚作为通道来传递的。
换句话说,索菲亚可能使用最多的就是计算机视觉、语音识别技术和某种形式的自然语言处理(NLP),但没有迹象表明她实际上正在分析所说内容背后的含义,或者她理解自己的答案背后的含义。亚马逊的Alexa和苹果的Siri都是更先进的AI系统,两家公司都不会声称这些系统接近AGI系统。
这是一项有趣的社会实验,用于了解人类如何与人形机器人交流和互动,但在任何时候都没有迹象表明索菲亚甚至可以被认为是有智慧或自我意识的。
在与The Verge的采访中,本·格尔茨尔承认,观众可能会高估索菲亚的能力:
“如果我告诉人们我正在使用概率逻辑来推理如何最好地剪枝逆向链式推理树,那些产生于我们的逻辑引擎的人们根本不知道我在说什么。但如果我向他们展示一个漂亮的微笑机器人脸,他们就会觉得AGI确实很近,很可行”。
然后他继续说:
“我不会把这些称为AGI,但也不是简单地能工作的东西,而且它绝对是感知、行动和对话的动态集成的最先进的东西”。
索菲亚使用什么技术?根据本的博客:
- 一个纯粹基于脚本的“时间线编辑器”(用于预编程的演讲和偶尔的媒体互动);
- 一个“复杂的聊天机器人”——根据上下文和有限的理解程度,从一个大型模板化回应的调色板中选择(有时也会从在线资源中获取回应,或生成随机回应);
- OpenCog,一种为AGI而设计的复杂认知架构,但仍然主要处于研发阶段(尽管在生物医学信息学等领域也具有实际价值,例如Mozi Health和即将推出的SingularityNET应用)。
正是由于索菲亚的技术和对AGI的提及存在混淆和误导的沟通,索菲亚继续被主流观众所采用,这些观众可能被误导为相信索菲亚比实际上更聪明。
索菲亚在很大程度上被AI社区忽视,这个社区了解当前的AI状态比索菲亚所能展示的要先进得多。然而,AI社区可能忽略了快速指数级技术增长的力量,如库兹韦尔的“加速回报定律”所描述的那样。虽然索菲亚的AI目前还远远没有达到AGI,但由于索菲亚能够容纳任何类型的AI模块,她有可能在任何时候升级或更换她的神经网络。因此,我们不应该对索菲亚最终实现真正的AGI感到惊讶。












