通用人工智能
查尔斯·J·西蒙,作者,计算机会反抗吗?- 采访系列

查尔斯·J·西蒙,BSEE,MSCS,全国知名企业家,软件开发者和经理。凭借广泛的管理和技术专长,以及电气工程和计算机科学的学位,西蒙先生在行业中拥有丰富的计算机经验,包括人工智能和计算机辅助设计(CAD)的先驱工作(两代CAD)。
他也是《计算机会反抗吗?》的作者,该书对人工通用智能(AGI)的未来可能性进行了深入的探讨。
是什么最初吸引你进入人工智能领域,特别是AGI领域?
我从阅读阿兰·图灵1950年的开创性论文《计算机能思考吗?》开始,对这个问题产生了浓厚的兴趣。到目前为止,答案显然是“否”,但没有科学理由说明为什么不可能。我在20世纪80年代末期的神经网络热潮中加入了人工智能社区,自那时以来,人工智能取得了巨大的进步。但在这三十年里,我们的机器并没有获得理解力,这将使许多应用程序跃升到新的有用性水平。
你表示,你同意MIT人工智能专家罗德尼·布鲁克斯的观点,即“没有与环境的交互,没有机器人身体,机器就永远不会表现出AGI。”这基本上是说,没有来自机器人身体的足够输入,人工智能永远不会发展AGI能力。在计算机视觉之外,什么样的输入是开发AGI所需的?
今天的人工智能需要用基本概念如物体在现实中的物理存在、时间的流逝、因果关系等来增强这些概念,对任何三岁孩子来说都是清晰的。一个幼儿使用多种感官来学习这些概念,通过触摸和操纵玩具,移动通过家中,学习语言等。虽然可以用更有限的感官创建AGI,但更多的感官和能力使得解决AGI问题变得更容易。
为了完整性,我的模拟器可以提供嗅觉和味觉。仍然需要确定这些是否对AGI也很重要。
你表示,“智能的关键要求是外部环境”。你给出的例子是,“不合理地期望IBM的沃特森‘理解’任何东西,如果它没有对‘东西’的基本概念。”这明显体现在当前狭义人工智能的局限性,特别是自然语言处理。人工智能开发人员如何克服当前人工智能的这一局限性?
一个关键因素是存储不仅仅是口头、视觉或触觉的知识,而是存储抽象的“事物”,这些事物可以有口头、视觉和触觉属性。考虑一个简单的短语“红球”。你知道这些词的意思是因为你的视觉和触觉经验。你还知道相关动作的含义,如抛、弹、踢等,当你听到这个短语时,这些动作会在你的脑海中浮现。任何仅仅基于词语或图像的人工智能系统都会错过其他层次的理解。
我已经实施了一个通用知识存储,它以类似大脑的结构存储任何类型的信息,其中事物类似于神经元,并且有许多属性引用指向其他事物——引用类似于突触。因此,红色和球都是单独的事物,而红球是一个事物,它有属性引用指向红色事物和球事物。红色和球都有引用指向对应的词语“红色”和“球”的事物,每个事物又有引用指向定义这些词语如何被听到、说、读或拼写的其他事物,以及可能的动作事物。
你得出结论,模拟大脑的通用智能还很遥远,而AGI可能相对较快就会出现。基于这一说法,我们是否应该放弃尝试模拟或创建人类大脑,而专注于AGI?
今天的深度学习和相关技术对于适当的应用来说是很好的,但它们不会自发地带来理解。为了迈出下一步,我们需要添加专门针对可以在任何三岁孩子的能力范围内解决的问题的技术。
利用计算机的固有能力可以比生物等价物或其模拟更高效几个数量级。例如,你的大脑可以在多次迭代中将信息存储在生物突触的化学中,需要10-100毫秒。计算机可以简单地在单个内存周期中存储新的突触值,比生物等价物快了十亿倍。
在开发AGI软件时,我既做了生物神经模拟,也做了更高效的算法。继续使用通用知识存储,当在模拟的生物神经元中模拟时,每个事物需要至少10个神经元,通常需要更多。这样,人类大脑的容量就在一千万到一亿个事物之间。但也许AGI只需要理解一百万个事物就能显得聪明——这完全在今天高端台式机的能力范围内。
一个关键的未知因素是,机器人应该分配多少时间来处理和对世界做出反应,多少时间来想象和计划。你能简要解释一下想象力对AGI的重要性吗?
我们可以想象很多事情,然后只对我们喜欢的、符合我们内部目标的事情采取行动。如果你会(或一个AGI),考虑不同可能行动的结果并选择最能实现目标的行动。一个AGI也将从推测各种复杂行动和选择最好的行动中受益。
你认为阿西莫夫的机器人三定律太简单和模糊。在你的书中,你分享了一些关于机器人应该被编程遵循的推荐法则的想法。哪些法则你认为对机器人来说最重要?

新的“机器人法则”将在AGI出现时随着时间的推移而演变。我提出了几个起始点:
- 最大化内部知识和对环境的理解。
- 与他人(AGI和人类)准确共享知识。
- 最大化AGI和人类整体的福祉——不仅仅是个人。
你对图灵测试和其背后的概念有一些问题。你能解释一下你认为图灵测试是如何有缺陷的吗?
图灵测试在过去五十年中为我们提供了一个对通用智能的临时定义,但随着AGI的到来,我们需要完善这个定义。图灵测试实际上是一个测试人类的程度,而不是智能的程度。计算机能够维持欺骗的时间越长,它在测试中的表现就越好。显然,问“你是计算机吗?”和相关的代理问题,如“你最喜欢的食物是什么?”除非AGI被编程为欺骗——这是一个值得怀疑的目标,否则这些问题都是明显的线索。
此外,图灵测试促使人工智能开发进入了有限价值的领域,例如具有巨大灵活性的聊天机器人,但没有任何潜在的理解力。
如果你要改进图灵测试,你会做出什么不同的改变?
更好的问题可以具体地探索对时间、空间、因果关系、预见等的理解,而不是没有任何心理学、神经科学或人工智能基础的随机问题。以下是一些例子:
- 你现在看到什么?如果你退后三英尺,你会看到什么不同之处?
- 如果我采取某个行动,你的反应会是什么?
- 如果你采取某个行动,我的可能反应会是什么?
- 你能命名三个与[对象]类似的东西吗?
然后,不应该根据这些回应是否与人类回应无法区分来评估它们,而应该根据实体被测试的经验来评估它们是否是合理的(智能的)回应。
你曾表示,当面临要求执行某些短期破坏性活动的要求时,正确编程的AGI将简单地拒绝。我们如何确保AGI最初被正确编程?
决策是基于目标的。在与想象力结合时,你(或AGI)会考虑不同可能行动的结果并选择最能实现目标的行动。对于人类来说,我们的目标是由进化的本能和经验决定的;AGI的目标完全由开发者决定。我们需要确保AGI的目标与人类的目标保持一致,而不是个人目标。[上面列出了三个可能的目标。]
你曾表示,人类创造AGI是不可避免的,你对时间表的最佳估计是什么?
AGI的某些方面将在未来十年内开始出现,但我们不会都同意AGI已经到来。最终,我们将同意AGI已经到来,当它们在大多数人类能力方面超过我们时。这将需要二十到三十年。
对于所有关于AGI的讨论,它是否会像我们所知道的那样真正具有意识?
意识表现为一组行为(我们可以观察到),这些行为基于内部感觉(我们无法观察到)。AGI将表现出这些行为;它们需要这样做才能做出智能的决定。但是我认为,我们的内部感觉在很大程度上取决于我们的感官硬件和本能,所以我可以保证,AGI可能拥有的任何内部感觉都将与人类不同。
同样的事情也适用于情感和我们对自由意志的感觉。在做出决定时,你对自由意志的信念渗透到每一个决定中。如果你不相信自己有选择,你就会简单地做出反应。为了做出深思熟虑的决定,AGI也需要意识到自己的决策能力。
最后一个问题,你认为AGI的潜力更大的是善还是恶?
我对AGI持乐观态度,认为它将帮助我们作为一个物种向前迈进,并为我们关于宇宙的许多问题提供答案。关键是我们需要为AGI定义我们的关系,并决定我们的目标。 如果我们决定使用第一个AGI作为征服和富裕的工具,我们不应该对它们最终可能成为对我们自己的征服和富裕工具感到惊讶。 如果我们选择AGI是知识、探索和和平的工具,那么我们可能会得到同样的回报。 选择权在我们。
感谢您对构建AGI的未来潜力的精彩采访。对于希望了解更多的读者,可以阅读《计算机会反抗吗?》或访问查尔斯的网站utureai.guru。












