思想领袖

为什么行业5.0需要人工通用智能

mm

作者:Bas Steunebrink,人工通用智能联合创始人和董事,Eric Nivel,首席AGI工程师和Jerry Swan,NNAISENSE研究科学家

我们已经习惯了在现代世界中享受自动化带来的便利,每天从遍布全球的供应链中获得大量商品。但在幕后,商品的生产和运输带来了许多优化挑战,例如包装、调度、路由和装配线自动化。这些优化挑战是动态的,并且随着现实世界的变化而不断变化。例如,预期的供应路线可能由于意外情况而受到损害,例如苏伊士运河被堵塞,空中航线可能由于火山喷发而改变,整个国家可能由于冲突而无法进入。法律变化、货币崩溃和稀缺资源也是供应侧变量不断变化的例子。

为了提供另一个例子,有时需要将新部件纳入机器或工作流程中(用户可能想要不同的材料或颜色,例如)。目前,需要专家人工劳动来更改系统,或者在机器学习的情况下,需要额外地重新训练和部署解决方案。同样,Industry 4.0的“数字孪生”仍然严重依赖于问题描述和输入分布可以在系统设计初期一次性指定的概念。

最近的疫情凸显了“即时”供应链规划的脆弱性。在一个日益复杂和不确定的世界中,行业不再能够承受这种僵化性。目前,制造业必须在“低混合高容量”(LMHV)和“高混合低容量”(HMLV)之间做出选择。行业5.0预计“高混合高容量”(HMHV),在这种情况下,工作流程可以在低成本下重新配置以满足流动需求。为了实现这一目标,需要“自动化自动化”,以消除人工干预和/或系统停机的需要,当问题或环境发生变化时。这需要能够“按照命令工作”的系统,能够对变化做出反应,同时仍然有合理的机会在现实世界的时间限制内完成其分配的任务。考虑以下示例,指示装配线机器人,目前正在执行任务X:

“立即停止装配X:这是Y的规格,这里有一些旧的和一些新的执行器。现在开始装配Y,避免此类缺陷和浪费。”

尽管最近有很多关于“人工通用智能”(AGI)通过所谓的大型语言模型(如GPT-3)即将到来的讨论,但没有一个提出的方法真正能够“按照命令工作”。也就是说,它们不能在没有离线重新训练、验证和重新部署的情况下被分配完全超出其训练集的任务。

很明显,任何现实世界中的智能概念都与对变化的响应性密不可分。一个系统如果在面对许多意外事件时仍然保持不变,那么它既不是自主的,也不是智能的。这并不是要贬低深度学习(DL)方法的无可置疑的优势,它们在合成难以明确指定的问题的程序方面取得了巨大的成功。

那么,什么样的系统功能可能使人工智能超越这种训练、冻结和部署的范式,转向能够进行无间断的适应性学习?考虑到在制造工作流程中用不同供应商的零件替换有缺陷的零件的需要,这可能具有不同的公差。使用当代人工智能的端到端黑盒建模,数字孪生过程必须重新进行。为了解决当代方法的局限性,需要进行根本性的改变:一种可以直接推理其所知道的内容的模型。通过将工作流程分解为具有已知属性的组件并根据需要重新组合它们,需要所谓的“组合性”。组合性迄今为止一直难以被当代人工智能所掌握,它经常与较弱的模块化概念混淆。模块化关注的是将组件“粘”在一起的能力,但这并没有抓住组合性的本质,即能够推理结果工作流程的行为,以确定和确保某些期望属性的保存。这对于验证和安全的原因至关重要:例如,系统能够推理“采用替代制造商的发动机将增加整个工厂的功率输出,同时所有其他组件保持在温度范围内”。

尽管当代神经网络方法在从数据中学习规则方面表现出色,但它们缺乏组合推理。作为在神经网络架构中希望组合推理出现的替代方法,可以直接使用范畴理论的构造,即组合性的数学研究。特别是,其子领域范畴控制论关注双向控制器作为基本表示元素。双向性是指能够执行正向和逆向推理的能力:从原因到结果的预测和反之亦然。组合逆向推理尤为重要,因为它允许在任何结构表示规模上纳入来自环境的反馈,这有助于从少量示例中快速学习。给定某些期望的系统行为,学习任务是构建一个聚合控制结构来满足它。最初学习的结构作为后续学习的骨架。随着系统知识的增长,这个骨架可以用学习的组合属性来装饰,类似于H2O分子可以被确定为具有不同于其组成原子的属性。另外,就像“抛球”和“挥动网球拍”可以被视为人类的相关肌肉骨骼动作一样,相关任务可以共享一个骨架控制结构,该结构通过环境反馈以任务特定方式进行装饰。这种因果结构与任务特定细节的解耦可以促进在不发生灾难性遗忘的情况下学习新任务。因此,前面描述的混合数值-符号方法可以结合神经和符号方法的优势,既具有结构的明确概念,又具有学习适应性地组合属性的能力。关于组合属性的推理以系统当前被命令执行的工作为基础进行持续的接地。

总之,很明显,需要一种新的方法来创建真正的自治系统:能够适应重大变化和/或在未知环境中运行的系统。这需要无间断的适应性学习和从已知的内容中概括。尽管它们被称为深度学习方法,但它们对世界的表示却很肤浅,不能被学习过程以高层次操纵。相比之下,我们提议下一代AGI系统将在更广泛的体系结构中包含深度学习,并具有直接推理其所知道的内容的能力。系统能够对其自身表示进行符号推理的能力为行业带来了显著的好处:具有明确的组合表示,系统可以被审计,无论是由人类还是系统本身内部进行,以满足安全性和公平性的重要要求。虽然学术界对所谓的x风险表示担忧,但实际的重点应该是将控制系统重新任务化同时保留这些重要要求的具体工程问题,我们称之为交互式对齐。只有通过采用这种可信赖和高效的持续学习控制系统,我们才能实现行业5.0所设想的下一代自治。

从小开始,Bas 就问过,智能如何使人们能够在不可避免地不足的资源下胜任地完成任务。为了更好地理解自然的有限理性,他的研究最初集中在人工情感,然后转向作为 IDSIA 博士后从事通用智能的硅友好方法,在那里他获得了几项最佳论文奖和来自未来生命研究所的补助金。在 NNAISENSE,Bas 领导开发通用人工智能的工作。