Connect with us

人工智能

AlphaGeometry2:超越人类奥林匹克冠军的几何AI

mm

人工智能长期以来一直试图模仿人类的逻辑推理能力。虽然它在模式识别方面取得了巨大的进步,但抽象推理和符号推导仍然是人工智能面临的重大挑战。这种限制在人工智能用于数学问题解决时尤其明显,数学问题解决长期以来一直是人类认知能力的体现,例如逻辑思维、创造力和深入理解。与其他依赖公式和代数运算的数学分支不同,几何学不同。它不仅需要结构化、步骤式的推理,还需要识别隐藏关系和构造额外元素来解决问题的能力。

长期以来,人们认为这些能力是人类所独有的。然而,Google DeepMind一直致力于开发能够解决这些复杂推理任务的人工智能。去年,他们推出了AlphaGeometry,一种将神经网络的预测能力与符号推理的结构化逻辑相结合来解决复杂几何问题的系统。该系统通过解决54%的国际数学奥林匹克(IMO)几何问题来达到与银牌得主相同的水平,产生了重大影响。最近,他们进一步推出了AlphaGeometry2,它实现了令人难以置信的84%的解题率,超越了平均IMO金牌得主。

在本文中,我们将探讨AlphaGeometry2实现这一水平的性能的关键创新,以及这一发展对人工智能在解决复杂推理问题方面的未来意味着什么。但是在深入了解AlphaGeometry2的特殊之处之前,首先了解AlphaGeometry是什么以及它如何工作是非常重要的。

AlphaGeometry:几何问题解决的先驱AI

AlphaGeometry是一种旨在解决国际数学奥林匹克(IMO)级别复杂几何问题的人工智能系统。它基本上是一个神经符号系统,将神经语言模型与符号推导引擎相结合。神经语言模型帮助系统预测新的几何构造,而符号AI应用正式逻辑来生成证明。这种设置允许AlphaGeometry更像人类一样思考,通过将神经网络的模式识别能力(复制人类的直觉思维)与正式逻辑的结构化推理(模拟人类的推导能力)相结合。AlphaGeometry的一个关键创新是它生成训练数据的方式。它没有依赖于人类的示范,而是创建了一亿个随机的几何图表,并系统地推导出点和线之间的关系。这个过程创建了一个包含一亿个唯一示例的巨大数据集,有助于神经模型预测功能性几何构造,并引导符号引擎向准确的解决方案。这种混合方法使AlphaGeometry能够在标准竞赛时间内解决25个奥林匹克几何问题中的30个,紧密地匹配了顶级人类竞争者的表现。

AlphaGeometry2如何实现更好的性能

虽然AlphaGeometry在人工智能驱动的数学推理方面是一个突破,但它有一些局限性。它在解决复杂问题方面挣扎,缺乏处理广泛几何挑战的效率,并且在问题覆盖范围方面存在局限性。为了克服这些障碍,AlphaGeometry2引入了一系列重要的改进:

  1. 扩展AI理解更复杂的几何问题的能力

AlphaGeometry2最显著的改进之一是其能够处理更广泛的几何问题。前身AlphaGeometry在涉及角度、比率和距离的线性方程以及需要对移动点、线和圆进行推理的问题上挣扎。AlphaGeometry2通过引入更先进的语言模型来克服这些局限性,该模型允许它描述和分析这些复杂的问题。因此,它现在可以解决过去二十年中88%的所有IMO几何问题,这比之前的66%有了显著的提高。

  1. 更快、更高效的问题解决引擎

AlphaGeometry2表现出色的另一个关键原因是其改进的符号引擎。作为该系统的逻辑核心,符号引擎已通过以下几种方式进行了增强。首先,它已被改进为使用一组更精炼的问题解决规则,使其更有效、更快。其次,它现在可以识别不同几何构造何时代表问题中的同一点,使其能够更灵活地推理。最后,引擎已被重写为C++而不是Python,使其比以前快了300多倍。这种速度提升使AlphaGeometry2能够更快速、更高效地生成解决方案。

  1. 用更复杂、更多样的几何问题训练AI

AlphaGeometry2的神经模型的有效性来自于其在合成几何问题上的广泛训练。AlphaGeometry最初生成了一亿个随机的几何图表,以创建一亿个唯一的训练示例。AlphaGeometry2更进一步,生成了更广泛、更复杂的图表,包括复杂的几何关系。此外,它现在还纳入了需要引入辅助构造(新定义的点或线,以帮助解决问题)的问题,使其能够预测和生成更复杂的解决方案。

  1. 使用更智能的搜索策略找到解决方案的最佳路径

AlphaGeometry2的一个关键创新是其新的搜索方法,称为共享知识搜索树集(SKEST)。与其前身不同,后者依赖于基本的搜索方法,AlphaGeometry2并行运行多个搜索,每个搜索都可以从其他搜索中学习。这种技术使其能够探索更广泛的可能解决方案,并显著提高人工智能在更短的时间内解决复杂问题的能力。

  1. 从更先进的语言模型中学习

AlphaGeometry2成功的另一个关键因素是其采用了Google的Gemini模型,一种最先进的AI模型,已经在更广泛、更多样的数学问题上进行了训练。这个新语言模型提高了AlphaGeometry2生成逐步解决方案的能力,得益于其改进的链式推理。现在,AlphaGeometry2可以以更结构化的方式解决问题。通过对其预测进行微调并从不同类型的问题中学习,该系统现在可以解决更大比例的奥林匹克级别的几何问题。

实现超越人类奥林匹克冠军的结果

感谢上述进步,AlphaGeometry2解决了2000-2024年间50个IMO几何问题中的42个,实现了84%的成功率。这些结果超越了平均IMO金牌得主的表现,并为人工智能驱动的数学推理设定了新的标准。除了其令人印象深刻的表现,AlphaGeometry2还在自动定理证明方面取得了进展,使我们更接近于能够不仅解决几何问题,还能以人类可以理解的方式解释其推理的AI系统。

人工智能在数学推理中的未来

从AlphaGeometry到AlphaGeometry2的进步表明,人工智能在处理需要深入思考、逻辑和策略的复杂数学问题方面变得越来越好。它还表明,人工智能不再仅仅是关于模式识别——它可以推理、建立联系,并以更像人类的逻辑推理方式解决问题。

AlphaGeometry2还向我们展示了人工智能在未来可能具备的能力。与其仅仅遵循指令,人工智能可能会开始探索新的数学思想,甚至可以帮助科学研究。通过将神经网络与逻辑推理相结合,人工智能可能不仅仅是一个可以自动化简单任务的工具,而是一个合格的合作伙伴,可以帮助在依赖批判性思维的领域扩展人类知识。

我们是否即将进入一个时代,在那里人工智能证明定理并在物理学、工程学和生物学等领域取得新的发现?随着人工智能从蛮力计算转向更有思想的解决问题,我们可能正处于人类和人工智能合作以揭示我们从未想象过的想法的未来之中。

Dr. Tehseen Zia 是 COMSATS University Islamabad 的终身副教授,拥有来自奥地利维也纳科技大学的人工智能博士学位。专攻人工智能、机器学习、数据科学和计算机视觉,他在著名的科学期刊上发表了重要贡献。 Dr. Tehseen 还作为首席调查员领导了各种工业项目,并担任人工智能顾问。