未来主义系列
当人工智能解决开放的数学问题时,天才还剩什么?
Unite.AI is committed to rigorous editorial standards. We may receive compensation when you click on links to products we review. Please view our affiliate disclosure.
数学长期以来被认为是衡量智力的最纯粹的标准。与大多数科学不同,它不依赖于实验设备、实验噪音或测量工具。一个证明要么是正确的,要么是错误的。这种清晰度就是为什么伟大的未解问题——抵抗每一种已知技术的猜想——成为一种知识上的珠穆朗玛峰的原因。
历史往往讲述同样的故事:一个问题悬而未决数十年或数百年,直到一个罕见的思想家出现——一个拥有耐心、创造力和技术能力的混合体的人,他们可以看到别人看不到的路径。我们庆祝“孤独的天才”,因为在数学中,这个叙述往往适用。
但是一种新的模式开始出现。在2025年末和2026年初,关于几个埃尔德什问题(由保尔·埃尔德什收集的著名开放问题集)的在线讨论表明,人工智能辅助证明可能已经在异常短的时间内解决了多个问题。其中一些证明草图据称已被领先的数学家审查,包括特伦斯·陶,他公开谈论过人工智能作为数学合作伙伴的日益重要的作用。然而,仍然存在最重要的警告:数学不受头条新闻的驱动。广泛接受通常需要时间——独立验证、仔细撰写和有时在证明检查系统中正式化。
即使有这样的警告,一个更广泛的观点仍然成立:世界正在第一次真正地看到,当人工智能不仅仅是计算、总结或模式匹配,而是参与推理的行为时会发生什么。如果人工智能可以可靠地帮助解决人类几个世代以来一直在努力解决的问题,这就迫使我们深入思考一个更深层次的问题:
当机器可以先到达顶峰时,人类的天才将做什么?
“硅谷推理”的机制
为了理解为什么这个时刻感觉不同,有助于区分两种版本的人工智能,人们经常混淆它们。
早期的语言模型通常被描述为(公平地)可以预测下一个可能的单词的系统。它们可能看起来令人印象深刻,但它们也容易产生“自信的胡言乱语”,因为它们有限的能力无法减慢速度、测试想法或自我纠正。
新的系统越来越多地依赖于不同的方法:测试时推理(有时被称为“测试时计算”)。与其立即产生答案,不如说模型可以在单个问题上花费更多时间——生成候选方法,检查步骤是否在逻辑上遵循,遇到矛盾时后退,并探索替代路线。在人类的术语中,它类似于数学家在白板上所做的事情:尝试,打破,修复,然后重复。
这在数学中很重要,因为进展很少是一条直线。最有前途的想法往往会失败。能够后退——没有自尊、疲劳或沮丧——可以将不可能的搜索变成可行的搜索。
现代人工智能系统已经超越了简单的计算,提供了四种实用的能力,使它们感觉更像合作伙伴,而不是计算器。它们擅长大规模综合,连接来自大量文献和小众子领域的想法,在这些子领域中,关键引理很少被引用。它们还实现了快速迭代,快速测试许多证明“路线”,并丢弃死胡同,同时保留有前途的子结构。此外,这些机器有时会提出不寻常的启发式方法——中间构造,感觉上与人类的直觉不符,但在逻辑上是合理的。最后,它们产生了验证友好的输出,可以翻译成正式的证明助手,如Lean或Coq,为社区提供了一条提高信心的途径。
重要的是,这并不意味着人工智能“理解”数学的方式与人类相同。这意味着更具体的一点:在正确的约束下,它可以生成在审查下成立的推理链。在数学中,这就是货币的意义。
为什么埃尔德什风格的问题作为早期目标很有意义
并非所有数学前沿都同样容易受到人工智能加速的影响。一些问题需要完全新的理论、新定义或深刻的概念飞跃,这些飞跃在现有文献中没有很多立足点。但是其他问题——尤其是组合数学、数论和离散数学中的问题——往往具有不同的形状:
- 陈述足够简单,可以向非专家解释。
- 已知的工具丰富,散布在论文和容易忽略的子领域中。
- 进展往往来自以巧妙的方式组合现有结果。
埃尔德什问题经常符合这个特征。它们以容易陈述但难以解决而闻名,生活在证明可以涉及各种技术的领域:概率方法、极端组合、遍历理论、调和分析等。
这使得它们对人工智能有用作“压力测试”。如果一个系统可以为一个长期以来抵抗人类努力的问题提出可信的证明策略,那是有意义的,即使它最终证明(有时会发生)关键思想已经隐含在较早的工作中,或者证明需要在成为经典之前进行抛光。
换句话说:故事不是“人工智能取代数学家”。故事是人工智能可能会缩短“结果存在某处”和“社区实际看到它”之间的距离。
当人工智能重新发现人类遗忘的东西时
现代科学中最有趣的模式之一不是人类缺乏知识,而是我们难以 检索 知识。
数学是巨大的。结果散布在几十年的期刊、研讨会笔记和具有自己语言和惯例的专业子领域中。即使是优秀的数学家也可能忽略一个在小众领域内“明显”的定理。随着时间的推移,整个推理链可以变得埋没——不是因为它们是错误的,而是因为注意力转移到了其他地方。
人工智能改变了这种动态,因为它愿意搜索人类很少看的枯燥角落。它还可以桥接方言,将不同子领域的思想翻译并对齐传统上分开的思想。
这是很多人看到的最深层次的承诺。即使人工智能没有从头开始发明新的数学,它也可以像一个超级强大的“知识挖掘机”一样,重新将被遗忘的结构带入视野,并以新的方式重新组合它们。
“大数学”转变:从证明作者到指挥家
如果人工智能继续改进,最大的变化可能不是机器解决更多定理。它可能是人类数学家的角色发生了变化。
几个世纪以来,做数学意味着在证明本身上投入巨大的努力——找到一条路,验证每一步,并以其他专家可以检查的方式写下来。这是手艺的一部分。但这也是一个瓶颈。很多有前途的想法仅仅因为需要的人类时间来完全执行和正式化它们而死亡。
在人工智能加速的世界中,证明变得不那么稀缺。这并不意味着数学变得琐碎。这改变了哪里是辛苦工作的地方。
数学家作为制图师,而不是计算器
如果证明不再是主要瓶颈,“天才”转移到更高层次的任务。选择最有价值的问题来解决成为人类的主要责任,如设计新的抽象概念,如不变量和领域桥接定义。此外,伟大的思想将专注于通过绘制猜想景观和协调发现来构建研究计划,同时还将抽象结果转化为其他领域的功能工具。
可以把它想象成国际象棋中的转变。人类的国际象棋并没有在计算机超越我们之后结束。相反,精英玩家进化了。人类学会了向机器提出更好的问题,解释其建议,并开发将直觉与计算相结合的策略。
数学可能会经历类似的转变——除了赌注更广泛。新的数学工具可以重塑密码学、优化、机器学习、物理和经济学。如果人工智能降低了发现的成本,下游的影响可能会很大。
这是“自由思考”,还是仅仅非常快速的搜索?
一个合理的怀疑者可能会说:这不是智能,这只是蛮力。给机器足够的计算能力,它就会偶然发现一些有效的东西。
这里有一个真正的观点。人工智能确实带来了规模。它可以尝试很多路线。但最有趣的案例不是随机的碰撞——它们涉及结构化的综合:连接概念、在陌生环境中重用引理,并组装一个连贯的推理链,足以让专家验证。
在实践中,“搜索”和“思考”之间的界线变得模糊。人类数学家也在搜索——通过想法、通过类比、通过部分结果。重要的是这个过程是否可以可靠地产生新的、可验证的真理。
如果人工智能变得一致地能够做到这一点,那么标签就不那么重要了。边界无论如何都会转变。
哪些边界可能会下一个倒下?
如果人工智能继续改进,我们应该期待一个模式:首先倒下的问题往往是那些知识已经存在但分散的,现有技术可以被重新组合的,并且可以快速通过正式验证提高信心的问题。
可能的近期目标包括:
- 极端组合学和图论: 丰富的工具包,许多已知的引理和以干净的离散术语定义的问题。
- 加法数论: 跨技术证明和连接领域的“桥梁”论证的肥沃土壤。
- 优化和复杂性相关问题: 不是最深层次的“P vs NP”问题,而是许多小的结构结果,围绕算法和界限。
- 形式化子领域: 已经部分编码到证明助手中的领域,人工智能可以加速从想法到经过验证的定理的翻译。
大问题——像千禧年大奖问题——可能仍然需要深刻的概念发明。但即使在那里,人工智能也可以逐渐消除周围的环境:证明引理,探索特殊情况,并构建脚手架,使最终的人类(或混合)飞跃更有可能。
哲学转折点:提问者的回归
随着我们自动化证明的机制,我们被迫面对一个现实,这个现实自学科诞生之日起就已经存在:数学始终是哲学的一个子集。历史上,我们物种中最受珍视的智慧是那些能够与生活中最有意义的问题搏斗的人。古希腊人没有将数字的研究与存在的研究分开;对于他们来说,数字的“无理性”是一种危机,就像逻辑危机一样。
在现代时代,我们将人类“天才”的价值转移到了大师计算器——能够通过三百页证明的密集、手动劳动的思想。我们将智力等同于能够作为生物处理器运行的能力。但是,当人工智能开始先于我们到达这些证明的顶峰时,这个技术瓶颈就会消失。这并不降低人类的智力;它迫使人类的智力“向上移动”。
未来的杰出智慧将不再是那些能够以极高的效率执行已知过程的人,而是能够定义什么值得发现的哲学家。 当“如何”成为硅提供的商品时,“为什么”成为唯一剩下的稀缺资源。我们正在回到博学家的时代,那里的至高技能是能够提出改变生活的问题——构思新的意义边疆。就像从铲子到挖土机的转变一样,我们不再因为能够用手挖掘而受到重视,而是因为我们在决定哪里打破新地时的远见。
结论:一个天才向上移动的未来
如果人工智能可以帮助解决曾经需要一个世纪天才的问题,这并不意味着我们没有数学可做。它意味着我们改变了做数学的方式。
在一个证明变得更便宜的世界中,稀缺资源变成了其他东西:好的问题、有用的抽象和解释数学的能力。
未来的“独特智慧”可能看起来不像一个孤独的人花费数十年时间来完成一个证明,而更像是一个思想的制图师——一个人,可以看到哪些山值得攀登,以及如何协调一种新的探险方式,让人类和机器一起攀登。












