人工智能
AlphaGeometry2:一種在幾何問題解決方面超越人類奧林匹克冠軍的AI
人工智慧長期以來一直試圖模仿人類邏輯推理。雖然它在模式識別方面取得了巨大的進展,但抽象推理和符號推斷仍然是人工智慧的挑戰。這種限制在人工智慧用於數學問題解決方面尤其明顯,數學問題解決是一個長期以來被認為是人類認知能力的體現,例如邏輯思維、創造力和深刻理解。與其他數學分支不同,幾何學需要不僅是結構化的、步驟驟的推理,也需要認識隱藏的關係和構造額外元素的能力。
長期以來,人們認為這些能力是人類所特有的。然而,Google DeepMind一直在開發可以解決這些複雜推理任務的人工智慧。去年,他們介紹了AlphaGeometry,一種結合神經網路的預測能力和符號推理的結構化邏輯來解決複雜幾何問題的人工智慧系統。這個系統通過解決54%的國際數學奧林匹克幾何問題,達到了銀牌得主的水平。最近,他們進一步推出了AlphaGeometry2,它達到了84%的解決率,超越了平均的國際數學奧林匹克金牌得主。
在這篇文章中,我們將探討AlphaGeometry2實現這種性能的關鍵創新,以及這個發展對於人工智慧在解決複雜推理問題的未來意味著什麼。但是在深入探討AlphaGeometry2的特殊之處之前,首先了解AlphaGeometry是什麼以及它如何工作是非常重要的。
AlphaGeometry:在幾何問題解決方面的先驅AI
AlphaGeometry是一種設計用於解決複雜幾何問題的人工智慧系統,達到國際數學奧林匹克的水平。它基本上是一種神經符號系統,結合神經語言模型和符號推理引擎。神經語言模型幫助系統預測新的幾何構造,而符號AI則應用正式邏輯來生成證明。這種設定允許AlphaGeometry更像人類地思考,結合神經網路的模式識別能力和符號推理的結構化邏輯。AlphaGeometry的一個關鍵創新是它如何生成訓練數據。它創建了一億個隨機幾何圖表,並系統地推導出點和線之間的關係。這個過程創建了一個巨大的數據集,包含一億個唯一的例子,幫助神經模型預測功能性的幾何構造和引導符號引擎向準確的解決方案。
AlphaGeometry2如何實現更好的性能
雖然AlphaGeometry是一個突破性的AI驅動的數學推理,但它有一些限制。它在解決複雜問題方面遇到了困難,缺乏效率地處理廣泛的幾何挑戰,並且在問題覆蓋方面有限。為了克服這些障礙,AlphaGeometry2引入了一系列重大的改進:
- 擴展AI的能力以了解更複雜的幾何問題
AlphaGeometry2的一個最重要的改進是它可以處理更廣泛的幾何問題。前一代AlphaGeometry在涉及線性方程、角度、比率和距離的問題以及需要關於移動點、線和圓的推理的問題方面遇到了困難。AlphaGeometry2通過引入更先進的語言模型來克服這些限制,允許它描述和分析這些複雜的問題。因此,它現在可以解決88%的國際數學奧林匹克幾何問題,是前一代的66%的顯著增加。
- 更快、更高效的問題解決引擎
AlphaGeometry2表現出色的另一個重要原因是其改進的符號引擎。這個引擎作為系統的邏輯核心,已經以多種方式進行了增強。首先,它已經改進為使用更精煉的問題解決規則,使其更有效和更快。其次,它現在可以識別不同的幾何構造何時代表問題中的同一點,允許它更靈活地推理。最後,引擎已經被重寫為C++而不是Python,使其比以前快了300多倍。這個速度提升允許AlphaGeometry2更快速、更高效地生成解決方案。
- 使用更複雜和更豐富的幾何問題進行AI訓練
AlphaGeometry2的神經模型的有效性來自於其在合成幾何問題上的廣泛訓練。AlphaGeometry最初生成了一億個隨機幾何圖表,以創建一億個唯一的訓練例子。AlphaGeometry2進一步生成更廣泛和更複雜的圖表,包括複雜的幾何關係。另外,它現在包含需要引入輔助構造的問題——新定義的點或線,幫助解決問題,允許它預測和生成更複雜的解決方案。
- 使用更聰明的搜索策略找到最佳解決方案
AlphaGeometry2的一個關鍵創新是其新的搜索方法,稱為共享知識搜索樹(SKEST)。與其前身不同,後者依賴於基本的搜索方法,AlphaGeometry2運行多個搜索並行,每個搜索都從其他搜索中學習。這種技術允許它探索更廣泛的可能解決方案,並顯著提高了AI解決複雜問題的能力。
- 從更先進的語言模型中學習
AlphaGeometry2成功的另一個關鍵因素是其採用了Google的Gemini模型,一種最先進的AI模型,已經在更廣泛和更豐富的數學問題上進行了訓練。這個新語言模型提高了AlphaGeometry2生成步驟驟解決方案的能力,得益於其改進的連鎖思維推理。現在,AlphaGeometry2可以以更結構化的方式解決問題。通過對其預測進行微調和從不同類型的問題中學習,系統現在可以解決更多的奧林匹克級別的幾何問題。
實現超越人類奧林匹克冠軍的成果
感謝上述進步,AlphaGeometry2解決了2000-2024年間50個國際數學奧林匹克幾何問題中的42個,達到了84%的成功率。這些結果超越了平均的國際數學奧林匹克金牌得主的表現,為AI驅動的數學推理設立了新的標準。除了其令人印象深刻的表現,AlphaGeometry2還在自動定理證明方面取得了進展,將我們帶近了可以不僅解決幾何問題,而且可以用人類可以理解的方式解釋其推理的AI系統。
數學推理中AI的未來
從AlphaGeometry到AlphaGeometry2的進步表明,AI正在變得更好地處理需要深刻思考、邏輯和策略的複雜數學問題。它還意味著AI不再只是模式識別——它可以推理、建立聯繫和以更像人類邏輯推理的方式解決問題。
AlphaGeometry2還向我們展示了AI在未來可能的能力。與其只是遵循指令,AI可能會開始探索新的數學思想,甚至可以幫助科學研究。通過結合神經網路和邏輯推理,AI可能不僅是一種可以自動化簡單任務的工具,也是一種合格的合作夥伴,幫助擴展人類在依賴批判性思維的領域中的知識。
我們是否正在進入一個時代,AI可以證明定理和在物理學、工程學和生物學中進行新的發現?隨著AI從粗暴的計算轉向更有思想的問題解決,我們可能正在邁向一個未來,人類和AI將共同合作,發現我們以前從未想過的想法。












