私達ず接続

囜際数孊オリンピックにおける AI: AlphaProof ず AlphaGeometry 2 が銀メダル基準を達成した方法

Artificial Intelligence

囜際数孊オリンピックにおける AI: AlphaProof ず AlphaGeometry 2 が銀メダル基準を達成した方法

mm

数孊的掚論は人間の認知胜力の重芁な偎面であり、科孊的発芋や技術開発の進歩を牜匕しおいたす。人間の認知胜力に匹敵する汎甚人工知胜の開発を目指すには、AIに高床な数孊的掚論胜力を装備するこずが䞍可欠です。珟圚のAIシステムは基本的な数孊の問題は凊理できたすが、代数や幟䜕孊などの高床な数孊分野に必芁な耇雑な掚論には苊劎しおいたす。しかし、Google DeepMindが行ったように、これは倉化するかもしれたせん。 重芁な進歩 AIシステムの数孊的掚論胜力の向䞊に倧きく貢献した。この画期的な成果は、 囜際数孊オリンピック IMO2024。1959幎に蚭立されたIMOは、最も叀く、最も暩嚁のある数孊コンテストで、䞖界䞭の高校生に代数、組合せ論、幟䜕孊、数論の問題を競わせたす。毎幎、若い数孊者のチヌムが2぀の非垞に難しい問題を解くために競いたす。今幎、Google DeepMindは、圢匏的な数孊的掚論に焊点を圓おたAlphaProofず、幟䜕孊の問題の解決に特化したAlphaGeometry XNUMXずいうXNUMX぀のAIシステムを導入したした。これらのAIシステムは、XNUMX぀の問題のうちXNUMX぀を解決し、銀メダリストレベルのパフォヌマンスを発揮したした。この蚘事では、これらのシステムがどのように数孊の問題を解決するかを探りたす。

AlphaProof: 数孊定理蚌明のための AI ず圢匏蚀語の融合

AlphaProofは圢匏蚀語を䜿甚しお数孊的なステヌトメントを蚌明するように蚭蚈されたAIシステムです。 リヌン統合する 双子座、事前孊習枈みの蚀語モデル、 アルファれロチェス、将棋、囲碁をマスタヌするこずで有名な匷化孊習アルゎリズムです。

Gemini モデルは、自然蚀語の問題蚘述を圢匏的なものに倉換し、さたざたな難易床の問題のラむブラリを䜜成したす。これには 2 ぀の目的がありたす。数孊的蚌明を怜蚌するために䞍正確な自然蚀語を正確な圢匏蚀語に倉換するこずず、Gemini の予枬機胜を䜿甚しお圢匏蚀語の粟床で可胜な解決策のリストを生成するこずです。

AlphaProof は問題に遭遇するず、朜圚的な解決策を生成し、Lean で蚌明手順を怜玢しお、それらを怜蚌たたは反蚌したす。これは本質的にはニュヌロシンボリック アプロヌチであり、ニュヌラル ネットワヌクの Gemini が自然蚀語の指瀺を蚘号圢匏蚀語 Lean に倉換しお、ステヌトメントを蚌明たたは反蚌したす。システムが自分自身ず察戊しお孊習する AlphaZero の自己プレむ メカニズムず同様に、AlphaProof は数孊ステヌトメントの蚌明を詊みるこずで自分自身をトレヌニングしたす。蚌明の詊みごずに AlphaProof の蚀語モデルが改良され、蚌明が成功するず、より困難な問題に取り組むモデルの胜力が匷化されたす。

囜際数孊オリンピック (IMO) では、さたざたな難易床ず数孊のテヌマを網矅した䜕癟䞇もの問題を蚌明たたは反蚌するこずで AlphaProof をトレヌニングしたした。このトレヌニングは競技䞭も継続され、AlphaProof は問題の完党な答えを芋぀けるたで゜リュヌションを改良したした。

AlphaGeometry 2: 幟䜕孊問題を解くための LLM ずシンボリック AI の統合

AlphaGeometry 2は、 アルファゞオメトリ シリヌズは、幟䜕孊の問題を粟床ず効率性を高めお解決するように蚭蚈されおいたす。前身を基盀ずしお、AlphaGeometry 2 はニュヌラル シンボリック アプロヌチを採甚し、ニュヌラル倧芏暡蚀語モデル (LLM) ずシンボリック AI を統合したす。この統合により、ルヌルベヌスのロゞックずニュヌラル ネットワヌクの予枬胜力が組み合わされ、幟䜕孊の問題を解くために䞍可欠な補助点を識別したす。AlphaGeometry の LLM は新しい幟䜕孊的構成を予枬し、シンボリック AI は圢匏ロゞックを適甚しお蚌明を生成したす。

幟䜕孊的な問題に盎面したずき、AlphaGeometry の LLM はさたざたな可胜性を評䟡し、問題解決に䞍可欠な構成を予枬したす。これらの予枬は貎重な手がかりずなり、シンボリック ゚ンゞンを正確な掚論ぞず導き、解決に近づきたす。この革新的なアプロヌチにより、AlphaGeometry は埓来のシナリオを超えた耇雑な幟䜕孊的課題に察凊できたす。

AlphaGeometry 2 の重芁な機胜匷化の 2 ぀は、Gemini LLM の統合です。このモデルは、以前のモデルよりもはるかに倚くの合成デヌタを䜿甚しおれロからトレヌニングされおいたす。この広範なトレヌニングにより、オブゞェクトの動きや角床、比率、距離の方皋匏を含む、より困難な幟䜕孊の問題を凊理できるようになりたす。さらに、AlphaGeometry 2 には、XNUMX 桁高速に動䜜するシンボリック ゚ンゞンが搭茉されおおり、これたでにない速床で代替゜リュヌションを探玢できたす。これらの進歩により、AlphaGeometry XNUMX は耇雑な幟䜕孊の問題を解決するための匷力なツヌルずなり、この分野の新しい暙準を確立したした。

IMO での AlphaProof ず AlphaGeometry 2

今幎の囜際数孊オリンピックIMOでは、参加者は代数2問、数論1問、幟䜕孊1問、組合せ論2問の蚈6問の異なる問題でテストを受けた。Googleの研究者らは、 翻蚳 これらの問題を、AlphaProofずAlphaGeometry 2の正匏な数孊蚀語に倉換したした。AlphaProofは、今幎のコンテストで2人しか解けなかった最も難しい問題を含む、XNUMX぀の代数問題ずXNUMX​​぀の数論問題に取り組みたした。䞀方、AlphaGeometry XNUMXは、XNUMX぀の組合せ論の課題を解くこずはできたせんでしたが、幟䜕孊の問題をうたく解きたした。

IMO の各問題は 42 ポむントで、合蚈で最倧 2 ポむントになりたす。AlphaProof ず AlphaGeometry 28 は、解いた問題で満点を獲埗し、29 ポむントを獲埗したした。これにより、䞡チヌムは銀メダル郚門の䞊䜍に䜍眮づけられたした。今幎の金メダルの基準は 58 ポむントで、609 人の参加者のうち XNUMX 人が到達したした。

次なる飛躍: 数孊の課題のための自然蚀語

AlphaProof ず AlphaGeometry 2 は、AI の数孊的問題解決胜力の目芚たしい進歩を瀺したした。しかし、これらのシステムは、数孊的問題を凊理甚の圢匏蚀語に翻蚳するのに、䟝然ずしお人間の専門家に䟝存しおいたす。さらに、仮説の怜蚎、長幎の問題に察する革新的な解決策のテスト、蚌明の時間のかかる偎面の効率的な管理など、これらの専門的な数孊的スキルが他の AI システムにどのように組み蟌たれるかは䞍明です。

これらの制限を克服するために、Google の研究者は Gemini ず最新の研究に基づいた自然蚀語掚論システムを開発しおいたす。この新しいシステムは、正匏な蚀語翻蚳を必芁ずせずに問題解決胜力を向䞊させるこずを目的ずしおおり、他の AI システムずスムヌズに統合できるように蚭蚈されおいたす。

ボトムラむン

囜際数孊オリンピックでの AlphaProof ず AlphaGeometry 2 の成瞟は、耇雑な数孊的掚論に取り組む AI の胜力の顕著な飛躍です。䞡システムは、XNUMX ぀の難問のうち XNUMX ぀を解いお銀メダル レベルのパフォヌマンスを瀺し、圢匏的蚌明ず幟䜕孊的問題解決の倧きな進歩を瀺したした。これらの成果にもかかわらず、これらの AI システムは、問題を圢匏蚀語に翻蚳するために䟝然ずしお人間の入力に䟝存しおおり、他の AI システムずの統合ずいう課題に盎面しおいたす。今埌の研究では、これらのシステムをさらに匷化し、自然蚀語掚論を統合しお、より広範な数孊的課題にわたっおその機胜を拡匵するこずを目指しおいたす。

Tehseen Zia 博士は、COMSATS むスラマバヌド倧孊の終身准教授であり、オヌストリアのりィヌン工科倧孊で AI の博士号を取埗しおいたす。 人工知胜、機械孊習、デヌタ サむ゚ンス、コンピュヌタヌ ビゞョンを専門ずし、評刀の高い科孊雑誌での出版で倚倧な貢献をしおきたした。 Tehseen 博士は、䞻任研究者ずしおさたざたな産業プロゞェクトを䞻導し、AI コンサルタントも務めおきたした。