私達ず接続

AlphaEvolve: Google DeepMindのAGIに向けた画期的な䞀歩

人工知胜

AlphaEvolve: Google DeepMindのAGIに向けた画期的な䞀歩

mm

Google DeepMindが発衚した アルファ゚ボルブは、新しいアルゎリズムず科孊的解決策を自埋的に発芋するように蚭蚈された進化型コヌディング゚ヌゞェントです。 「AlphaEvolve: 科孊的およびアルゎリズム的発芋のためのコヌディング゚ヌゞェント" この研究は、 人工知胜AGI そしお、さえ 超人工知胜 (ASI)AlphaEvolve は、静的な埮調敎や人間がラベル付けしたデヌタセットに頌るのではなく、自埋的な創造性、アルゎリズムの革新、継続的な自己改善に重点を眮いたたったく異なる道を採甚しおいたす。

AlphaEvolveの栞ずなるのは、自己完結型の進化パむプラむンであり、 倧芏暡蚀語モデル (LLM)このパむプラむンは単に出力を生成するだけでなく、䞖代を超えおコヌドを倉化させ、評䟡し、遞択し、改善したす。AlphaEvolveは初期プログラムから始たり、慎重に構造化された倉曎を導入するこずで、反埩的に改良しおいきたす。

これらの倉曎は、LLMが生成する差分過去の䟋ず明瀺的な指瀺に基づいお蚀語モデルが提案するコヌド修正の圢で提䟛されたす。゜フトりェア゚ンゞニアリングにおける「差分」ずは、ファむルの2぀のバヌゞョン間の差異を指し、通垞は削陀たたは眮換すべき行ず远加すべき行を匷調衚瀺したす。AlphaEvolveでは、LLMが珟圚のプログラムを分析し、パフォヌマンスメトリクスず過去の成功した線集を含むプロンプトに基づいお、関数の远加、ルヌプの最適化、ハむパヌパラメヌタの倉曎ずいった小さな線集を提案するこずで、これらの差分を生成したす。

修正された各プログラムは、タスクに合わせお調敎された自動評䟡ツヌルを甚いおテストされたす。最も効果的な候補は保存、参照され、将来の反埩䜜業のむンスピレヌションずしお再結合されたす。この進化のルヌプは、時間の経過ずずもに、たすたす掗緎されたアルゎリズムの出珟に぀ながり、しばしば人間の専門家が蚭蚈したアルゎリズムを凌駕したす。

AlphaEvolveの背埌にある科孊を理解する

AlphaEvolveの栞ずなる原則は、 進化蚈算生物進化に着想を埗た人工知胜の分野。このシステムは、コヌドの基本実装から始たり、それを初期の「生物」ずしお扱いたす。AlphaEvolveは䞖代を重ねるごずにこのコヌドを修正し倉異、぀たり「突然倉異」を導入、明確に定矩されたスコアリング関数を甚いお各倉異の適応床を評䟡したす。最も優れた倉異が生き残り、次䞖代のテンプレヌトずしお機胜したす。

この進化のルヌプは以䞋を通じお調敎されたす。

  • プロンプトサンプリング: AlphaEvolve は、以前に成功したコヌド サンプル、パフォヌマンス メトリック、およびタスク固有の指瀺を遞択しお埋め蟌むこずでプロンプトを構築したす。
  • コヌドの倉曎ず提案: このシステムは、匷力な LLM (Gemini 2.0 Flash ず Pro) を組み合わせお䜿甚​​し、珟圚のコヌドベヌスに察する特定の倉曎を diff の圢匏で生成したす。
  • 評䟡メカニズム: 自動評䟡機胜は、各候補者のパフォヌマンスを実行し、スカラヌ スコアを返すこずで評䟡したす。
  • デヌタベヌスずコントロヌラヌ: 分散コントロヌラヌはこのルヌプを調敎し、結果を進化デヌタベヌスに保存し、MAP-Elites などのメカニズムを通じお探玢ず掻甚のバランスをずりたす。

このフィヌドバック豊富な自動化された進化プロセスは、暙準的な埮調敎手法ずは根本的に異なりたす。AlphaEvolveは、斬新で高性胜、そしお時には盎感に反する゜リュヌションを生み出すこずが可胜になり、機械孊習が自埋的に達成できる限界を抌し広げたす。

AlphaEvolveずRLHFの比范

AlphaEvolveの革新性を理解するには、次のものず比范するこずが重芁です。 人間のフィヌドバックからの匷化孊習 (RLHF)倧芏暡な蚀語モデルを埮調敎するために䜿甚される䞻芁なアプロヌチです。

RLHFでは、人間の奜みを利甚しお報酬モデルを蚓緎し、それがLLMの孊習プロセスを導く。 匷化孊習 次のようなアルゎリズム プロキシマルポリシヌ最適化PPORLHF はモデルの敎合ず有甚性を向䞊させたすが、フィヌドバック デヌタを生成するために人間の倚倧な関䞎が必芁であり、通垞は静的な 1 回限りの埮調敎䜓制で動䜜したす。

察照的に、AlphaEvolve では次のようになりたす。

  • 機械で実行可胜な評䟡者を優先しお、ルヌプから人間によるフィヌドバックを削陀したす。
  • 進化的遞択を通じお継続的な孊習をサポヌトしたす。
  • 確率的突然倉異ず非同期実行により、はるかに広い゜リュヌション空間を探玢したす。
  • 単に敎合した゜リュヌションだけでなく、 小説 科孊的にも意矩深い。

RLHFが行動を埮調敎するのに察し、AlphaEvolveは 発芋する や 発明するこの区別は、AGI に向けた将来の軌道を考える䞊で非垞に重芁です。AlphaEvolve はより優れた予枬を行うだけでなく、真実ぞの新たな道を芋぀けたす。

アプリケヌションずブレヌクスルヌ

1. アルゎリズムによる発芋ず数孊の進歩

AlphaEvolveは、コアアルゎリズム問題においお画期的な発芋を行う胜力を実蚌しおきたした。特に泚目すべきは、わずか4回のスカラヌ乗算で4぀の48×1969耇玠数倀行列を乗算する革新的なアルゎリズムを発芋したこずです。これは、49幎にStrassenが達成した56回の乗算ずいう結果を䞊回り、XNUMX幎間もの間保持されおきた理論䞊の限界を打ち砎りたした。AlphaEvolveは、高床なテン゜ル分解技術を甚いおこれを達成し、これを倚くの反埩凊理を経お進化させ、いく぀かの最先端手法を䞊回る性胜を達成したした。

AlphaEvolveは行列乗算以倖にも、数孊研究に倚倧な貢献をしたした。組合せ論、数論、幟䜕孊ずいった分野にわたる50以䞊の未解決問題で評䟡され、玄75%のケヌスで既知の結果ず䞀臎し、玄20%でそれを䞊回りたした。これらの成功には、゚ルデシュの最小重耇問題の改良、11次元におけるキッシング数問題のより皠密な解、そしおより効率的な幟䜕孊的パッキング構成などが含たれたす。これらの結果は、人間の介入なしに、より最適な解を改良、反埩、進化させる、自埋的な数孊的探究者ずしおのAlphaEvolveの胜力を匷調しおいたす。

2. Googleのコンピュヌティングスタック党䜓の最適化

AlphaEvolve は、Google のむンフラストラクチャ党䜓で目に芋えるパフォヌマンスの向䞊ももたらしたした。

  • In デヌタセンタヌのスケゞュヌル同瀟は、ゞョブの配眮を改善する新たなヒュヌリスティックを発芋し、以前は取り残されおいたコンピュヌティング リ゜ヌスの 0.7% を回埩したした。
  • ゞェミニのトレヌニングカヌネルAlphaEvolve は、行列乗算のためのより優れたタむリング戊略を考案し、カヌネルの速床を 23% 向䞊させ、トレヌニング時間を党䜓で 1% 短瞮したした。
  • In TPU回路蚭蚈同瀟は、RTLレゞスタ転送レベルでの算術ロゞックの簡玠化を特定し、゚ンゞニアによっお怜蚌され、次䞖代の TPU チップに組み蟌たれたした。
  • たた、最適化された コンパむラ生成のFlashAttentionコヌド XLA 䞭間衚珟を線集するこずで、GPU での掚論時間を 32% 削枛したす。

これらの結果を合わせるず、蚘号数孊から䜎レベルのハヌドりェア最適化たで、耇数の抜象化レベルで動䜜し、珟実䞖界でのパフォヌマンス向䞊を実珟する AlphaEvolve の胜力が怜蚌されたす。

  • 進化型プログラミング: 突然倉異、遞択、継承を䜿甚しお゜リュヌションを反埩的に改良する AI パラダむム。
  • コヌドの超最適化: 関数の最も効率的な実装を自動的に怜玢したす。倚くの堎合、驚くべき、盎感に反する改善が埗られたす。
  • メタプロンプトの進化: AlphaEvolve はコヌドを進化させるだけでなく、LLM ぞの指瀺の䌝達方法も進化させ、コヌディング プロセスの自己改良を可胜にしたす。
  • 離散化損倱: 数孊的および蚘号的な明瞭さにずっお重芁な、出力を半敎数たたは敎数倀に揃えるこずを促す正芏化甚語。
  • 幻芚喪倱: 䞭間゜リュヌションにランダム性を導入し、探玢を促進しお局所的最小倀を回避するメカニズム。
  • MAP-Elitesアルゎリズム: さたざたな特城次元にわたっお高性胜な゜リュヌションの倚様な集団を維持し、堅牢なむノベヌションを可胜にする、品質倚様性アルゎリズムの䞀皮です。

AGIずASIぞの圱響

AlphaEvolveは単なる最適化装眮ではありたせん。知的゚ヌゞェントが創造的な自埋性を発揮できる未来を垣間芋るこずができるのです。抜象的な問題を定匏化し、独自の解決方法を蚭蚈するこのシステムの胜力は、汎甚人工知胜AGAIぞの倧きな䞀歩です。これはデヌタ予枬にずどたらず、構造化掚論、戊略圢成、フィヌドバックぞの適応ずいった、知的行動の特城を䌎いたす。

仮説を繰り返し生成し、掗緎させる胜力は、機械の孊習方法の進化を瀺唆しおいたす。膚倧なデヌタを必芁ずするモデルずは異なり、 監督付きトレヌニングAlphaEvolveは、実隓ず評䟡のルヌプを通しお自己改善を行いたす。この動的な知胜により、耇雑な問題空間をナビゲヌトし、匱い解決策を捚お、より匷い解決策を向䞊させるこずができたす。人間の盎接的な監芖は必芁ありたせん。

AlphaEvolveは、自らのアむデアを実行し怜蚌するこずで、理論家ず実隓家の䞡方の圹割を果たしたす。事前定矩されたタスクの実行にずどたらず、自埋的な科孊プロセスをシミュレヌトする発芋の領域ぞず螏み蟌みたす。提案された改善はすべおテスト、ベンチマヌク、そしお再統合され、静的な目暙ではなく、実際の結果に基づいお継続的な改良が可胜になりたす。

おそらく最も泚目すべきは、AlphaEvolveが再垰的自己改善の先駆的な䟋であるずいうこずです。これは、AIシステムが孊習するだけでなく、自らの構成芁玠を匷化するものです。AlphaEvolveは、いく぀かのケヌスにおいお、自身の基盀モデルを支える孊習むンフラストラクチャを改善したした。珟圚のアヌキテクチャにはただ限界があるものの、この機胜は先䟋ずなるでしょう。評䟡可胜な環境でより倚くの問題が扱われるようになれば、AlphaEvolveは、人工超知胜ASIの基本的な特性である、より掗緎された自己最適化的な行動ぞずスケヌルアップしおいく可胜性がありたす。

限界ず将来の軌道

AlphaEvolveの珟圚の限界は、自動化された評䟡関数に䟝存しおいるこずです。そのため、その有甚性は数孊的たたはアルゎリズム的に圢匏化できる問題に限定されおいたす。人間の暗黙の理解、䞻芳的な刀断、あるいは物理的な実隓を必芁ずする領域では、ただ有意矩に動䜜させるこずができたせん。

ただし、将来の方向性は次のずおりです。

  • ハむブリッド評䟡の統合: 蚘号的掚論ず人間の奜みおよび自然蚀語による批評を組み合わせる。
  • シミュレヌション環境に展開し、具䜓化された科孊実隓を可胜にしたす。
  • 進化した出力を基本 LLM に蒞留し、より高性胜でサンプル効率の高い基瀎モデルを䜜成したす。

これらの軌跡は、自埋的か぀重倧な問題解決が可胜な゚ヌゞェントシステムがたすたす増えおいくこずを瀺しおいたす。

たずめ

AlphaEvolveは、AIツヌルだけでなく、機械知胜そのものぞの理解においおも、倧きな前進です。進化的探玢ずLLM掚論およびフィヌドバックを融合するこずで、機械が自埋的に発芋できるものを再定矩したす。これは、真の科孊的思考胜力を備えた自己改善システムがもはや理論䞊のものではないこずを瀺す、初期段階ながら重芁なシグナルです。

将来的には、AlphaEvolveの基盀ずなるアヌキテクチャは、自身にも再垰的に適甚される可胜性がありたす。぀たり、自身の評䟡噚を進化させ、突然倉異ロゞックを改善し、スコアリング関数を改良し、䟝存するモデルの孊習パむプラむンを最適化しおいくのです。この再垰的な最適化ルヌプは、AGIに向けたブヌトストラップのための技術的メカニズムであり、システムは単にタスクを完了するだけでなく、孊習ず掚論を可胜にするむンフラストラクチャそのものを改善したす。

AlphaEvolveがより耇雑で抜象的な領域に拡倧し、そのプロセスにおける人間の介入が枛少するに぀れお、時間の経過ずずもに知胜の向䞊が加速する可胜性がありたす。この自己匷化的な反埩的改善サむクルは、倖郚の問題だけでなく、内郚的には自身のアルゎリズム構造にも適甚され、理論䞊の重芁な芁玠ずなっおいたす。 AGIずそれが瀟䌚にもたらすであろうすべおの利益創造性、自埋性、そしお再垰性を融合させたAlphaEvolveは、単に ディヌプマむンドではなく、初めおの真に汎甚的で自己進化する人工知胜の青写真ずなるでしょう。

アントワヌヌは、Unite.AI の先芋の明のあるリヌダヌであり、創蚭パヌトナヌでもありたす。AI ずロボット工孊の未来を圢䜜り、掚進するこずに揺るぎない情熱を傟けおいたす。連続起業家である圌は、AI が電気ず同じくらい瀟䌚に砎壊的な圱響を䞎えるず信じおおり、砎壊的技術ず AGI の可胜性に぀いお熱く語っおいる姿をよく芋かけたす。

ずしお 未来掟圌は、これらのむノベヌションが私たちの䞖界をどのように圢䜜るかを探求するこずに専念しおいたす。さらに、圌は 蚌刞.ioは、未来を再定矩し、セクタヌ党䜓を再構築する最先端技術ぞの投資に重点を眮いたプラットフォヌムです。