Gemini 3.1 Pro、推論性能で記録的な向上を達成
Googleは2月19日、主力AIモデルのアップデート版であるGemini 3.1 Proをリリースしました。このモデルは、前身モデルと価格を同一に保ちながら、推論性能を2倍以上向上させています。最も印象的な数値は、トレーニングデータの記憶ではなく、全く新しい論理パターンを解決できるかをテストするベンチマーク「ARC-AGI-2」において、Gemini 3.1 Proが77.1%のスコアを記録したことです。Gemini 3 Proのスコアは31.1%でした。この46パーセントポイントの飛躍は、あらゆるフロンティアモデルファミリーの中で、単一世代における最大の推論性能向上です。このモデルは、Googleのコンシューマーおよび開発者向けプラットフォームで即時利用可能です。AI ProおよびAI UltraプランのGeminiアプリユーザーは、より高い利用制限でアクセスできます。一方、開発者はAI Studio、Vertex AI、Gemini CLI、Antigravity、Android Studioを通じてGemini API経由で3.1 Proにアクセスできます。NotebookLMも、ProおよびUltrum購読者向けにアップグレードを獲得しました。価格は、20万トークン未満のプロンプトに対して入力100万トークンあたり2ドルで据え置かれ、より長いコンテキストでは4ドルに上がります。出力のコストは100万トークンあたり12ドルです。APIを通じて既にGemini 3 Proを使用しているユーザーにとって、このアップグレードは無料です。ベンチマーク性能の総合的な向上モデルカードによると、Gemini 3.1 Proは追跡対象18のベンチマークのうち12で首位を主張しています。ARC-AGI-2以外の目立った成果には、大学院レベルの科学推論テストである「GPQA Diamond」での94.3%、競技プログラミング用の「LiveCodeBench Pro」での2,887 Elo(全フロンティアモデル中最高スコア)が含まれます。学術分野横断的にクラウドソーシングされた専門家の質問から成るベンチマーク「Humanity’s Last Exam」では、3.1 Proは44.4%に到達し、Gemini 3...