Unite.AI - AI News & Research

お知らせ12 months ago

Gemini 2.5 Proが登場——そして再びAIのゲームを変える

GoogleはGemini 2.5 Proを発表し、これをこれまでで「最も知的なAIモデル」と呼んでいます。Google DeepMindチームによって開発されたこの最新の大規模言語モデルは、回答する前に内部的に段階を踏んで推論することで複雑な問題に取り組むように設計された「思考モデル」と説明されています。初期のベンチマークはGoogleの自信を裏付けています：Gemini 2.5 Pro（2.5シリーズの実験的な初リリース）は、LMArenaリーダーボードでAIアシスタントの第1位に大きな差をつけてデビューし、コーディング、数学、科学タスクの多くの標準テストをリードしています。Gemini 2.5 Proの主な新機能と特徴は以下の通りです：連鎖思考推論：より単純なチャットボットとは異なり、Gemini 2.5 Proは問題を内部的に明示的に「考え抜きます」。これにより、巧妙な論理パズルから複雑な計画タスクまで、難しいクエリに対してより論理的で正確な答えが導かれます。最先端のパフォーマンス： Googleによると、2.5 Proは多くのベンチマークでOpenAIとAnthropicの最新モデルを上回っています。例えば、Humanity’s Last Examのような難しい推論テストで新記録を樹立し（OpenAIのモデルの14%、Anthropicの8.9%に対して18.8%を獲得）、アンサンブル投票のような高コストなトリックを必要とせずに様々な数学および科学チャレンジをリードしています。高度なコーディングスキル：このモデルは、前身モデルに比べてコーディング能力が大幅に向上しています。ウェブアプリや自律的な「エージェント」スクリプトのためのコード生成と編集に優れています。SWE-Benchコーディングベンチマークでは、Gemini 2.5 Proは63.8%の成功率を達成——OpenAIの結果を大きく上回りましたが、Anthropicの専門化されたClaude 3.7 “Sonnet”モデル（70.3%）にはわずかに及ばない結果でした。マルチモーダル理解：以前のGeminiモデルと同様に、2.5 Proはネイティブマルチモーダルです——1つの会話内でテキスト、画像、音声、さらには動画やコード入力を受理し、それらについて推論できます。この汎用性は、単一セッション内で画像を説明し、プログラムをデバッグし、スプレッドシートを分析する可能性があることを意味します。...