MiniMaxがM2.7をオープンソース化 – 自己進化型エージェントモデル
中国のAI企業であるMiniMaxは、MiniMax M2.7の重みをリリースしました。これは、229億パラメータのMixture-of-Expertsモデルで、自身の開発サイクルに参加しました。会社によると、これは自己進化型AIの第一歩です。元々は3月18日に発表されましたが、MiniMax M2.7は現在、Hugging Faceで無料で利用可能です。SGLang、vLLM、Transformers、NVIDIA NIMに対するデプロイメントサポートも提供されています。このモデルは、SWE-Proで56.22%、Terminal Bench 2で57.0%のスコアを獲得し、オープンソースLLMの中で最も強力なものの1つとなっています。モデルが自分自身を構築する方法M2.7について最も注目すべきことは、その自己イテレーションへの参加です。MiniMaxは、内部バージョンのモデルをプログラミングスキャフォールドの最適化に割り当て、100ラウンド以上を自律的に実行しました。プロセス中、M2.7は失敗トラジェクトリを分析し、スキャフォールドコードを変更し、評価を実行し、各変更を保持または元に戻すことを決定しました。モデルは、自己で最適化を発見しました。温度や頻度ペナルティなどの最適なサンプリングパラメータを体系的に検索し、ファイル間でバグパターンを自動的にチェックするワークフローガイドラインを設計し、エージェントループにループ検出を追加しました。MiniMaxは、この自律プロセスから内部評価セットの30%のパフォーマンス改善を報告しています。MiniMaxの強化学習チーム内では、M2.7は現在、日常のワークフローを30%から50%処理しています。研究者は、重要な決定のみに関与し、モデルは文献レビュー、実験追跡、データパイプライン、デバッグ、メルジリクエストを管理しています。MiniMaxはまた、MLE Bench LiteでM2.7をテストしました。これは、OpenAIの22の機械学習コンペティションのスイートで、単一のA30 GPUで実行されます。3回の24時間トライアルで、モデルのベストランは9つの金メダル、5つの銀メダル、1つの銅メダルを獲得しました。平均メダル率は66.6%で、Gemini 3.1と並び、Opus 4.6(75.7%)とGPT-5.4(71.2%)に次ぐものでした。エンジニアリングとオフィスワークのベンチマークパフォーマンスソフトウェアエンジニアリングのベンチマークでは、M2.7は最先端のクローズドソースモデルに匹敵または近づいています。SWE-Proでの56.22%のスコアは、GPT-5.3-Codexと一致しています。VIBE-Proでは55.6%のスコアを獲得し、SWE Multilingualでは76.5、Multi SWE Benchでは52.7を獲得しました。AIコードジェネレーターを超えて、MiniMaxはM2.7をプロフェッショナルオフィスタスクに位置付けました。GDPval-AAでは、45モデルのドメインエキスパートを評価し、M2.7はオープンソースモデルの中で最高の1495のELOスコアを獲得しました。Opus 4.6、Sonnet 4.6、GPT-5.4に次ぐものでした。Toolathonでは46.3%の精度を達成し、MiniMaxのMM Claw評価では、40の複雑なスキル(それぞれ2,000トークンを超える)で97%のスキルコンプライアンス率を維持しました。モデルは、MiniMaxがAgent Teamsと呼ぶネイティブのマルチエージェントコラボレーションをサポートしています。ここで、複数のモデルインスタンスは、タスクで協力しながら異なるロールアイデンティティを維持します。この機能は、安定したロール境界とエージェント間の対立的な推論が必要なビジネスオートメーションのためのAIエージェントシナリオをターゲットにします。MiniMaxは、M2.7をMixture-of-Expertsアーキテクチャで構築しました。つまり、229億の合計パラメータのうち、サブセットのみが単一の推論パス中にアクティブ化されます。これにより、モデルは、同等の出力品質の密なモデルよりも安価で高速に提供できます。これは、開発者がモデルをローカルで実行したい場合、または限られたインフラストラクチャで実行したい場合に重要な考慮事項です。MiniMaxはまた、OpenRoomをオープンソース化しました。これは、AIによって構築されたインタラクティブなデモで、エージェントのインタラクションをリアルタイムのビジュアルフィードバックとともにWeb GUI内に配置し、大規模な言語モデルを生産性の向上を超えてインタラクティブなエンターテイメントに拡張するという会社の意欲を示しています。リリースにより、Meta、Alibaba、DeepSeekのモデルが境界を押し広げているオープンウェイトエージェントスキルのランドスケープに、もう1つの競合オプションが追加されました。自己進化の角度 – モデルが自分自身の後継者を改善するために有意義に貢献する – はまだ初期段階ですが、M2.7は、100以上の自律的な最適化ラウンドから30%の内部ベンチマークの改善を提供し、ループ内に人間の介入はありません。