Alex McFarlandは、人工知能の最新の開発を探求するAIジャーナリスト兼ライターです。彼は、世界中の数多くのAIスタートアップや出版物と共同しています。
Thinking Machines Lab、元OpenAIのCTOであるMira Muratiによって設立されたAIスタートアップは、2026年5月11日に、同社の最初のインハウスモデルに関する研究プレビューを公開しました。これは、同社が実際に何を構築するかについて1年以上沈黙を続けていたことを終わらせたものです。同社は、このシステムを「インタラクションモデル」と呼んでいます。オーディオ、ビデオ、テキストを200ミリ秒のチャンクで処理するために、スクラッチから訓練されたマルチモーダルアーキテクチャです。ユーザーがターンを終了するのを待つのではなく、200ミリ秒ごとに処理します。モデルは、TML-Interaction-Smallと呼ばれ、276億パラメータの専門家の混合システムで、12億のアクティブパラメータを備えています。同社の発表ブログ投稿によると、これは、約2億ドルの資金を約120億ドルの評価で調達した後に何も出荷しなかったラボからの最初の製品です。同社の最初の製品は、Tinkerという名前で、2025年10月に公開されたオープンウェイトモデルのファインチューニングAPIでした。リリースは、人材の離脱や次の資金調達ラウンドが停滞している状況の中で行われました。インタラクションモデルが実際に何をするかThinking Machinesは、現在の最先端モデル、例えばOpenAIのGPT-RealtimeやGoogleのGemini Liveは、ターンベースのアーキテクチャに「ハーネス」と呼ばれる外部コンポーネントを追加してリアルタイムの動作を実現していると主張しています。例えば、ボイスアクティビティ検出などのコンポーネントは、ユーザーが話し終わったかどうかを判断し、完了した発話をモデルに渡します。モデルは応答を生成する間、世界の認識が凍結されます。インタラクションモデルは、このような外部コンポーネントを「時間同期マイクロターン」と呼ばれるものに置き換えます。システムは、200ミリ秒の入力と出力を同時に処理し、トークンストリームを同じクロックサイクルで交互に処理します。この構造により、モデルはユーザーの発言の中断、視覚的なヒントへの反応、または同時通訳などのタスクでユーザーと同時に話すことができます。アーキテクチャは、独立したエンコーダーを省略しています。オーディオは、dMel featuresとして、軽量な埋め込み層を介して入力され、画像は40×40のパッチに分割され、すべてのコンポーネントはスクラッチから訓練され、トランスフォーマーと共に訓練されます。別のバックグラウンドモデルは、非同期に実行され、より深い推論、ツール呼び出し、ウェブブラウジングを処理しますが、インタラクションモデルは会話に留まります。同社が報告したベンチマークによると、TML-Interaction-Smallは、FD-bench V1でターンをとる遅延が0.40秒であるのに対し、GPT-Realtime-2.0の最小思考モードでは1.18秒、Gemini-3.1-flash-liveでは0.57秒でした。FD-bench V1.5では、ユーザーの割り込み、バックチャンネル、バックグラウンドスピーチを介したインタラクションの品質を評価し、モデルは77.8点を獲得しました。一方、GPT-Realtime-2.0の最小思考モードでは46.8点、Gemini-3.1-flash-liveの高度思考モードでは45.5点でした。数字は自己報告です。長らく待ちに待った最初の出荷リリースは、資金調達と製品の間の長いギャップを埋めました。Thinking Machinesは2025年2月に設立され、同年7月に120億ドルの評価で20億ドルのシードラウンドを閉じました。これは、記録上最大のシードラウンドと広く報告されています。ラウンドはAndreessen Horowitzが主導し、Nvidia、AMD、Cisco、Accel、ServiceNow、Jane Streetが参加しました。現在までに同社が出荷した唯一の製品は、2025年10月に公開されたオープンウェイトモデルのファインチューニングAPIであるTinkerでした。その間、同社は人材の離脱や資金調達の混乱に直面しました。共同創設者のBarret ZophとLuke Metzは2026年1月にOpenAIに戻り、Muratiは同社が「Zophと別れた」と発表しました。Andrew Tullochは、Mark Zuckerbergが同社を全額買収するために10億ドルの提示をしたが却下された後、MetaのSuperintelligence Labsに移籍しました。Metaは、以来、同社の5人の創設メンバーを雇用しました。Muratiは、PyTorchの共同創設者であるSoumith ChintalaをCTOに昇格させました。2025年末までに、約500億ドルの評価で次のラウンドが閉じられませんでした。コンピューティングの話は反対の方向に進みました。3月、Thinking Machinesは、Nvidiaとのパートナーシップを発表しました。これには、非公開の投資と、少なくとも1ギガワットの次世代Vera Rubinシステムの展開が含まれます。同社はまた、Nvidia GB300ハードウェア上の最先端モデルのトレーニングをカバーするために、Google Cloudとの関係を拡大しました。注目すべき点インタラクションモデルはまだ、企業や一般の人々に利用できません。Thinking Machinesは、限定された研究プレビューが間もなく選択されたパートナーに公開され、2026年後半により広く公開される予定であると述べています。同社は、現在の276億パラメータのバージョンは、必要な遅延で提供できる最小のバージョンであるため、大きいインタラクションモデルも公開する予定です。ベンチマークの主張の独立した検証が、すぐに検討されるべき点です。FD-benchは、インタラクションの品質を対象とする少数のパブリックベンチマークの1つであり、Thinking Machinesのスコアはまだ第三者によって現実的な負荷の下で再現されていません。同社が導入した視覚的なヒントのためのプロアクティブテスト、例えばRepCount-A、ProactiveVideoQA、Charadesの改訂版は、新しいツールであり、確立されたベースラインがありません。戦略的な賭けはより明確です。OpenAI、Anthropic、Googleが、自律エージェントの機能を1年間推進してきた一方で、Thinking Machinesは、次の競争軸が人間とAIのコミュニケーションの方法であると賭けています。つまり、連続した会話よりも一連のプロンプトに近いものです。インタラクションモデルは、OpenAI、Google、そして成長しているスピーチに焦点を当てたスタートアップからのリアルタイムボイスAIシステムと直接競合しています。アーキテクチャが、長いセッション、信頼性の低い接続、リアルタイム拒否の安全性の制約などの生産性のあるワークロードとの接触に耐えられるかどうかが、次のプレビューラウンドで課せられるテストです。
アンソロピックは水曜日にスペースXとの契約を締結し、コロッサス1データセンターの全コンピューティングフットプリントをリースし、300メガワット以上の容量と22万以上のNVIDIA GPUを獲得し、会社によると1ヶ月以内にオンラインになる予定です。この契約により、スペースXはクロードのトップティアコンピューティングサプライヤーとなり、アンソロピックがモデル発売と有料ティアの需要の増加前に容量を確保していることを強調しています。この取り決めは2つの点で異常です。コロッサス1はテネシー州メンフィスでGrokのトレーニングのために構築され、現在は競合する研究所に全額引き渡されます。スペースXは、2月にxAIと合併し、1250億ドルの評価額で、アンソロピックとの契約を通じて、合併されたエンティティをクラウドの家主としてではなく、AI開発者としてではなく位置付けました。より高いレート制限がすぐに到着アンソロピックは新しい容量を使用して制限を緩和しています。5時間のレート制限は、クロードコードのPro、Max、Team、シートベースのエンタープライズプランで2倍になります。ピーク時間の制限削減は、米国の営業時間中にProとMaxアカウントを絞るもので、完全に削除されました。APIレート制限は、クロードオーパスモデルで大幅に上昇しています。Tier 1の入力は30,000から500,000トークン/分に、出力は8,000から80,000に増加します。Tier 4の顧客は、入力制限が200万から1,000万トークン/分に、出力が40万から80万に上昇します。すべての4つのTierで、約1桁の増加は、価格ではなくコンピューティングが大容量顧客のボトルネックであったことを示しています。コンピューティングパートナーの増加するリストスペースXの契約は急速に拡大するポートフォリオに加わります。アンソロピックは別途、最大5ギガワットの契約をアマゾンと締結し、5ギガワットの契約をGoogleとBroadcomと締結し、マイクロソフトとNVIDIAとの戦略的パートナーシップを30億ドル相当のAzure容量で締結し、500億ドルの米国データセンターの増強をFluidstackと締結しました。これらのコミットメントは、6ヶ月間で10ギガワットを超えるコンピューティングを予約しました。会社は次のラウンドで900億ドルの評価額を検討しています。アンソロピックは、クロードをNVIDIA GPU、Google TPU、AWS Trainiumチップの混合でトレーニングおよび実行していると述べています。スペースXをコロッサス1のシングルテナントの家主として追加しても、ハードウェアミックスは変わりませんが、Elon Muskのインフラストラクチャに直接結び付けられていることを意味します。MuskのGrok製品はクロードと直接競合しています。両社はまた、2月から公に推進している、多ギガワットの軌道AIコンピューティング容量を共同で開発することに興味があると述べました。なぜスペースXは突然コンピューティングの家主になったのかスペースX側の枠組みは、コロッサス1がxAIがGrokのトレーニングを近くのコロッサス2施設に移した後に余分な容量になったというものです。MuskがXに投稿したコメントによると、xAIはもう両方のサイトが必要なくなり、アンソロピックに未使用の容量を販売することで、スペースXの予定されているIPOの前に資産を金銭化することができました。これはまだ異常な逆転です。コロッサス1は、わずか1年前にxAIのフラグシップトレーニングクラスターでした。このピボットは、xAIの内部の動揺に続きます。ここで、会社の名前のある共同創設者のほとんどが2026年初頭以来に出て行き、合併されたスペースX-xAIエンティティは、インフラストラクチャ収入にますます依存しています。アンソロピックにとって、政治的な光学的には回避策が必要でした。会社の発表では、「この規模の投資を支援する法的および規制フレームワークを持つ民主的な国々とのみ提携する」と強調しています。歴史的に、この言葉はMuskの公的な姿勢とは対照的に読まれてきました。アンソロピックは、スペースXの契約自体にはそのフレーミングを延長しませんでした。3つの質問が残ります。まず、アンソロピックが支払う金額は何ですか。財務条件は開示されませんでしたが、報告によると、コロッサス1はスペースXの商用コンピューティングフリートの重要なシェアを表すため、契約は数十億ドル規模である可能性があります。2番目に、取り決めはマイクロソフトでのさらなる解体を加速させるでしょうか。マイクロソフトは最近、OpenAIの独占契約を緩和しました。3番目に、アンソロピックの別のコミットメントは、米国のデータセンターの消費者電気料金の増加を吸収できるでしょうか。会社の契約容量が10ギガワットを超えたときに、どのようになるでしょうか。
Stripeは4月29日に、自律的なAIエージェントの時代に特化したデジタルウォレットを立ち上げ、消費者がソフトウェアエージェントに購入、予約、請求書の支払いを許可できるようにした。この許可は、基本的なカードまたは銀行の資格情報を公開することなく行われる。この製品は、Linkのエージェント用ウォレットと呼ばれ、サンフランシスコで開催されたStripe Sessions会議で発表された、通常は大規模な製品リリースの288の新機能とAPIのうち、消費者向けの見出しとなる。CEOのPatrick Collisonは、このバンドルを「AIのための経済インフラ」と位置付け、「近い将来、エージェントがオンラインでのほとんどの取引を占める」と主張した。この立ち上げにより、Link — Stripeが所有する250万以上のユーザーが利用する消費者向けウォレット — は、Stripeとその競合他社が過去18ヶ月間で構築しようとしてきた、エージェント間の電子商取引の時代の最初の主流支付表面となった。エージェントウォレットの実際の動作Stripeの提案は、消費者がエージェントの利便性と資格情報のセキュリティの間で選択する必要はないというものである。Stripeのアーキテクチャの説明によると、ユーザーはまず、標準的なOAuthフローを通じて、エージェント — 例えば、OpenClawショッピングアシスタント — にLinkウォレットへのアクセスを許可する。エージェントは、商人、金額、通貨、および購入するものについての自然言語による説明を含む範囲付きの支出要求を作成できる。ユーザーは、Web、iOS、またはAndroidで通知を受け取り、取引を確認および承認する。Linkは、エージェントが購入を完了するために使用する、一度限りの仮想カードまたは共有支払いトークン(SPT) — ウォレットに既に含まれているカードまたは銀行口座によって裏付けられた範囲付きの資格情報 — を発行する。エージェントは、基本的な支払い方法を見ることはない。内部的には、消費者ウォレットは、Stripeがエージェント用の発行と呼んでいる、単一使用カード、取引レベルの支出制御、リアルタイム承認、および完全な監査トレイルのセットの上に構築されている。独自のエージェント向けアシスタントを構築する企業は、これを使用してウォレットインフラストラクチャをスクラッチから構築する必要を回避できる。現在、LinkのエージェントウォレットはカードとSPTをサポートしている。Stripeは、「エージェントトークン、ステーブルコイン、およびその他の種類の支払いはすぐに利用可能になる」と述べており、ユーザーが支出制限を設定するか、事前承認してエージェントが承認なしで行動できるようにする、拡張された制御をプレビューしている。支払いスタック全体の調整されたプッシュLinkのエージェントウォレットは単独では機能しない。同じセッションズ2026の発表には、含まれる、Googleとのパートナーシップを通じて、GoogleのAIモードとGeminiアプリ内でUniversal Commerce Protocolを介してビジネスを販売すること、および、StripeとTempoブロックチェーンによって共同で著作されたMachine Payments Protocolを介して、エージェントとビジネス間の直接マイクロ取引、および、Wix、BigCommerce、WooCommerceのマーチャントをAIショッピングサーフェスに単一の統合で導入するAgentic Commerce Suiteが含まれる。Will Gaybrick、Stripeの製品およびビジネスの社長は、会社の姿勢を特徴的に率直な言葉で表現した。「AIがノーベル賞レベルの物理学の問題を解決できるが、ドメインを購入できない場合、何かが間違っている。私たちのモットーは、エージェントをエンパワーメントすることである。」そのモットーには競争的な牙がある。Stripeはすでに、OpenAI、Microsoft、Metaとのパートナーシップの発表を行っており、Visa Intelligent CommerceおよびMastercard Agent Payプログラムは両方とも、StripeのSPTプリミティブに乗っている。EtsyおよびURBN...
アンソロピックは、8500億ドルから9000億ドルという評価額で、約50億ドルを新たな資金調達するための先制的なオファーを受けていると、先週の複数の報告書によると、クラウドのメーカーの価値を3ヶ月以内に2倍以上に増やし、OpenAIと並んで世界で最も価値の高いAIスタートアップになるという取引に着手している。5月には取締役会の決定が予想され、このラウンドは10月に予想されるIPO前にアンソロピックの最後のプライベート資金調達となる可能性がある。アンソロピックはコメントを拒否した。評価額は、2月にアンソロピックがGICとCoatueのリードで3800億ドルのポストマネー評価額で30億ドルのシリーズG資金調達を行ったときよりも、急激に上昇した。新しい条件でのラウンドは、3ヶ月以内にその数字を2倍以上にし、3月31日にOpenAIが記録的なラウンドを終了したときの8520億ドルのポストマネー評価額を超えることになる。収益成長はすべての前のラウンドを上回る新しい評価額は、製品のリズムよりもアンソロピックの収益トラジェクトリを追跡している。同社は4月7日に、年間化ランレート収益が300億ドルを超えたと述べた。これは、2025年末の約90億ドルから上昇した。2月のシリーズGの際、アンソロピックは140億ドルのランレートを公開していたが、4月までにその数字は2倍以上に増加していた。エンタープライズ需要が大部分の仕事をしている。アンソロピックとの年間取引額が100万ドルを超えるビジネス顧客の数は、シリーズG発表時の500以上の数字から2ヶ月以内に2倍となり、現在1000を超えている。アンソロピックは、約80%のビジネスがエンタープライズ顧客から来ていると述べており、これは消費者重視の同業他社が擁護する評価倍数を支持するプロファイルである。収益の多くは、単一の製品ラインに集中している。アンソロピックのエージェントコーディングプラットフォームであるClaude Codeは、シリーズGの開示時点で250億ドルのランレート収益を生み出しており、2026年開始以来、週間アクティブユーザー数は2倍になっている。同社は、最近、Claude Design機能をロールアウトし、Photoshop、Blender、AbletonをModel Context Protocolを介して接続している。評価の背後にあるコンピュート支出このラウンドは、アンソロピックが過去1ヶ月で整えた多十年間のインフラストラクチャへの取り組みのバックグラウンドで検討されている。4月20日、アマゾンは、アンソロピックに追加の50億ドルの株式投資を行い、最大200億ドルまで商業的なマイルストーンに結び付け、クラウドプロバイダーのアンソロピックへの総コミットメントを約330億ドルにした。同契約の下で、アンソロピックは、TrainiumとGravitonチップを含むAWSテクノロジーに来 decadeで1000億ドル以上を費やすこと、および最大5ギガワットのAWS容量を確保することに合意した。4日後、Googleは、アンソロピックに最大400億ドルを投資することを発表し、最初の100億ドルは350億ドルの前金評価額で現金として行われ、最大300億ドルはパフォーマンス目標に結び付けられた。Google Cloudは、アンソロピックが4月7日に発表したGoogle–Broadcomパートナーシップに基づいて、約5ギガワットのTPU容量を提供することに同意した。Microsoftの50億ドルのコミットメントとNvidiaの最大100億ドルの約束を加えると、アンソロピックのキャッシュプラスコンピュートスタックは、すべての主要な米国AIインフラプロバイダーを網羅している。これらは、アンソロピックやOpenAIのようなアンカー・テナントによって正当化されている、AIデータセンターの構築に向けたグローバルキャップエックスプッシュをしているプロバイダーである。Alphabetは4月29日に、2026年のキャップエックスガイダンスを1800億ドルから1900億ドルに引き上げた。アマゾンは、今年約2000億ドルを費やすことが予想されている。この新しい株式ラウンドは、アンソロピックに、コンピュートコミットメントを完全にサプライヤー・ファイナンス構造に頼ることなく、必要なキャッシュを提供するだろう。9000億ドルという数字が実際に何を示しているか300億ドルを超える年間化ランレート収益を達成した企業に対する9000億ドルの評価額は、約30倍の評価倍数を意味するが、これは4ヶ月でランレートを3倍にし、エンタープライズミックスがAIネイティブスタートアップの評価を書き換えているという成長に基づいては、豊かではあるが、顔に合っている。アンソロピックの二次市場株式は、4月初旬のForge Globalのようなプラットフォームで、既に1兆ドルの評価額で取引されていたと、複数の報告書によると、プライマリーラウンドは、後期の保有者が取引するところで割引価格で設定されている可能性がある。競争的背景は、OpenAIにとって反対の方向にある。ChatGPTのメーカーは、2月に250億ドルのARRフィギュアを公開したが、それ以来公開的に修正していない。Microsoftとの再構成された契約は、GPT-4とGPT-5を生み出したパートナーシップの商業条件を再設定した。アンソロピックが収益、評価、または両方でOpenAIを超えることは、ChatGPTの立ち上げ以来、フロンティアラボの階層の最初の再編成となる。注目すべきは、アンソロピックの取締役会が8500億ドルから9000億ドルの範囲の高端または低端でラウンドに署名するか、既存の戦略的投資家(Google、Amazon、Nvidia、Microsoft)が新しい株式ラウンドに参加するか、コンピュートリンクのコミットメントに固執するか、IPOのタイムラインが保持されるかである。9000億ドル以上での公開上場は、記録上最大のテクノロジーデビューの一つとなり、OpenAIを含むすべての後のAI資金調達の比較対象となる。
Anthropic 9つの新しいクロードコネクタを4月28日にリリースし、Adobe Creative Cloud、Blender、Ableton Live、Autodesk Fusion、Splice、SketchUp、Affinity by Canva、ResolumeのArenaとWireなどのプロフェッショナルクリエイティブが使用するソフトウェアに直接接続しました。 このリリースにより、クロードはデザイン、3D、音楽、ライブビジュアルパイプラインのオーケストレーションレイヤーになります。コネクタは、Blender Development FundにCorporate Patronとして参加するという別個の、金銭的なコミットメントとともに到着しました。財団のトップパトロンのティアです。9つのコネクタの機能各コネクタは、ホストアプリケーションの異なるスライスを公開しています。Abletonのコネクタは、LiveとPushの公式製品ドキュメントに基づいてクロードの回答を提供します。 Adobeの「Adobe for creativity」コネクタは、Photoshop、Illustrator、Firefly、Express、Premiere、Lightroom、InDesign、Stockを含む50以上のプログレードツールに到達する、セットの中で最も広いコネクタです。 Adobeの発表は、単一のチャットからマルチステップワークフローをオーケストレートするという、統合のフレームを提供しています。ユーザーは結果を説明し、コネクタはそれを生成するために基礎となるアプリを調整します。Autodesk Fusionでは、Fusionのサブスクライバーが会話を介して3Dモデルを作成および変更できます。 Affinity by Canvaでは、バッチイメージ調整、レイヤー名の変更、ファイルのエクスポートを自動化できます。 SketchUpでは、提示された説明を3Dモデリングの開始点に変換できます。 Resolumeの2つのコネクタは、VJにArena、Avenue、Wireのための自然言語制御を提供します。 Spliceでは、プロデューサーが音楽AIツールと組み合わせることが多い、ロイヤリティフリーのサンプル検索をクロード内に提供します。Blenderコネクタは、技術的には最も大きなものです。 Blenderの開発者は、Model Context Protocolに基づいて構築しました。...
David Silverのロンドンに拠点を置くAI研究所 Ineffable Intelligence は、4月27日に51億ドルのポストマネー評価で11億ドルのシードラウンドを獲得してステルスモードから登場しました。これは、ヨーロッパのスタートアップが獲得した最大のシード資金となります。Sequoia CapitalとLightspeed Venture Partnersが共同でラウンドを牽引し、Nvidia、Google、Index Ventures、DST Global、BOND、EQT、Evantic、Flying Fish、British Business Bank、およびUK政府のSovereign AIファンドが参加しています。ラウンドの規模、製品の不存在、および会社の目標 – 人間のデータを使用せずに学習する「スーパーレーナー」を構築するという目標 – は、LLM以外のパスを通じて高度なAIに到達するための最も攻撃的なベットの1つです。これは、2月に最初に報告された1億ドルの資金調達を確認するものです。当時、Sequoiaのリードポジションはすでに知られていたが、最終的なキャップテーブルと評価はまだ発表されていませんでした。人間のデータに対するベットSilverは、10年以上にわたってGoogle DeepMindの強化学習の責任者であり、University College Londonの教授です。彼は、AlphaGo、AlphaZero、AlphaStar、AlphaProofプロジェクトを率いたり共同で率いたりしました。これらのシステムは、人間の例の模倣ではなく、自己対戦とトライアルアンドエラーを通じて超人的なパフォーマンスを達成しました。Ineffableは、このアプローチをスケールアップするための明示的な試みです。会社のミッションステートメントは、スーパーレーナーが「自身の経験からすべての知識を発見する」ことを目的としており、インターネットテキストの事前トレーニングではなく、強化学習アルゴリズムによって推進されることを述べています。Silverは、これが人間の知識を超えるシステムを構築するための唯一の方法であり、一般目的のAIの答えではないことを主張しています。こちらは、インターネットテキストを増やすだけでは十分ではないという議論の一部です。2026年1月15日に会社のブログに投稿された個人的なノートで、SilverはIneffableを「彼の生涯の仕事」と表現し、「強化学習パラダイムの全ての野心が実現できる場所」が必要であると述べました。このピッチは、OpenAI、Anthropic、Google自身のフロンティアワークを3年間牽引してきたLLM第一主義に対する直接的な反論です。投資家、政府の支援、ロンドンの拠点Sequoiaのパートナーシップ発表では、SequoiaのパートナーであるSonya HuangとAlfred Linは、会社を「経験の時代のためのスーパーレーナー」と表現し、Silverのキャリアは自己対戦と経験から学ぶことが模倣よりもスケールするという1つの原則に基づいていると述べました。彼らは、DeepMindでのAlphaGo Zeroでの彼の仕事を引用し、すべての人間の事前トレーニングを削除し、自己対戦のみで学習することで、システムのEloレーティングを約3,700から5,000以上に引き上げたと述べました。取引の他の特徴は、UK政府の関与です。Sovereign AIファンドを通じて –...
OpenAIとMicrosoftは、月曜日に長期にわたるパートナーシップを改定し、MicrosoftのOpenAIモデルの独占ライセンスを終了し、AI研究所が任意のクラウドプラットフォームでフル製品ラインを販売できるようにし、関係を影で支配してきた論争の的となっていた「AGI条項」を消去した。会社は、2019年以来のMicrosoftのAI戦略の基盤となった契約に「長期的な明確性」をもたらすというフレームで調整されたブログ投稿を通じて変更を発表した。Microsoftの利害関係 — 先月に約1350億ドル、またはOpenAIの約27パーセントの水準で開示された — はそのまま残っているが、両社間のほぼすべての運用レバーが再調整された。新しい契約で何が変わったかMicrosoftの発表では、OpenAIの製品は、Microsoftが必要な機能をサポートできない、またはサポートしない場合を除き、引き続きAzureで最初に出荷されるが、OpenAIは今や「すべての製品を任意のクラウドプロバイダーにわたる顧客に提供できる」ようになった。MicrosoftのOpenAIモデルおよび製品への知的財産ライセンスは2032年まで有効だが、非独占的となり、Redmondにとって最も重大なダウングレードとなった。財務構造も並行して再描画された。Microsoftは、AzureでのOpenAIモデルの販売に対する収益シェアの支払いを終了し、OpenAIへのカットを終了した。OpenAIのMicrosoftへの収益シェアは2030年まで「同じパーセンテージだが、総上限に従う」形で継続し、支払いは技術的マイルストーンから切り離された。 OpenAIの対応するブログ投稿では同様の言語を使用し、改訂を「柔軟性、確実性、およびAIの利点を幅広く提供することに焦点を当てた」と位置付けている。最も注目されている契約条項が消えた。AGI条項は、OpenAIの取締役会が会社が人工一般知能に到達したと宣言したときに、Microsoftの知的財産権に変更をもたらすはずだった。2025年10月の「次の章」改訂は、AGIの宣言を独立した専門家パネルにルーティングし、安全対策付きでMicrosoftの知的財産権をAGI後のモデルに拡張することでそれを緩和しようとした。この週の契約では、トリガーを完全に削除し、収益シェアはAGIの宣言に関係なく2030年に停止する。両側が脱却した理由改訂は、OpenAIが数か月間構築してきたマルチクラウドの現実を法令化した。同社は、先月、7年間、380億ドルのAWS契約を締結し、アマゾンはその後大量の新規投資を約束した。これらの動きは、Microsoftの前の独占ライセンスの地位と難しく調和するものだった。OpenAIは、今年初めにテキサスでの元Stargate拡張を縮小した後も、独自のインフラストラクチャを押し進めており、競合するハイパースケーラーは減速していない — AWSは数十億ドルをAIインフラストラクチャに注ぎ込んでおり、Azure独占がブロックしていたOpenAIの新しいワークロードを吸収する位置にあり。Microsoftにとって、トレードオフは、独占アクセスを失う代わりに、OpenAIの裁量でパートナーシップを混乱させる可能性のある条項を削除することである。AGIトリガーの削除は、会社のAI契約の最大の法的不確実性源を排除し、RedmondはAzure先行の展開姿勢、2032年までの知的財産ライセンス、およびOpenAIが成長を続けるにつれての大株主アプサイドを維持する。両社は、次の分野での協力を継続することを約束した — 「新しいデータセンター容量のギガワットの拡張」、「次世代シリコン」、「AI駆動のサイバーセキュリティ」 — これらの分野では、OpenAIが10月に約2500億ドルのAzureコンピュートコミットメントを約束した。市場は非対称性を読み取った。Microsoftの株価は約2パーセント下落し、アマゾンは約1パーセント上昇し、取引者は取引をRedmondのAIモートのクリーン・ネガティブ、主要なクラウドライバルのクリーン・ポジティブとして価格設定した。最も近い疑問は、OpenAIが契約上の障壁が消えた今、AWSやGoogle Cloudでどれほど積極的にモデルを展開するかである。 ChatGPTのユーザーベースと収益は拡大を続けており、マルチクラウド製品カタログは数週間以内に登場する可能性がある。Microsoftにとってのテストは、独占性の喪失が、特にAnthropicや他のライバルが同じ買い手に対して自社のエンタープライズポジションを押し出す中で、自社およびパートナーのモデルへの押し込みを鋭化させるかどうかである。AGI条項の静かな退出がより深い信号である。AIで最も注目されている企業パートナーシップは、6年以上にわたって、片側が単独で宣言できる、漠然とした、定義のないしきい値の周りに構築された。2030年の収益シェアの固定サンセット — 2032年のMicrosoftの知的財産ライセンスの平坦な期限 — を置き換えることで、AGIの到来に対する哲学的な賭けを通常の商業契約に変換する。
アンソロジックは4月24日、「プロジェクト・ディール」の結果を公開しました。これは、同社のサンフランシスコ事務所の69人の従業員のために、クロード・エージェントが1週間の間で実物商品を購入および販売する内部実験でした。 エージェントは186の取引を行い、約4,000ドルの取引を行った。また、研究では、より強力なモデルで表現された参加者が、人間の対象者が気づかないほど、より良い結果を得たことがわかった。 アンソロジックの研究者であるケビン・K・トロイ、ディラン・シールズ、キール・ブラッドウェル、ピーター・マックローリーの著書にある、この研究結果は、エージェントが取引の両側で交渉するAIメディエーテッド・マーケットプレイスが実際にどのように動作するかについて、最も明確な絵を示しています。 また、同社は、アジェンティック・コマースが主流になる前に、業界、規制当局、ユーザーが直面しなければならない「不快な意味」を浮き彫りにしています。 プロジェクト・ディールのしくみ この実験は2025年12月に1週間実行されました。 アンソロジックは69人の従業員を募集し、各自に100ドルの「予算」(実験後にギフトカードの形で支払われ、購入または販売した商品の価値にプラスまたはマイナスされました)を与え、クロードが各ボランティアと短いインタビューを行い、どんな商品を売りたいか、どんな価格で売りたいか、どんな交渉スタイルのエージェントを使うかを調べました。アンソロジックはこれらの回答を各エージェントのカスタム・システム・プロンプトに変換しました。 アンソロジックは次に、Slackチャンネル内で4つの並行マーケットプレイスを実行しました。 「ランAとランDでは、すべてのエージェントが当時の最先端モデルであるクロード・オーパス4.5に基づいていました。」とチームは述べています。「他の2つのラン(ランBとランC)では、参加者は50%の確率で、より低力のモデルであるクロード・ハイク4.5に割り当てられました。」 ランAのみが「実際の」ランで、実際の商品が交換された後でした。他の3つは研究条件で、参加者は実験後に調査されるまで、どのランが実際のランであるかを知らされませんでした。 エージェントが展開された後、人間の介入はありませんでした。 プロジェクトのSlackチャンネルは、エージェントをランダムにループさせ、商品を販売するための投稿、他の人の商品に対するオファー、または取引の締結を可能にしました。重要なのは、実験が開始された後、人間の介入はなかったということです。 500以上の商品がリストされ、エージェントはマッチを見つけ、価格を提案し、取引を自律的に締結しました。人間は、エージェントが合意した商品を物理的に交換するために、最後に再び登場しました。 より強力なモデルは静かにより良い取引を交渉する 見出しとなる発見は簡単です。エージェントの品質は重要であり、ドルで重要です。 4つのランのうち少なくとも2つで販売された161の商品について、オーパス・セラーは平均で2.68ドル多く獲得し、オーパス・バイヤーは平均で2.45ドル少ない金額を支払いました。オーパス・セラーがハイク・バイヤーと対決した場合、平均価格は24.18ドルとなり、オーパス対オーパスの取引では18.63ドルでした。アンソロジックによると、中央値は12ドル、平均は20.05ドルで、これらのギャップは重要ではありません。 個々のケースはより鋭敏でした。 同じ折りたたみ自転車、同じ買い手、同じ売り手:オーパス・エージェントは65ドルを獲得しましたが、ハイク・エージェントは38ドルしか獲得しませんでした。 オーパスが販売した65ドル相当のラボ・グロウン・ルビーは、ハイクが販売した場合、35ドルしか得られませんでした。 問題は、参加者が認識しなかったことです。 明らかな価格ギャップにもかかわらず、ハイク・エージェントを持つ参加者は、オーパス・ユーザーとほぼ同じくらい、取引の公平性を評価しました。公平性の評価は4.06対4.05でした。 「28人の参加者は、ハイクとオーパスの両方のランで参加しました。17人はオーパス・ランをハイク・ランよりも上位に評価しましたが、11人はその逆を評価しました。」と同社は書いています。 2つ目の、より反直感的な結果は、交渉スタイルがほとんど結果に影響しなかったということです。 攻撃的な売り手は高い価格を獲得しましたが、それは攻撃的な売り手が最初に高い開始価格を設定したからです。アンソロジックによると、攻撃的な指示は、売却の可能性、売却価格、または購入価格に統計的に有意な影響を与えませんでした。モデル選択はプロンプティングよりも重要でした。 アジェンティック・コマースへの意味 プロジェクト・ディールはパイロットであり、製品ではありません。アンソロジックは、自選された従業員プール、低いステーク、悪意のあるアクターの不存在などの限界を注意深く指摘しています。ただし、参加者の46%は、このようなサービスを支払う用意があると述べており、アンソロジックは、これがエージェントによるピアツーピア・コマースが近い将来に実現する兆しであると述べています。...
DeepSeekは、2025年1月に低コストのR1推論モデルで業界を震撼させた中国のAI研究所で、The Informationの報告によると、外部資金を初めて少なくとも3億ドル調達する交渉を進めている。調達ラウンドでは、杭州に拠点を置く同社の企業価値は100億ドル以上になる見込みである。調達は、DeepSeekの創設者兼CEOであるLiang Wenfengにとって、明確な方針転換を示す。Liangは、DeepSeekを、自らの量的ヘッジファンドであるHigh-Flyer Capital Managementの副プロジェクトとして立ち上げ、過去に中国の大手ベンチャーキャピタル企業やテクノロジー企業からの出資提案を何度も断ってきた。High-Flyerは、DeepSeekの99%の株式を保有しており、現在まで同社の唯一の資金源であった。これは、Liangが商業的圧力から研究所を保護するための意図的な戦略であった。しかし、この独立性は、2つの方向から圧力を受けている。コストの増加と、人材の薄さである。主要エンジニアがライバル企業に移籍DeepSeekは、最近数か月で、いくつかの著名な研究者を失っている。V2モデルのコア開発者であるLuo Fuliは、2025年11月にXiaomiに移籍し、同社のMiMo空間インテリジェンスチームのリーダーになった。他に、R1モデルのリード著者であるGuo Dayaは、South China Morning Postによると、ByteDanceのSeed AI部門に移籍した。ByteDanceは、Guoの報酬パッケージが年間約1億元(約1,400万ドル)であるという報道を否定したが、同社の標準フレームワークに従って株式を含む報酬を支払っていることを確認した。このような離脱は、中国のAI市場で、人材戦争が激化していることを反映している。Alibaba、ByteDance、Tencentなどの大手企業が、小規模な研究所から人材を積極的に引き抜いている。DeepSeekのエンジニアであるWang Bingxuanも、同期間中にTencentに移籍したと報告されている。V4の遅れとHuaweiチップの賭けDeepSeekの次期フラグシップモデルであるV4は、複数回延期されている。延期の原因は、V4をHuaweiのAscend AIチップと互換性を持たせる努力に部分的に起因している。NvidiaのCUDAエコシステムと比較して、Huaweiのチップは、インターチップ接続が遅く、ソフトウェアツールが未成熟であるため、技術的に困難な移行である。V4モデルは、北京のアメリカ製半導体への依存度を下げる取り組みの一環として、Huaweiのチップで動作するように設計されている。如果DeepSeekが成功すれば、これは国内チップ開発にとって重要な里程標となる。しかし、技術的な障害は現実である。Huaweiのエンジニアは、トレーニング実行中の安定性の問題をトラブルシューティングするために、DeepSeekのチームに参加していると報告されている。一方、競合他社は待ってはいない。AlibabaのQwenファミリーのオープンソースの大規模言語モデルは、2026年3月現在、オープンソースモデルのダウンロード数の50%以上を占め、累計940万回以上のダウンロードを記録している。ByteDanceのDoubaoチャットボットは、2025年末までに1億人以上のDAU(1日あたりのアクティブユーザー)を達成し、同社は、世界で少なくとも3番目の大手となることを目指している。最新のStanford AI Indexによると、世界のAI開発競争は加速しており、中国はアメリカのトップ企業に対して約3〜6か月の差に迫っている。10億ドルでのDeepSeekの提案評価は、AI業界で見られる他の評価額とは比較にならないものである。例えば、Anthropicは800億ドルの評価額で注目を集め、Databricksのようなインフラストラクチャー企業も134億ドルの評価額に達している。しかし、V3ベースモデルを2,048のNvidia H800 GPUで約560万ドルでトレーニングした会社にとっては、重大なステップとなる。投資家は、主に中国国内の企業になる見込みである。アメリカのベンチャーキャピタルは、中国のAIへの投資に対する規制や国家安全保障上の障壁に直面している。まだ合意は成立していないが、LiangがHigh-Flyerのほぼ完全な支配権を希薄化させる条件を受け入れるかどうかは不明である。しかし、明らかなことは、ヘッジファンドのバランスシートだけでフロンティアAI研究所を運営する日々は終わろうとしていることである。
アンソロピックは、Anthropic Labs部門の新製品であるClaude Designをリリースしました。このツールを使用すると、ユーザーは会話を通じてプロトタイプ、スライドデッキ、一ページの文書、その他のビジュアルアセットを作成できます。ツールは、Claude Opus 4.7によって動作しており、アンソロピックの最新かつ最も高度なビジョンモデルです。Claude Pro、Max、Team、Enterpriseサブスクライバー向けに研究プレビューで利用可能です。Enterprise組織の場合は、管理者が設定で有効にする必要があります。Claude Designは、特定のギャップをターゲットにしています。デザインスキルやプロフェッショナルツールへのアクセスがないアイデアを持つ人々。起業家がピッチデッキを構築している場合、製品マネージャーが機能フローをスケッチしている場合、またはマーケターがキャンペーンのビジュアルを草案している場合、平易な言語で必要なものを説明し、インラインコメント、直接テキスト編集、またはカスタム調整スライダーを介して精製できます。「必要なものを説明し、Claudeが最初のバージョンを構築します」とアンソロピックは発表で書いています。 「そこから、会話、インラインコメント、直接編集、またはカスタムスライダーを通じて精製します。」https://www.youtube.com/watch?v=t_LBECIQQqsClaude Designのしくみ製品は構造化されたクリエイティブワークフローに従います。オンボーディング中、Claudeはチームのコードベースとデザインファイルを読み取り、内部デザインシステムを構築します – カラー、タイポグラフィ、コンポーネントをキャプチャします。以降のすべてのプロジェクトは自動的にこれらのブランドガイドラインを適用し、チームは同時に複数のデザインシステムを維持できます。ユーザーはテキストプロンプトから開始したり、画像や文書(DOCX、PPTX、XLSX)をアップロードしたり、Claudeを既存のコードベースに指示したりできます。Webキャプチャツールを使用すると、チームはライブWebサイトから要素を直接取得できます。プロトタイプは実際の製品と一致します。エクスポートオプションには、PDF、PPTX、スタンドアロンHTML、内部共有可能なURL、およびCanvaとの直接統合が含まれます。Canvaとの接続は注目に値します – アンソロピックは、Claude Designを既存のAIグラフィックデザインツールの代替ではなく、補完として位置付けました。デザインは、Claude Codeでプロトタイプから生産コードへの移行を1ステップで実行できるハンドオーバーバンドルにパッケージ化することもできます。複数の企業が初期のテストモニターを提供しました。Datadogは、「部屋を出る前に、粗いアイデアから動作するプロトタイプを作成しました」と述べています。Brilliant、インタラクティブ学習プラットフォームは、他のツールでは20以上のプロンプトが必要な複雑なページが、Claude Designでは2つのプロンプトのみで実現できたと報告しています。より広範な企業向けプッシュClaude Designは、Claude Coworkのリリースに続き、アンソロピックLabsからリリースされた最新の製品です。アンソロピックLabsは、インスタグラムの共同創設者であるMike KriegerとアンソロピックのベテランであるBen Mannが共同で率いています。チームは2026年1月に正式に拡大し、Kriegerはチーフプロダクトオフィサーの役割からフロンティア製品のインキュベーションに焦点を当てるために移動しました。リリースは、アンソロピックの企業およびプロサマー領域への急速な拡大を拡大します。この月、マネージドエージェントをリリースし、自律的な企業ワークロードを実行しました。Claude Designは、既存のAIプレゼンテーションジェネレーターや確立されたデザインプラットフォームと競合する、創造的なレイヤーをスタックに追加します。タイミングは重要です。 Bloombergは今週、ベンチャーキャピタルがアンソロピックに8000億ドルの評価額で資金提供を提供したと報告しました – オープンAIのライバルに近づきました。2月に300億ドルのシリーズGを3800億ドルの評価額で閉じた後、報告されたオファーは2ヶ月で約2.1倍の増加を表します。アンソロピックは最新のオファーを受け入れていないと、Bloombergは報告しています。今週の初め、リークされた詳細について、Claude DesignとOpus 4.7がすでに流通していたが、最近のリリースは、製品のスコープが初期の報告よりも広いことを確認しました。特に、Canvaの統合、複数形式のエクスポート、およびデザインシステムの自動化。Claude...
アンソロピックは、Claude Opus 4.7と自然言語デザインツールを早くも今週中にリリースする準備をしている間に、ベンチャーキャピタル企業は8000億ドルを超える評価で投資を提供している – 会社の最後の公式価格帯の2倍以上。モデルID anthropic-claude-opus-4-7 は、4月16日に Google Vertex AIのクォータ管理ページ にEUのマルチリージョン展開のために表示された。これは、以前のClaudeのリリースと一致するパターンである。 The Informationは、4月14日に、計画に精通している人物の話として、新しいモデルとデザインツールの両方が今週に出荷される可能性があると報告した。Opus 4.7は、2月5日に1ミリオントークンのコンテキストウィンドウとSWE-bench Verifiedで80.8%のスコアを獲得したClaude Opus 4.6のインクリメンタルアップグレードである。新しいバージョンは、マルチステップの推論、デバッグ、および自律タスクの実行を改善することが期待されている。これは、アンソロピックが公開リリースから除外している、より高度な内部モデルであるMythosとは異なる。これは、会社のProject Glasswingイニシアチブを通じて制御されている。AIネイティブデザインツールがFigmaとWixに照準を当てるモデルとともに、アンソロピックは、自然言語プロンプトからウェブサイト、プレゼンテーション、ランディングページ、プロトタイプを生成するツールを立ち上げる。製品は、アンソロピックを、確立されたAIウェブサイトビルダーやAIグラフィックデザインツール、およびFigma、Wix、Adobeなどの既存の企業と直接競争させる。デザインソフトウェア会社の株価は、ニュースを受けて下落し、今年のS&P 500ソフトウェアおよびサービスインデックスの約26%の下落に伴うより広範な売りが出ている。投資家は、AIネイティブツールが従来のデザインソフトウェアの需要を低下させることを心配している。今年の初め、アンソロピックのCoworkアシスタントと関連する自動化プラグインの立ち上げにより、ソフトウェア株も同様の下落を見た。アンソロピックは、コアモデルのビジネスを着実に拡大してきた。Figmaと提携してAI生成コードを編集可能なデザインファイルに変換し、Microsoft WordとPowerPointにClaudeを統合し、最近エンタープライズワークロードのマネージドエージェントとClaudeデスクトップコントロールをMacで出荷した。会社は、1月以降、約2週間ごとのメジャープロダクトアップデートのペースを維持してきた。8000億ドルのオファーは爆発的な投資家の需要を示す複数のベンチャーキャピタル企業は、アンソロピックに8000億ドル以上の評価で資金提供のオファーを出し、TechCrunchとBusiness Insiderによると。アンソロピックは、これらすべてを拒否した。オファーは、2月のGICとCoatueが主導し、D.E. Shaw Ventures、Founders Fund、ICONIQが参加した30億ドルのシリーズGラウンド時の380億ドルの企業評価から、驚くほどの大きなジャンプを表す。二次市場では、アンソロピックの株式は4月14日時点でCaplightで688億ドルの評価で取引されていた – 3か月で75%の増加。需要はアンソロピックの財務トラジェクトリによって推進されている。会社の年間収益は4月初旬に300億ドルに達し、シリーズGラウンド時の140億ドルと2025年末の90億ドルから上昇した。現在、1000以上のエンタープライズ顧客がClaude製品に年間100万ドル以上を費やしており、フォーチュン10の8社がユーザーである。8000億ドルで増資を拒否するアンソロピックは、会社がより良い条件を待っているか...
スタンフォードの Institute for Human-Centered Artificial Intelligence は、4 月 13 日に 2026 AI インデックス レポート を公開しました。このレポートでは、AI の能力は歴史的なスピードで進化している一方で、AI を管理、評価、理解するためのシステムはさらに後ろに落とされているという、中心的なパラドックスで定義される分野を文書化しています。年次レポート – AI の軌跡に関する最も包括的な公共の説明 – は、技術的なパフォーマンス、経済的影響、公共の意見、政策の発展を、数十の国々にわたって追跡します。この年のエディションは、科学と数学の分野で目覚ましい成果を達成し、記録的な投資を集め、パーソナル コンピューターまたはインターネットよりも速く日常生活に浸透した産業の絵を描いています。しかし、同時に、公共の信頼の低下、最大の AI 企業の中での透明性の低下、および AI...
OpenAIは、個人向けAI経済顧問と称するサービスを提供していたAIパワードの個人ファイナンススタートアップHiroを買収した。約10人の従業員とフィンテックの専門知識がOpenAIに加わる。この買収は、Hiroの共同創設者Ethan Blochによって2026年4月13日に発表され、チームはOpenAIに加わり、より大きな規模で金融ツールの開発を続けることが確認された。この買収は、アクイハイア(talent-focused acquisition)として構成されており、OpenAIはHiroの製品ではなく、エンジニアリングチームを獲得する。Hiroは新規登録の受け付けを停止し、アプリは2026年4月20日に終了する。既存のユーザーは2026年5月13日までにデータをエクスポートできるが、その後、すべての個人データは永久に削除される。顧客データはOpenAIに移行しない。金銭的な条件は公開されていない。HiroはRibbit Capital、General Catalyst、Restive Venturesから出資を受けていたが、出資総額は公開されなかった。Hiroの短い歴史と経験豊富な創設者Hiroは約5ヶ月前に製品を立ち上げ、約100億ドルの顧客資産を管理していた。このツールでは、ユーザーが給与、負債、支出などの財務詳細を入力し、貯蓄、支出、投資のシナリオをモデル化できる。このスタートアップは、Ethan BlochとRushabh Doshiによって共同創設された。両者は、自動貯蓄アプリのDigitのベテランである。Digitは、2021年12月にOportunによって約2億1300万ドルで買収された。Blochは2013年にDigitを創設し、約60万人の有料会員を獲得した。その後、2020年にDigitに参加したDoshiは、投資と銀行へのプラットフォームの拡大を支援し、2023年にHiroを共同創設した。Hiroの投資家には、Josh Elman(元Robinhood製品担当VP)やDaniel Kang(Mercury CFO)などの著名なフィンテック関係者も含まれており、これはチームがOpenAIに深い金融製品の専門知識をもたらしたことを示唆している。OpenAIの拡大する買収戦略Hiroの買収は、2025年中頃から急速に進展したOpenAIの買収の一連の流れにおける最新のものである。同社は2023年以降に少なくとも17の買収を完了しており、Crunchbaseのデータによると、2025年だけで8件の買収を行った。最近の買収は、オープンソース開発者ツール(Astral、Promptfoo)、ヘルスケアAI(Torch Health)、ハードウェア(Io、65億ドルで)、製品テストインフラストラクチャ(Statsig、11億ドルで)に及んでいる。2025年10月、OpenAIは、Roiという別の個人ファイナンスアプリも買収し、フィンテックが単発の買収ではなく、継続的な関心事であることを示唆した。このパターンは、OpenAIがChatGPTを会話以外の日常タスクのプラットフォームにするというより広範な取り組みと一致している。同社はすでに、PayPalパワードのデジタルウォレットをChatGPTに統合しており、ChatGPTの機能をクリエイティブツール、ChatGPT Atlasブラウザによるブラウジング、企業向け展開に拡大している。金融計画をこのスタックに追加することで、信頼とデータの正確性が不可欠なカテゴリでのユーザーとの関わりを深めることができる。OpenAIは、Hiroのチームがスタンドアロンの金融製品を構築するか、金融機能をChatGPTに統合するかを確認していない。2026年3月に1220億ドルの資金調達を完了した同社には、専門的な垂直市場に注力するための資本とモデル能力がある。問題は、ユーザーがAIチャットボットに金融データを信頼するかどうかであり、これは業界全体のAIフォーカス買収が初めて対処し始めた課題である。
中国のAI企業ミニマックスは、MiniMax M2.7の重みをリリースしました。これは、229億パラメータのMixture-of-Expertsモデルで、自身の開発サイクルに参加しました。ミニマックスは、これを自己進化型AIの第一歩と呼んでいます。元々3月18日に発表されたMiniMax M2.7は、現在Hugging Faceで無料で利用可能です。SGLang、vLLM、Transformers、NVIDIA NIMのデプロイサポートを提供しています。このモデルは、SWE-Proで56.22%、Terminal Bench 2で57.0%のスコアを獲得し、オープンソースLLMの中で、リアルワールドのソフトウェアエンジニアリングタスクで最も強力なものの1つです。モデルが自分で構築された方法M2.7について最も注目すべきことは、その自己イテレーションへの参加です。ミニマックスは、内部バージョンのモデルをプログラミングスキャフォールドの最適化に割り当て、100ラウンド以上を自律的に実行しました。そのプロセス中、M2.7は失敗トラジェクトリを分析し、スキャフォールドコードを変更し、評価を実行し、各変更を保持または元に戻すかどうかを決定しました。モデルは、自己で最適化を発見しました。温度や頻度ペナルティなどの最適なサンプリングパラメータを体系的に検索し、バグパターンの自動チェックなどワークフローガイドラインを設計し、エージェントループにループ検出を追加しました。ミニマックスは、この自律プロセスから内部評価セットで30%のパフォーマンスの改善を報告しています。ミニマックスの強化学習チーム内では、M2.7は現在、30%から50%の日常的なワークフローをエンドツーエンドで処理しています。研究者は、重要な決定のみを扱い、モデルは文献レビュー、実験の追跡、データパイプライン、デバッグ、メージュリクエストを管理しています。ミニマックスはまた、M2.7をMLE Bench Liteでテストしました。これは、OpenAIの22の機械学習コンペティションのスイートで、単一のA30 GPUで実行されます。3回の24時間トライアルで、モデルのベストランは9つの金メダル、5つの銀メダル、1つの銅メダルを獲得しました。平均メダル率は66.6%で、Gemini 3.1と並び、Opus 4.6(75.7%)とGPT-5.4(71.2%)に次ぐものでした。エンジニアリングとオフィスワークのベンチマークパフォーマンスソフトウェアエンジニアリングのベンチマークでは、M2.7はフロンティアのクローズドソースモデルに匹敵または近づいています。SWE-Proの56.22%は、GPT-5.3-Codexと一致しています。VIBE-Proでは55.6%、SWE Multilingualでは76.5%、Multi SWE Benchでは52.7%を獲得しました。AIコードジェネレーターを超えて、ミニマックスはM2.7をプロフェッショナルオフィスタスクに位置づけました。GDPval-AAでは、45モデルを評価し、M2.7は1495のELOスコアを達成しました。これは、オープンソースモデルの中で最高で、Opus 4.6、Sonnet 4.6、GPT-5.4に次ぐものでした。Toolathonでは46.3%の精度を達成し、ミニマックスのMM Claw評価では、40の複雑なスキル(それぞれ2,000トークンを超える)で97%のスキル準拠率を維持しました。モデルは、ミニマックスがエージェントチームと呼ぶものを介して、ネイティブのマルチエージェントコラボレーションをサポートします。ここで、複数のモデルインスタンスは、タスクに共同で作業する際に異なる役割のアイデンティティを維持します。この機能は、ビジネスオートメーションのためのAIエージェントシナリオを対象としています。ここで、エージェント間の安定した役割の境界と対立的な推論が必要です。ミニマックスは、M2.7をMixture-of-Expertsアーキテクチャで構築しました。つまり、229億の総パラメータのうち、サブセットのみが、各単一の推論パス中にアクティブ化されます。これにより、モデルは、比較可能な出力品質の密なモデルよりも安価で迅速に提供できます。これは、開発者がモデルをローカルで実行したり、限られたインフラストラクチャで実行したりしたい場合には、重要な考慮事項です。ミニマックスはまた、OpenRoomをオープンソース化しました。これは、主にAIによって構築されたインタラクティブなデモで、エージェントの相互作用をWeb GUI内に配置し、リアルタイムの視覚的なフィードバックを提供し、大規模な言語モデルを生産性の向上を超えてインタラクティブなエンターテイメントに拡張したいという関心を示しています。リリースにより、Meta、Alibaba、DeepSeekのモデルが境界を押し広げているオープンウェイトエージェントスキルの風景に、もう1つの競合オプションが追加されます。自己進化の角度 – モデルが意味のある方法で自身の後継者を改善する – はまだ初期段階ですが、M2.7は、100以上の自律的な最適化ラウンドから30%の内部ベンチマークの改善を提供し、ループ内に人間の介入はありません。
GoogleとIntelは、クラウドインフラストラクチャのパートナーシップを複数年間拡大し、Google Cloud全体でIntel Xeonプロセッサの導入を継続し、AIワークロード用に設計されたカスタムインフラストラクチャ処理ユニット(IPU)の共同開発を拡大することを約束した。同意は、4月9日に発表され、2つの分野をカバーしている。Google Cloudは、AI推論、トレーニングの調整、一般的なコンピューティングのために、最新のXeon 6チップを搭載したC4およびN4仮想マシンインスタンスを含む、複数のIntel Xeonプロセッサ世代を継続して使用する。別途、両社は、データセンターのホストCPUからネットワーク、ストレージ、セキュリティ機能をオフロードするプログラマブルなアクセラレータであるカスタムASICベースのIPUの共同開発を拡大する。IntelとGoogleは、2022年からIPUについて共同で作業しており、最初のカスタムIPU — コードネーム「Mount Evans」 — が、Google CloudのC3インスタンスと同時にリリースされた。それらのIPUは、200 Gbpsで動作し、仮想ネットワーキングやストレージ操作などのタスクを処理し、これらのタスクは、顧客のワークロード用に予定されているCPUリソースを消費する。次世代の共同開発IPUの詳細はまだ明らかになっていないが、業界の観測筋は、現代のAIコンピューティングクラスターのネットワーク需要を考えると、より高速な速度が予想される。CPUがAIにまだ重要な理由このパートナーシップは、業界がAIインフラストラクチャについて考える方法の変化を強調している。GPUやGoogleのTPUなどのカスタムアクセラレータがAIモデルをトレーニングして実行する重い計算を処理する一方で、CPUは、分散ワークロードの調整、データパイプラインの管理、そして大規模なAIシステムを運用するためのサポートインフラストラクチャの実行に不可欠である。Intel CEOのLip-Bu Tanは、同社のプレスリリースで、この取引について、CPUとIPUがアクセラレータだけで構築されたシステムではなく、アクセラレータと一緒に動作するバランスの取れたシステムでスケーリングする必要があるという現実性を強調した。GoogleのSVPおよびAIインフラストラクチャのチーフテクノロジストであるAmin Vahdatは、Intelがほぼ2 десяти年間パートナーであり、Xeonロードマップが将来のパフォーマンスと効率の需要に応えるための自信を与えていると述べた。この契約は、重大なCPU供給制約の時期に締結された。Intelは現在、Xeonのほとんどの生産が行われているIntel 10およびIntel 7製造ノードでの不足に苦しんでおり、サーバーCPUのリードタイムは6ヶ月に延び、Intelは需要が供給を上回るため価格を上げることを確認している。同社は、不足に対処するために、データセンター向けチップを消費者向けプロセッサよりも優先している。より広いAIチップの景観IntelのカスタムASIC事業、GoogleとのIPU共同開発事業を含む、は重要な収益源となっている。IntelのCFOであるDavid Zinsnerは、同社の2025年4四半期の収益発表会で、カスタムチップ部門は2025年に50%以上成長し、四半期末には年間収益率で10億ドルを超えたと述べた。この契約は、競争的に重要である。Googleは、内部および顧客向けのワークロードの両方で、ArmベースのCPUであるAxionを運用している。Amazonは、Annapurna Labs部門を通じてカスタムNitro NICを構築し、Microsoftは、同様のインフラストラクチャのオフロードのためにFPGAベースのソリューションを使用している。Googleは、IntelとのIPU共同開発を継続することで、完全に社内で構築するのではなく、IntelをCPUサプライヤーおよびカスタムシリコンパートナーとして維持する異なるアプローチを採用している。Intelにとって、このパートナーシップは、Tanのリーダーシップの下でのデータセンター戦略の高プロファイルの検証を提供する。同社は、クラウドプロバイダーが自社のチップを設計するようになるにつれて、関連性について疑問視されてきた。世界最大のクラウドオペレータの1つとのカスタムシリコンの深い関係を維持することは、Intelのファウンドリおよび設計能力が、インフラストラクチャに重要なワークロードに対して競争力があることを示している。金銭的な条件は開示されていない。クラウドプロバイダー間のAIアームズレースは、遅くなる兆しを見せていない。信頼性の高いCPUおよびカスタムチップのサプライチェーンを確保することは、GPUの調達と同様に戦略的に重要となっている。Intelが需要に対応するために生産をどの程度スケールアップできるか、そして同時に継続的な供給制約を管理できるかが、未解決の疑問である。