Alex McFarlandは、人工知能の最新の開発を探求するAIジャーナリスト兼ライターです。彼は、世界中の数多くのAIスタートアップや出版物と共同しています。
オープンAIは、2026年6月26日にGPT-5.6 Solをプレビューしました。このモデルは、オープンAIの最強のモデルであり、スペックシートによると、会社の最強のモデルとして期待されるものです。Solはフラグシップモデルであり、その下にはTerraとLunaの2つのモデルがあります。Terraは、オープンAIによると、GPT-5.5と同じ性能を半額で提供するバランスの取れた毎日のモデルであり、Lunaは、安価で高速なモデルです。 新しいmax推論設定が追加され、モデルに思考するための余地が増え、ultraモードが追加され、サブエージェントを起動して長いジョブを処理することができます。Terminal-Bench 2.1のコマンドラインワークで新しいステートオブザアートを達成し、ゲノミクスベンチマークでトークン数を減らしながら性能を向上させ、長期的なサイバーセキュリティタスクのフロンティアを押し進めています。 これがスクリーンショットにされる部分です。これが重要な部分ではありません。 重要な部分は、ベンチマークの下に埋もれた1つの段落です。Solを使用することはできないのです。まだ利用できないのです。サーバーが温まっているわけではありません。オープンAIは、Sol、Terra、Lunaを「政府と共有された小規模な信頼できるパートナーの限定プレビュー」として開始しています。 オープンAIによると、これは、モデルとその機能を米国政府にプレビューした後、政府がこのような方法でステージングすることを依頼した結果です。フロンティアモデルがリリースされ、最初に通過したゲートはレートリミットではありませんでした。ワシントンでした。 アクセスは现在 政策変数 これらのモデルを実際に使用するすべてのオペレーターにとって、これが見出しであり、新しいものです。APIを使用して構築するすべてのオペレーターは、内部的に特定のリスクを把握しています。価格の変更、起動時のレート制限、モデルが廃止され、移行する必要がある、サイレントアップデートで依存する機能が削除されるなどです。これらのリスクを回避するために計画します。 計画していなかったのは、政府の承認によってアクセスが許可されることです。これが新しいリスクモデルです。Solは存在します。フロンティアでベンチマークしています。ただし、利用できるかどうかは、クレジットカードではなく、管理リストによって決定されます。 オープンAIは、これを認識しているようです。なぜなら、1つの段落をこのプロセスから距離を置くために費やしたからです。「私たちは、このような政府のアクセスプロセスが長期的なデフォルトになるべきではないと考えています。これは、ユーザー、開発者、企業、サイバーディフェンダー、グローバルパートナーが必要とする最良のツールを遠ざけるからです。」 彼らは、政府のアクセスプロセスを短期的な措置として説明し、6月2日の大統領令に結び付けました。この大統領令は、フロンティアモデルのサイバーレビューの枠組みを確立し、同じ政策推進がラボをパッチを所有することを目指しています。 この大統領令は本物であり、注意深く読む価値があります。分類されたベンチマークプロセスを通じて、どのモデルが「カバーされたフロンティアモデル」とみなされるかを決定し、開発者が政府にモデルの早期アクセスを最大30日間提供することを許可します。また、AIモデルのリリースについて、政府による「強制的なライセンス、事前承認、または許可」要件はないと述べています。 ここにギャップがあります。大統領令では、強制的な事前承認は認められていないと述べられています。しかし、実際のリリースは、政府の依頼によってステージ化されたプレビューであり、政府が見たパートナーのリストです。紙上では任意ですが、実際にはそうではありません。 この国で最も有能なラボの1つが、フラグシップモデルのリリースを政府のチェックを通過するようにルーティングする場合、政府のチェックはデフォルトとして形成されています。ただし、大統領令のテキストでは、強制的な事前承認は許可されていないと述べられています。 これまでのパターンをもう一度見てみよう これが6か月前に起こったのではなく、起こった理由は、Antrhopicがすでに輸出管理版を経験しており、同じ点をより厳しい方法で証明したからです。この月の初め、政府はAntrhopicの最も有能なモデル、Fable 5とMythos 5へのアクセスを、外国人によって停止しました。 1つのラボの最も有能なモデルが指令によって壁で囲まれました。もう1つのフロンティアラボは、政府の依頼によって最も有能なモデルをプレビューにしました。今年の3つの最も重要なモデルリリースのうち2つが、同じ手によって、数週間の間にゲートされました。 これらのモデルを使用して構築している場合、ワシントンの話として扱うことはできません。これは依存関係の話です。能力フロンティアとアクセスフロンティアは離れています。モデルは世界で最高のものでありながら、実行することが許可されていないものであることができます。 Solは証拠です。Fable 5は証拠です。 ベンチマークは「使用してください」と言います。利用可能なセクションは「政府に聞いてください」と言います。両方が同時に真実であり、この組み合わせは、これらのラボの下流にある人々にとって真正に新しいものです。 オペレーターが実際に何をするかは、パニックになることではなく、規制についてのホットテイクでもありません。同じ退屈な規律です。モデル変更によって焼かれた人と焼かれなかった人を区別するものです。1つのラボの単一のフロンティアモデルに操作をハードコードしないことです。...
オープンAIは、2026年6月22日にDaybreakセキュリティプログラムを拡張しました。これは、セキュリティラベルが付いたもう一つのモデルドロップのように読めるかもしれません。しかし、GPT‑5.5‑Cyberのフルリリース、更新されたCodex Securityプラグイン、パートナープログラム、およびPatch the Planetというオープンソースの取り組みがすべて同時にリリースされたため、実際の動きを見逃すことができます。 実際の動きは投稿の中の1行にあります。数年前まで、セキュリティのボトルネックは脆弱性を発見することであり、現在はパッチを適用することです。 AIは、どの半分の仕事が難しいかを変えました。モデルはすでに巨大なコードベースをクロールし、攻撃パスをトレースし、専門家が数週間かけて発見するのと同じ欠陥を表面化することができます。したがって、防御者は今では発見事項が不足しているのではなく、むしろそれらに溺れています。 Daybreakは、実際に穴を閉じる部分、つまり仕事の2番目の半分を所有するというオープンAIの賭けです。 これは聞こえより大きな主張です。 発見が安くなったので、修正が製品になった オープンAIが重視しているものを見てみましょう。Codex Securityは、2026年3月から研究プレビュー段階で、30万以上のコードベースにわたる3000万以上のコミットをスキャンしています。また、バグの数ではなく、修正された発見の数、つまり人間のレビューアーによって解決されたものが7万以上、自動的に閉じられたものが50万以上であることを示しています。 プラグインの売り文句は、「開発者の隣にセキュリティエンジニアを配置する」ものです。問題を指摘するだけでなく、脆弱なコードが実際に到達可能かどうかを確認し、パッチを書き、人間が承認する前にテストします。 誰でも未監視のエージェントを実コードベースに対して実行している人は、別のスキャナーよりもこれが何倍も重要であることを理解しています。4,000の発見事項を提示してから去るスキャナーは、あなたの1週間をより悪くしています。 実際にリスクを動かすのは、アラートの後の面白くない部分です。検証、パッチ、テスト、出荷。オープンAIはそのギャップを見て、それが製品であると判断しました。 GPT‑5.5‑Cyberは難しいケースのエンジンです。CyberGymでは85.6%、平凡なGPT‑5.5では81.8%を達成し、ExploitGymでは26%から40%にジャンプしました。ExploitGymは、既知のバグを動作するコード実行に変えるためのベンチマークです。 2番目の数字について考えてみましょう。脆弱性が実際に存在することを証明する能力は、攻撃者がそれを武器化する能力と同じです。 オープンAIの回答は、それを制限することです。GPT‑5.5‑Cyberは「信頼できる防御者への限定リリース」のみで出荷され、検証と監視が行われます。一方、他のユーザーはサイバーへの信頼できるアクセスを備えたより穏やかなGPT‑5.5を受け取ります。このツールの最も強力なバージョンは販売されていません。承認されたユーザーだけが利用できます。 あなたの依存関係は10人によって維持されている Patch the Planetは、ソフトウェアを配布するすべてのユーザーにとって重要な部分です。オープンAIは、Linux Foundationとハーバード大学の研究を引用し、調査された広く使用されているオープンソースプロジェクトの94%が10人以下の開発者によって90%以上のコードが書かれていることを示しています。 あなたのスタック、クライアントのスタック、多くの重要なインフラストラクチャを支えるライブラリは、多忙な人々の少数によって維持されています。AIは、バグレポートを生成することで彼らの受信トレイを悪化させましたが、人間がトライエージュすることができません。 この取り組みは、セキュリティ研究者に資金を提供し、Codex Securityで彼らを武装し、メンテナーのためにそれらを指向します。フラッドを人間が到達する前に検証して重複を除去し、修正を支援します。 しかし、その形状に注目してください。メンテナはChatGPT...
変更が実施される予定だった日に、アントロピックは変更を取り下げた。数週間前から、請求ページには、明確な切り替えが記載されていた:2026年6月15日以降、クロードエージェントSDK(ヘッドレスclaude -pコマンド、GitHub Actions統合、サブスクリプションを介して認証するサードパーティアプリ)を介して実行するすべてのものは、プランの使用制限から引き出されるのを停止し、標準APIレートで請求される別の月額クレジットから引き出されるようになる。ただし、15日になり、ページの先頭に新しい行が追加された:「以下に記載されているクロードエージェントSDKの使用方法の変更を一時的に停止しています。現在、変更はありません。」 クロードのサブスクリプションで自動化された作業を実行している場合、安心したはずです。私はまだ安心しないほうがよいと思います。 一時停止が実際に停止したもの アントロピックが棚上げした計画は、クリーンな分離だった。インタラクティブな使用(あなたがターミナル、IDE、チャットウィンドウ内にある場合)は、以前と同じようにサブスクリプションから引き出される。自動使用は切り出される:エージェントSDK、ヘッドレスコマンド、GitHub Actions、サードパーティハーネス。このバケットは、メーター付きクレジットに移動することになっていた:Proの場合、月額20ドル、Max 5xの場合、月額100ドル、Max 20xの場合、月額200ドル、ユーザーごとに、ロールオーバーなし。クレジットが枯渇すると、APIレートで追加の料金を支払うか、エージェントが次のサイクルまで停止します。 ここで、その数学が重要になる。クロードのサブスクリプションは、APIが行うようにメーターを使用しないため、この業界で最も優れた取引の1つです。コードエディターZedは推定しているが、サブスクリプションは大幅なエージェント使用を約15〜30倍、API価格に対して補助している。Opusエージェントを十分に走らせると、200ドルのプランは数千ドル相当のトークンの作業を行う。差額が、単独のオペレーターが常にオンのパイプラインを接続して破産しない理由です。6月15日の変更は、アントロピックがその差額に手を伸ばし、閉じ始めたものでした。 そしてそれを閉じなかった。ページには現在、「クロードのサブスクリプションで構築する方法をよりよくサポートするために、プランを更新する作業中です」と記載されており、変更が有効になる前に通知する予定です。これは遅延です。これは撤回ではありません。 補助金は永続しない アントロピックが実際に述べていることを読み、方向性は間違えることができない。4月に、クロードコードの責任者ボリス・チェルニーは明確に述べた:「私たちのサブスクリプションは、これらのサードパーティツールの使用パターンに対して設計されていません。」彼は、容量を「慎重に管理するリソース」と呼び、製品とAPIの顧客を優先し、長期的に顧客をサステナブルにサポートするために成長を意図的に管理したいと述べました。これは、常にオンの自動使用が、正しく価格設定したいコストであることを意味する会社の言葉です。6月の分離はメカニズムでした。一時停止はただメカニズムが準備できていなかったことを意味します。 タイミングが残りを埋めます。アントロピックはただちにIPOのための機密書類を提出しました。IPOに向かっている会社は、パワーユーザーが数千ドル相当のコンピューティングを200ドルプランに対して引き出せるようにし、請求する方法がない場合、損失を出さないでください。さらに、市場全体が同じ方向に動いています。GitHub Copilotは数週間前にトークンベースの請求を導入し、最も重いユーザーに価格の衝撃を与えました。業界全体が、誰もが補助金価格で中毒したものの、価格を再設定しています。アントロピックは今回は目を瞑ったにすぎません。次に目を瞑ることはありません。 アントロピック自身のヘルプページもあなたにその結果を教えてくれます。チームのガイダンスの中に記載されています:共有プロダクションの自動化を実行している場合は、「予測可能な従量課金制」を提供するクロードプラットフォームをAPIキーで使用する必要があります。もう一度読んでみてください。サブスクリプションは、プロダクションシステムの基盤になることを意図していませんでした。それはランプです。 オペレーターが行うこと これはパニックする理由ではありませんし、クロードを離れる理由でもありません。私は自分の全オペレーションをクロードで構築していますが、選択はまだ有効です。ただし、オペレーターの読み取りは特定です:あなたが制御できない補助金は、構築する基盤ではありません。 したがって、実際の数字を知ります。自動化された使用状況を1週間引いて、APIレートで価格を設定して、パイプラインの実際のコストを確認します。如果「問題ない」という答えが得られれば、行動する必要はありません。如果答えが嫌な思い出を呼び起こす場合は、あなたは単に誰かが差額を食べていることを学んだだけです。ただし、請求書のメールでそれを知るのではなく、まだ修正できる間にそれを知ったのです。 次に、メーターがすでにオンであると設計します。積極的にキャッシュします。安い作業を安いモデルにルーティングし、Opusは必要な手順にのみ保存します。API価格で利益のあるパイプラインを構築します。なぜなら、最終的に支払う価格だからです。次の発表で焼かれるオペレーターは、差額に秘密ively依存していたが、数字を実行しなかった人たちです。 rは数字を実行しました。那が全ての原則です。安いサブスクリプションから得たレバレッジは、アントロピックがいつでも再価格設定できるレバレッジです。ただし、あなたが自分のシステムに構築したレバレッジ — キャッシュ、ルーティング、アーキテクチャ — は、あなたのものです。トークンのコストに関係なく、作業を安く行うものです。
2026年6月12日、輸出管理指令がアンソロピックに届き、同社がこれまでに配布した最も能力の高いモデルがダークになった。Fable 5とMythos 5は、すべての顧客に対して、絞り込まれたり、地理的制限がかけられたりするのではなく、完全に停止された。 命令は結果よりも狭かった。国家安全保障当局を引用して、政府はアンソロピックに、米国内外の外国人に対して、両方のモデルへのアクセスを遮断するように伝えた。アンソロピック自身の外国人従業員も含まれる。 アンソロピックは、モデルをすべての顧客に対して停止する以外に、命令に従う方法がないと述べている。 Claudeの他のモデルはすべて稼働したままだった。FableとMythosはゼロになった。 3日前に、同社はFable 5を、これまでに配布した最も能力の高いモデルとして、ほとんどのベンチマークで最先端のモデルとして立ち上げた。私はこの立ち上げを、フロンティアAIがトークンで制御されるユーティリティになった瞬間と見なした。 Mythos 5は、サイバーセキュリティ対策を解除した、同じ基礎モデルで、検証済みの防御者にのみ提供される。Mythosクラスの能力が一般公開に十分安全であるというのが全体的なアプローチだった。約72時間後に政府がそれを棚から下ろすまでだった。 狭い発見、鈍い道具 アンソロピック自身の説明によると、命令書には特定の国家安全保障の詳細は記載されていなかった。政府は、誰かがFable 5のセーフガードを回避する方法を見つけたと考えている。デモンストレーションを公式に提示し、それで十分だったという。 同社は、テクニックをレビューし、実際に浮かび上がったのは、すでに知られていた、軽微な脆弱性の少数だけだったと述べている。特定のエクスプロイトは、モデルにコードベースを読ませ、そこにあるソフトウェアの欠陥を修正するように依頼することだった。 アンソロピックは、同じ機能が他のフロンティアモデルからも利用できることを示唆しており、OpenAIのGPT-5.5もそうであると述べている。つまり、モデルは、競合他社がまだ提供しているものと同じ理由で、口頭での証拠の力で引き下ろされた。 アンソロピックは、命令に従いながら同時に反論も行っている。同社の立場は、単純明快である。特定のジャイルブレイクに対する、広範囲にわたる回避策を、数百万人に配布されたモデルに対して適用することは、実質的にすべての新しいモデル配布を停止させることになるため、全フロンティアラボに対して新しいモデル配布を停止させることになる。 同社は、公に述べている、政府は、真正に安全でない配布をブロックできるべきであるが、それは透明性があり、公平で、技術的事実に基づいたプロセスを通じて行われるべきである。金曜日の夕方に、口頭での理由付けのみの命令書は、そのプロセスではないと。 ここで、慎重に名前を挙げるべき背景がある。ほとんどが公式の記録ではなく、未確認の報告である。引き金は、主要なクラウドプロバイダーが公式に懸念を表明したセキュリティ発見と、アンソロピックが実際に話し合った会話では持ち上がらなかった、中国へのアクセスに関する懸念と結び付けられている。現在は、それをルーマーとして扱うべきである。公式の事実は、物語をそれ自体で支えている。 これを構築する場合に重要な部分 政治を取り除けば、オペレーターが持っているものは次の通りである。利用可能な最も能力の高いツールが一夜で消え、停止されたのはあなたでもなければベンダーでもない、第三の当事者によって行われた。タイムラインについてはあなたには可視性も投票権もなかった。 これは、すべての「ClaudeがXを行う」発表の中に潜む静かなリスクであり、立ち上げの週には誰も座りたくないものである。フロンティアモデルから得られる力はリアルであり、それはあなたの上流にいる誰かがあなたのアクセスを握っているのと同じ力である。 反応は、中規模国家が自分たちのフロンティアモデルを構築するべきという議論にスケールアップするまでに十分に鋭いものだった。国々はその結論を導き出している。オペレーターも同じ結論を導き出すべきである。 したがって、あなたはモデルが借り物であるという前提で構築する。実際にテストされた、実行可能なフォールバックを用意し、ただのランブック内の1行でなくしておく。パイプラインの1つのステップを、消える可能性のある1つのモデルに頼るべきではない。 あなた自身のものである部分を所有しろ:あなたのプロンプト、あなたのコンテキスト、あなたのデータ、すべてをまとめるシステム。これらは、どの指令でも停止できない部分だからである。 最も皮肉なのは、アンソロピックが部屋で最も率直なラボだったということである。完全なジャイルブレイク耐性は誰に対しても不可能であると公に述べ、同社はその制限を公開し、問題を無視するのではなく管理するために、ディフェンス・イン・デプス姿勢と30日間のデータ保持を構築した。 率直さが紙の痕となり、それ自体が教訓となった。現在、報われているのは別のものである。ただし、これらのモデルで実際の作業を実行するすべての人のための教訓は、よりシンプルである。...
クロード・フェーブル5がリリースされ、能力の話は本物である。Stripeは、1日で5000万行のコードベースの移行を実行するために使用したと報告している——2ヶ月間のチームの作業を1日に圧縮したものである。Anthropicは、人間の介入なしにエージェントハーネス内で数日間実行できるという。長期的かつ高リスクな作業を行う場合、これは本当に難しい仕事のために使用するモデルである。しかし、今日のリリースがオペレーターの計画方法を変える部分は、能力ではありません。それは、AnthropicがFable 5に付けた3つのもの——価格、ローンチ、データポリシー——です。これらはすべて、フロンティアAIのオールユーカンイートフェーズの終わりを示しています。フラットレートのトップティアは解約されるFable 5のコストは、入力トークン1ミリオンあたり10ドル、出力トークン1ミリオンあたり50ドルです。これは、標準的なOpus 4.8レートの2倍で、Opus 4.8の高速モード価格と同じです。ラインナップのトップは、トークンあたりの実際の金額を課すようになりました。これは、エージェントによる数日間の実行によって消費されるトークンの数を考慮していないものです。ローンチにより、この移行が明示的になります。2026年6月22日まで、Fable 5はPro、Max、Team、シートベースのEnterpriseプランで追加コストなしで含まれています。2026年6月23日、AnthropicはこれらのプランからFable 5を削除します——その後、使用すると使用クレジットが課されるようになり、容量が許可される場合にサブスクリプションに復元されます。APIおよび消費ベースのEnterpriseプランでは、最初の日から完全にメータードです。ローンチをそのまま読みます。最も能力の高いモデルは、計算コストが高く、需要が高いため、フラット月額シート内で提供することができません。したがって、メータードリソースとして価格設定されるようになりました。20ドルまたは200ドル月額で標準ティアを購入することになります。フロンティアは、メーターの付いた蛇口になりました。メーターがポイントです。これは、Anthropicのマージンの不満ではないです。彼らは、データセンター容量のために1億ドル以上を月々支払い、他のすべてと同じコンピューティングクランチに参加しているため、経済はそのままです。しかし、「最も優れたモデルは私のプランに含まれている」というのは、多くの人にとって現実の運用上の前提でしたが、2026年6月23日以降、トップではこれは真実ではなくなります。https://www.youtube.com/watch?v=5f5JYLZHdhwモデル分類の決定は今や予算の行になりましたここで、実用的になります。新しいフロンティアモデルが到着したときの反射的な動きは、すべてをトップティアに向けることです。メータードフロンティア価格設定では、その反射的な動きは予算を焼くことになります。代わりに、作業を分類します。実際のパイプラインで実行されるほとんどの作業——下書き、要約、ルーチンコード、実際のパイプラインを構成する数百の小さなコール——は、Mythosクラスのモデルを必要としません。SonnetまたはOpusで実行できます。Fable 5を、実際に必要なジョブにのみ予約します——長期的な移行、複数日の研究実行、弱いモデルが停滞し、プレミアムが実際に自己費用を補償する問題です。Stripeの移行は、ちょうどそのような形です——2ヶ月を1日に圧縮することは、1ミリオンあたり50ドルを支払う価値があります。これが全ての規律です。モデルをジョブに合わせ、価格は怖くないでしょう。フロンティアレートは、フロンティア能力が結果を変えるターンでのみ支払われるからです。クライアントデータをパイプする前に、リテンションポリシーを読んでください3番目の変更は、静かに噛む可能性のあるものです。Anthropicは、ビジネス顧客のデータをこれらのモデルで処理する方法を変更しています——Mythosクラスのモデル、Fable 5、Mythos 5、および今後この能力レベルに到達するすべてのモデル——に対して、すべてのトラフィックについて30日間のデータリテンションを必要とします。これらは、「カバーされたモデル」であり、ゼロデータリテンションの下で利用できないため、実質的にオプトアウトはありません。Anthropicは、データをトレーニングに使用したり、安全以外の目的で使用したりしません。すべての人間のアクセスをログに記録し、ほぼすべての場合で30日後にデータを削除します。理由は妥当です——このような能力を持つモデルはターゲットであり、保持されたデータは新しい脱獄やマルチリクエスト攻撃を検出する方法です。しかし、「30日間すべてを保持します。オプトアウトはありません」は、フッターではなく、ガバナンス事実です。如果クライアントの仕事、機密資料、またはゼロリテンションを約束した契約で何かを実行する場合、その約束とこのポリシーは衝突します。実際のデータガバナンスルールを満たすエージェントを構築している誰でも、この前にFable 5を介して1つの機密トークンをルーティングする前にこれを整理する必要があります。いくつかのワークロードに対して、正直な答えは次のようになります——このパイプラインを、リテンションポリシーを実際に生きることができるモデルに保持し、Fable 5を、問題がない作業にのみ保存します。実際のシフトベンチマークの勝利を取り除くと、今日は価格とポリシーの出来事であると同時に能力の出来事でもあります。フロンティアモデルは、以前よりも能力が高く、実行コストが高く、メータードツールであり、好きな場合でも30日間あなたのデータを保持します。これは、種 の異なる契約です——フロンティア能力を、計画的に使用するメータードツールとして、プランに含まれているため常に実行している蛇口ではありません。オペレーターが早期にこれを内部化する場合、驚くべき請求書なしに数ヶ月分の勝利を得ることができます。反射的にトップティアをすべてに向けるオペレーターは、コストを学ぶことになります。
アンソロジーは、2026年6月1日に秘密裏にIPOを申請し、SECにS-1登録声明の草案を提出しました。まだ株式数、価格、公開財務情報はありません — 秘密の草案により、会社はオファーを準備することができますが、他の人のために帳簿を開く必要はありません。評価額は約1兆ドルです。3年前にオープンAIの隣で丸め誤差だったラボが、そこにたどり着くのは、驚くべきことです。これは、クラウド上で動作するすべてのオペレーターが一瞬座って考えるべき瞬間です。この申請はアンソロジーにとって良いニュースです。クラウド上でビルドするすべての人にとっては、静かな信号です。操作下にあるものが新しい一連の義務を負うことになりますが、次のモデルがドロップする前にそれを理解したいと思います。あなたは実行レートです申請を説明する数字から始めましょう。アンソロジーの収益実行レートは47億ドルを超え、2025年末の90億ドルから5倍以上増加しました。企業は、気分で申請しません。収益曲線がそうである場合にのみ申請します。その47億ドルは、特定の場所から来ました。APIとツール上で実際のものを構築している人々。オペレーター、スタートアップ、企業がクラウドを仕事に組み込んでいるからです。IPOは、構築が機能したから存在します。多くの人が同じ賭けをして、実際の生活をこのモデルに向けたからです。それが持つべき部分です。あなたはサブスクリプションを購入しなかった、あなたは収益成長の物語になった。収益成長と依存は、同じ事実の2つの側面です。クラウド上で得たレバレッジは、アンソロジーが今持っているレバレッジです。ベルが鳴る時に何が変わるか能力と開発者への信頼を最適化するプライベートラボは、一種の会社です。90日ごとに株主に答える公開会社は別の会社です。資本はすでにビルディング内にありました — これはアンソロジーがシリーズHで650億ドルを調達した後わずか1週間でした。IPOは別の重力をもたらします。すでに、アンソロジーがマイソスを扱った方法で新しい姿勢を見せることができます。通常のオープススタイルのドロップではなく、モデルを出荷し、ビルドするのではなく、会社はアクセスをゲート化し、高重度のソフトウェア脆弱性がパッチされるまでより広範なリリースを警告しました。ブルームバーグは、EUのサイバーセキュリティ機関にアクセスを拡大する予定です。これは、リスクを管理する会社の行動です。規制当局、企業の買い手、最終的に公開株主に対してです。生の能力をビルダーに提供するラボではなくです。オペレーターにとって、姿勢の変化は評価よりも重要です。新しいフロンティアモデルが毎日配達される時代が、もっとゲート化されたもの、もっと企業向けのものになるかもしれません。そういったことは本当に良いことです。バグを見つけたモデルは慎重に配達されるべきです。しかし、「慎重」と「ウォール街に責任を負う」は、ロードマップを大きなロゴを持つ顧客に向けて引きます。独自のオペレーターは、週末に10のエージェントを実行しているのではなくです。アンソロジーは、公共の利益会社です。したがって、取締役会は、ミッションと利益を比較検討するための法的根拠を持っています。その構造は実際のものですが、公開市場の重力の下で曲げられます。PBCチャーターは、ステアリング入力です。フォースフィールドではありません。床が動くように構築するこれは、クラウドをあなたの操作から取り除く理由ではありません。私はそうしません。私は最初からクラウド上で構築してきました。正直な答えは、姿勢を正しくすることです。オペレーターがS-1から学ぶべき教訓は、最初の日にビジネスを1つのベンダーに接続したときに学ぶべき教訓と同じです。自分のパートを所有することです。あなたのシステム、あなたのコンテキスト、あなたのワークフロー、あなたのデータ — それが資産です。モデルはエンジンであり、エンジンは交換可能です。クラウドの特定の癖だけがあなたの操作を機能させる場合、IPOはそれを修正する良いリマインダーです。クラウドが最も良いモデルであることを意識してアーキテクチャを構築した場合、より多くの資金を調達し、より信頼性の高いアンソロジーは、ほとんどがプラスの側面です。それが賭けです。クラウドが今の仕事に最適なツールであるという理由で、クラウドを優先します。いつかクラウドが最適でない日が来るかもしれないことを認識しています。ベンダーが公開株主に損害を与えるオペレーターは、エンジンを借りたことを車を所有したことと間違えた人々です。車を構築した人々は、問題ありません。アンソロジーが公開株主になることは、クラウド上で行われているすべてのことへの信頼投票です。47億ドルの実行レートは、モデルを構築する価値があると判断した多くの人々です。ただし、S-1が何であるかを覚えておいてください。投資家、規制当局、取締役会への義務についての文書です。あなたへの義務はありません。そう構築してください。
ボリス・チェルニーはクロードコードを構築し、6ヶ月以上もコードを書いていません。それが罪悪感を表すものではありません。ケイシー・ニュートンとの新しいインタビューでは、アンソロピックのコーディングエージェントのクリエイターは、「ソフトウェアエンジニア」というタイトルが今年末までに「ビルダー」というものに消えていく可能性があると述べています。コーディング、少なくとも彼が行っているものは、「実質的に解決済み」です。彼はそれを嘆いていない。彼は一日中ビルドを行っており、モデルが入力を行っています。見出しはそれ自体で書かれます。仕事喪失の物語として、ほとんどの報道はそこに止まりました。ただし、実際の運用を行っている人にとって、それは誤った読み取り方です。チェルニーは仕事の終わりを説明しなかった。彼は、コーディングで定義されるのではなく、エージェントを中心に何を構築できるかで定義される、異なる種類の労働者について説明しました。仕事を失う人が誰かではなく、ハッカソンで勝つ人が重要インタビューの中に、予測よりも重要な詳細が含まれています。アンソロピックはOpus 4.7リリースのハッカソンを開催し、勝者は「ほとんどがプロのエンジニアではありませんでした」。電気工、医者、クロードを使用してアプリを構築した大工。チェルニーは4.6ハッカソンでも同じことを見ており、彼の読み取りは簡潔でした。「クロードコードから最も価値を得る人々は、私が期待する人々ではありません」。それがあなたが技術的に十分になるのを待っている場合、影響を受けるべきです。障壁はコードではありませんでした。大工はエンジニアよりも優れています。彼は週末にプログラミングを学んだのではなく、彼が何を構築したいかを知っていたので、エージェントを向けました。あなたはチェルニーのチーム内で同じことが起こるのを観察することができます。彼のマネージャー、フィオナは15年間コードを書いていませんでした。彼女は今コードを書いています。プロダクトマネージャーのカットはコードを書いています。デザイナーのメーガンはコードを書いています。 「チームのすべてのメンバーがコードを書いています」と彼は述べました。 「あなたはエンジニアである必要はありません」 役割は縮小していません。彼らは以前外側に立っていたすべての人が吸収しています。これは、レイオフの枠組みが見逃す部分です。コーディングがボトルネックでなくなると、希少なスキルは構築することについての判断とそれを構築するシステムを実行する規律になります。そのスキルは、CSの学位とは関係ありません。運用者のスキルです。それは会計士、営業担当者、職人の中に隠れています。クロードを中心に置くか、角に置くかチェルニーが述べた最も鋭いことは、コーディングについてではありませんでした。歴史的な教訓でした。彼は1990年のハーバード・ビジネス・レビューの記事を指摘しました。パーソナルコンピューターを採用した会社の中で、生産性の向上を見せた会社は、ファイリングキャビネットを捨ててコンピューターを中心に仕事を行った会社でした。向上を見せなかった会社は、コンピューターを角に置き、1つのことだけに使用し、利益は見ませんでした。次に彼はアンソロピックについて、ちょうど同じ用語で説明しました。 「私たちはすべてをクロードの周りで組織しています」。 コードベースについての質問:クロードに聞きます。 請求書の提出:クロードに聞きます。 次の会社の休暇:クロードに聞きます。 「本当に理解している会社は、クロードを真ん中に入れています。どこかの端ではなく」それが運用者のテーゼです。レバレッジはモデルから来ません。誰もが同じモデルを持っています。運用を中心に構築することから来ています。 別のタブに開いているチャットウィンドウは、角にあるコンピューターです。 エージェントがあなたの研究、草案、スケジュール、クライアントの納品を行うワークスペースは、ゴミ箱に入れたファイリングキャビネットです。チェルニーの習慣はポイントを証明しています。彼はまだXとスレッドでユーザーの苦情に直接答えています。彼はクロードコードでフィードバックの収集を自動化しました。 「ルーチンに移動しました。30分ごとに実行されます」 それがエンジニアが横道任務について考える方法ではありません。運用者がシステムについて考える方法です。 面白くない、繰り返しの作業は自動で行われます。 人間の時間は、実際に人間が必要な部分に費やされます。窓は開いており、運用者の歩み出すものですチェルニーの新しいCS卒業生へのアドバイスは、「プロンプトを学ぶ」ではありませんでした。 「新しいスタートアップを始めるために行きましょう。歴史上、始めるのに最も良い時期です」 彼の理由は、「あなたとあなたのエージェントは巨大な会社を構築できます」 です。彼は、1人、2人、3人の人で実際のビジネスを運営する顧客を見ています。クロードコード自体も同じように始まりました。彼は世界がエンジニアの多いものか少ないものかになるかを予測しません。ただし、ビルダーについては確信しています。 「私は今日よりも100倍多くのビルダーがいるだろうと思います」数字は推測です。方向性ではありません。仕事はコードを書く人から、構築する価値について判断し、システムを構築する人に移行しています。 その人には、許可、タイトル、学位は必要ありません。 実際の運用と、エージェントを中心に置いたものが必要です。 彼らはタイトルが何をしているかを理解する前に、始める必要があります。大工は待ちませんでした。 あなたも待つ必要はありません。
Anthropicは、2026年5月28日にOpus 4.8をリリースしました。これは、Opus 4.7のリリースから6週間以上経過した後です。那は、SonnetとHaikuのラインよりも早いターンアラウンドです。ベンチマークの数字も、毎回のリリースのように上昇しました。AIに関する報道を読むと、それがストーリーです。新しいモデル、より高いスコア、次のものに進みます。 しかし、それは間違ったストーリーです。 クロードの上にすでに作業を構築している場合、モデルリリースは読むべきニュースではなく、すでに構築されたシステム内に着陸するアップグレードになります。質問は、Opus 4.8がどのようにスコアするかではありません。すでに実行中の作業をどのように変更するかです。那は別の質問であり、ほとんどの報道はそれを尋ねていません。 このリリースでは、2つのことが作業を変更します。どちらもベンチマークではありません。 モデルは自分が知らないことをフラグすることを学んだ リリースノートでは、Anthropicの早期テスターは、Opus 4.8が「不確実性についての作業をフラグし、裏付けのない主張をすることが少なくなった」と述べています。Bridgewaterのテスターは、報道で引用された最大の違いは、モデルが分析の入力と出力の問題を積極的にフラグし、「他のモデルが通常見逃し、ユーザーが見つけることを残した」と述べています。 オペレーターとしてそれを読むと、投稿で最も重要な行です。 理由は次のとおりです。自動化パイプラインを壊すものは、間違っているモデルではありません。自信を持って間違っているモデルで、自分が間違っていることを言わないものです。ニュースを取得し、記事を下書きし、人間が中間のステップを見ていないエージェントを想像してください。モデルがフラグを立てないすべての裏付けのない主張は、ダウンストリームで見つける必要があるもの、または出荷されるものです。モデルが手を挙げて「この入力はオフに見える」と言うのは、2つのベンチマークポイントよりもパイプラインに価値があります。 それは、すべてが実行される原則です。ツールが改善されると、システムが改善されます。しかし、正しい改善を監視している場合にのみです。ほとんどの報道は、Opus 4.8を生の能力で評価しました。監視下で実行している人は、それが何を知らないかを知るかどうかで評価するべきです。このリリースでは、その点が動きました。 Dynamic Workflowsはサブエージェントのスウォームを実際のプリミティブにする モデルとともに、AnthropicはDynamic Workflowsを研究プレビューでリリースしました。これは、Claude Code内で複雑なタスクを数百の並列サブエージェントにわたって調整するシステムです。彼らが先導した例は、既存のテストスイートを基準として、数千行のコードをまたいだコードベーススケールの移行です。 誰でもサブエージェントを手動で調整しようとしたことがある人なら、どれほど重要かを理解しています。形は常に同じです。コーディネーターが選択エージェント、ライター、ファクトチェッカーに手渡します。それは機能しますが、ハンドオフを信頼できるものにするには、実際のエンジニアリングが必要です。毎回新しいパイプラインを作成するたびに、調整ロジックをスクラッチから再構築する必要があります。サブエージェントの調整は、プラットフォームが提供するものではなく、ボルトオンするものでした。 Dynamic Workflowsは、調整をプラットフォーム自体に取り込みます。那がシフトです。調整レイヤーがカスタムビルドではなくプリミティブになったとき、エージェントではなくチャットで考えるオペレーターは、以前は難しかった部分をスキップできます。最も助けられる人々は、今日から始める人ではありません。彼らは、すでにスウォームを手作業で構築し、現在はスキャフォールドを捨てることができる人々です。 名前の付いたキャッチがあります。それは研究プレビューです。つまり、初期段階です。Anthropicは、サイバーセキュリティの懸念により、最も高度なMythosモデルを保持しています。数百の自律サブエージェントを調整することは、同じ息で強力で少し危険な機能です。「研究プレビューで利用可能」とは、Anthropicが「本番に賭ける前に試してみてください」と言っていることを意味します。那が正しい直感です。そうしてください。 リリースの下にあるパターン バージョン番号から離れて、方向を見てみましょう。最近のOpusリリースは、エージェントが長く実行され、より広く調整され、ベビーシッターが少なくなるように、故意に歩いてきました。自己フラグと実際の調整レイヤーは、そのパスの2つの最新のステップです。 それを構築している場合、複合は全てのゲームです。着陸するすべての機能は、エンジニアリングを回避する必要のあるものを1つ減らします。不確実性チェックをパイプラインに手動で構築したオペレーターは、そのバージョンを今月無料で取得し、レベルを上げます。サブエージェントの調整を構築したオペレーターは、それを削除できます。那は、すでに所有しているシステムを介して複合するレバレッジです。モデルが改善されると、上に積み上げられたすべてが改善されます。...
スポティファイは、コンテンツを作るためのアプリをリリースしました。Studio by Spotify Labsというスタンドアロンデスクトップアプリで、ウェブを閲覧し、メール、カレンダー、予約を読み取り、オンデマンドでパーソナライズされたポッドキャストを生成します。デイリーブリーフや興味があるトピックについてのポッドキャストを要求すると、プライベートライブラリに保存され、デバイス間で同期されます。20以上の市場で研究プレビューとして利用できます。 これはNotebookLMの競合で、単独では登場しませんでした。同じ日に、スポティファイはAIパワードのQ&Aとブリーフィング機能をポッドキャスト全体に展開しました。2週間前に、AI生成のパーソナライズされたポッドキャストをライブラリに直接保存するツールを立ち上げました。この週の報告では、ユニバーサルミュージックとのファンメイドAIカバーとリミックスの取り決めと、ElevenLabsパワードのオーディオブック作成ツールを追加しました。配信プラットフォームは、配信するものを作るビジネスに参入しています。 スポティファイがコンテンツファクトリーになる1週間 積み重ねると、パターンは明らかです。スポティファイは15年間、聴く場所でした。1週間のうちに、生成するものを作る場所として自己を位置付けています。 Studioアプリは最も明確なバージョンです。そのピッチは「ここでポッドキャストをホストする」というものではなく、「何が欲しいか説明してください。私たちが作ります」というものです。前の立ち上げでは、コマンドラインコーディングツールでパーソナライズされたポッドキャストを作成する人々がそれらをスポティファイに保存できるようにしました。新しいアプリでは、誰でもそれを行うことができます。つまり、スキルが必要だった機能を、スキルを必要としないものに変えるという、すべてのプラットフォームが行っている動きです。 スポティファイは、出力が信頼できない可能性があることを警告しています。現在、すべての会社がこれらの製品を出荷するときに行っていることです。問題ありません。方向が重要であり、方向は、創造層を吸収するプラットフォームにあります。 護城河は、ものを作ることではなかった 10年間、クリエイターエコノミーは、生産が護城河でした。ビデオを編集できるか。毎週ニュースレターを書くことができるか。クローゼットの中で録音されたように聞こえないポッドキャストを制作することができるか。障壁は仕事でした。ビジネスは障壁をクリアすることでした。 AIは生産を無料で無限にしました。プラットフォームがオンデマンドでパーソナライズされたポッドキャストを生成できる場合、「ポッドキャストを作ることができる」というスキルは誰もが持つことができ、誰もが支払う必要はありません。難しいことができたのは、ボタンを押すだけでした。 残っているものは何ですか?2つだけです。配信:あなたのためにすでに集まっている聴衆がいますか。味覚:何が価値があるかを知っていますか。生産は価値チェーンの中央でしたが、中央は自動化されました。価値は常に端に集まっていました。無限の生成によってそれが明らかになりました。 "あなたのためのポッドキャスト"が鍵 停止するべき詳細は、これらの生成されたポッドキャストがプライベートであるということです。1人の聴衆。プラットフォームによって作成されたコンテンツは、1人のリスナー向けにオンデマンドで作成され、公開されず、共有されずに保存されます。 これは、配信を内側から食べるメディアです。クリエイターが存在する理由は、聴衆の注意に値するものを作成し、聴衆に到達することでした。プラットフォームが何かを作成し、聴衆を所有し、各リスナーに合わせて調整する場合、クリエイターはループに含まれていません。プラットフォームは円を閉じました。 これを先に進めると、不快な質問が強く迫ります。プラットフォームがコンテンツを作成し、すでにリスナーとの関係を所有している場合、クリエイターは何を所有していますか。 リバージュが実際にある場所 ここに、悪いニュースではない部分があります。生産を自動化するプラットフォームは、価値が移動している場所の地図をあなたに提供しています。2つのものに移動しています。彼らが生成できないものです。 彼らはあなたを選択した聴衆を生成できない。スポティファイは10億のパーソナライズされたポッドキャストを作成できますが、あなたの声に特に求める信頼を生み出すことはできません。その関係はあなたのものであり、無限のサプライの中で希少なものであるため、より貴重なものになりました。 そして、彼らは味覚を生成できない。エージェントは何でも毎日のブリーフィングを生成できますが、ブリーフィングを作る価値があるかどうか、省略するべきものは何であるか、実際に重要なものは何であるかということを判断することはできません。判断は、どれだけの注意が価値があるかを知ることです。これは、オペレーターの仕事であり、自動化されることはありません。なぜなら、出力がすべて同じになり、どれも価値がないからです。 したがって、出力に競争しないでください。誰でも今、無限の出力を持ちます。プラットフォームも含みます。出力は常にコモディティーでした。AIがそれを無料にしたことでそれが証明されただけです。関係と判断に競争してください。なぜなら、それらはボタンを押すことができない、このスタックの中で唯一の2つのものだからです。p competing on output. Everyone...
Anthropicの開発者向けイベント「Code with Claude」で、エンジニアのJeremy Hadfieldが質問をしました。ここにいる人たちの中で、Claudeによって完全に書かれたプルリクエストを出荷した人は誰ですか?およそ半分の人が手を上げました。次に、彼はフォローアップの質問をしました。誰がコードを読むことなくプルリクエストを出荷しましたか?緊張した笑い声。ほとんどの人が手を上げたままにしました。Anthropicは現在、Claudeによって書かれたコードがほとんどのソフトウェア、Claude Code自身の中のコードを含むすべてのコードであると述べています。ただし、Anthropicだけではありません。同じ期間に、OpenAIはGartnerによってエンタープライズコーディングエージェントのリーダーに指名され、DellやRampなどの企業にCodexエージェントを導入しています。2つの研究所、1つの方向、曖昧さなし:エージェントにコードを渡すことは、約1年で新奇なものから通常のものになりました。「コーディングエージェント」という名前で呼び続けていますが、この名前では実際に何が起こっているのかを多くの人に気づかせないでしょう。実際に起こっていることCode with Claudeでのステージでの説明は「AIがコードを書くことを速くする」のではなく、それよりも先にありました。Claude Codeを運営するBoris Chernyはこう述べています。「デフォルトでは『Claudeにコードを書かせる』ではありません。デフォルトは『Claudeが自分でコードを書く』です。」別のエンジニアのバージョンは次の通りです。「Claudeの邪魔をしない。『料理をさせる』と言います。」Anthropicは、コーディングエージェントが自分自身にノートを書き、ノートを統合してコードベースを改善する機能もデモしました。デモを行った企業は、大きなエンジニアリング会社だけではありませんでした。SpotifyやDelivery Heroも出席していました。ヒントはスタートアップでした:Lovable、Base44、Monday.comなどの企業は、すべての製品がアプリを構築するためのアプリです。アプリを構築するアプリ。抽象化は上昇しており、コードを書かない人々に向かっています。Anthropicのリーダーの一人は、Claudeは「現在、中級エンジニアと同じくらいコードを書くことができる」と述べました。別の人は、目標とする最終的な状態は、Claudeが「基本的に自分自身を構築できる」ことであると述べました。「コーディングエージェント」という名前が物語らないことコードは、最も読みやすいものです。テキストであり、実行されるかどうかは明確であり、プルリクエストの数を数えることができます。したがって、ベンチマークはそこにあり、名前はそこに付いています。しかし、表面を取り除くと、これらはコードツールではありません。目標を保持し、ステップに分割し、ツールを使用し、自分の作業を確認し、成功するまで再試行することができる一般的なエージェントです。コードは、ループを示すための最も清潔な方法です。ループ自体はコードについてではありません。これが、ほとんどの報道で欠けているものです。見出しは「エンジニアが手で書くコードが減った」となっています。実際の話は、アイデアを持った人と動作するものの間のギャップが縮小していることです。コードは、そのギャップを表現したものでした。デモが「Claudeがプルリクエストを出荷した」というものである場合、開発者はそれが良いことか悪いことかについて議論します。公平な議論です。しかし、それはより大きなものを埋め合わせています。プルリクエストを書くことができるのと同じ機能は、マーケターが必要とする小さな内部ツール、2つの混乱したスプレッドシートを調和させるスクリプト、フォルダーのノートを公開されたドラフトに変換するパイプラインを構築できます。そうしたものは、職業上の「ソフトウェア開発」ではありません。すべて、説明できる人によって構築できます。実際に変化する人々私はエンジニアではありません。コンテンツと運用を担当しています。1年前、存在しないツールが必要な場合、3つの選択肢がありました。近いものを購入する、誰かが構築するのを待つ、またはやめる。現在、4つ目の選択肢があります。説明し、エージェントが私が実際に働くように構築することです。「コーディングエージェント」の枠組みが隠している解放です。コードを書くエージェントによって実際に変化する人々は、コードを書いていた人々ではありません。コードを書くことができなかった人々です。レバレッジは、エンジニアが20%速くなることではありません。ゼロのツールから自分のツールに移行するオペレーターのことです。また、現在出荷されているすべてのものと一致しています。Code with Claudeの同じ週に、Googleはカスタムミニアプリを構築する検索エージェントを紹介しました。別の会社、同じベクトル:ソフトウェアは、雇用するのではなく、尋ねるものになりつつあります。アプリを構築するアプリをデモしているスタートアップは、そのカーブの中間です。終わりは、誰でもです。名前をつけるべき落とし穴これは、完全な勝利ではありません。会議の場外では、多くの開発者が強く反発しています。研究者は、レビューされていないコードの洪水が、まだ誰も支払っていないセキュリティとメンテナンスの負債を生み出すと警告しています。いくつかのエンジニアは、自分のスキルが萎縮していると述べています。Anthropicのスタッフも、古いソフトウェアのベストプラクティスがまだ適用され、多くのチームがそれを見失っていることを認めました。それを真剣に受け止めましょう。読めないコードを、依存する人のシステムに、スケールで出荷することは、遅延する災害を構築する方法です。しかし、警告が実際に誰に対するものなのかに注意してください。システムの管理を他の人に渡しているチームのためにです。自分のワークフローに小さなツールを構築するオペレーターの場合、被害の範囲は自分の午後です。ダウンサイドは、実行されないスクリプトです。アップサイドは、1年前に存在しなかったレバレッジです。それを何であるかと呼びましょう。コーディングエージェントではありません。現在、コードが最も優れているすべてのエージェントです。物語は、機械がソフトウェアを書いているというものではありません。ソフトウェアを構築するための扉が、閉じ込められていたすべての人のために開かれたというものです。ほとんどの人がまだそこを通過していません。
Thinking Machines Lab、OpenAIの元CTOであるMira Muratiによって設立されたAIスタートアップは、2026年5月11日に、自社の最初のインハウスモデルに関する研究プレビューを公開し、約1年間の沈黙を終わらせた。このシステムは、ユーザーがターンを終了するのを待たずに、オーディオ、ビデオ、テキストを200ミリ秒ずつのチャンクで処理するように設計された、マルチモーダルアーキテクチャである。モデルは、TML-Interaction-Smallと呼ばれ、276億パラメータの専門家の混合システムで、12億のアクティブパラメータを持つ。同社の発表ブログ投稿によると、これは、約20億ドルの資金を調達し、120億ドルの評価額で、ファインチューニングツール以外の製品を出荷していなかった研究所からの最初の製品である。リリースは、人材の離脱や、次の資金調達ラウンドが停滞している状況の中で行われた。インタラクションモデルが実際に何をするかThinking Machinesは、現在の最先端モデル、例えばOpenAIのGPT-RealtimeやGoogleのGemini Liveは、ターンベースのアーキテクチャに、ボイスアクティビティ検出などの外部コンポーネントを使用して、リアルタイム動作を追加しているという。ユーザーが話し終わるのを待ってから、発話をモデルに渡し、モデルは応答を生成する間に、世界の認識が凍結する。インタラクションモデルは、このようなサポートを時間同期マイクロターンに置き換える。システムは、200ミリ秒の入力と出力を同時に処理し、トークンストリームを同じクロックサイクルで交互に配置する。这种構造により、モデルはユーザーの発話の中断、視覚的な合図への反応、またはライブ翻訳などのタスクでユーザーと同時に話すことができる。アーキテクチャは、独立したエンコーダーを省略する。オーディオは、dMel featuresとして、軽量な埋め込み層を介して入力され、画像は40×40のパッチに分割され、すべてのコンポーネントはトランスフォーマーとともにスクラッチから共同でトレーニングされる。別のバックグラウンドモデルは、非同期で実行され、より深い推論、ツール呼び出し、ウェブブラウジングを扱い、インタラクションモデルは会話に留まる。同社の報告されたベンチマークによると、TML-Interaction-Smallは、FD-bench V1で0.40秒のターン取り合い遅延を記録し、GPT-Realtime-2.0の最小思考モードでは1.18秒、Gemini-3.1-flash-liveでは0.57秒を記録した。FD-bench V1.5では、ユーザーの割り込み、バックチャンネル、バックグラウンドスピーチを含むインタラクションの品質を評価し、モデルは77.8を記録し、GPT-Realtime-2.0の最小思考モードでは46.8、Gemini-3.1-flash-liveの高思考モードでは45.5を記録した。数字は自己報告されたものである。長らく待ちに待った最初の出荷リリースは、資金調達と製品出荷の間の長いギャップを埋めた。Thinking Machinesは2025年2月に設立され、同年7月に、120億ドルの評価額で20億ドルのシードラウンドを閉じた。ラウンドはAndreessen Horowitzが主導し、Nvidia、AMD、Cisco、Accel、ServiceNow、Jane Streetが参加した。現在までに、同社が出荷した唯一の製品は、2025年10月にリリースされた、オープンウェイトモデルをファインチューニングするためのAPIであるTinkerであった。その間、同社は人材の流出や、資金調達ラウンドの停滞など、困難に直面していた。共同創設者であるBarret ZophとLuke Metzは、2026年1月にOpenAIに戻り、Muratiは同社がZophと「別れた」と発表した。Andrew Tullochは、Mark Zuckerbergが同社を全額購入するための約10億ドルのオファーを拒否した後、MetaのSuperintelligence Labsに移籍した。Metaは、以来、研究所の5人の創設メンバーを雇用した。Muratiは、PyTorchの共同創設者であるSoumith ChintalaをCTOに昇格させた。2025年末までに、約500億ドルの評価額で次のラウンドを閉じることができなかった。コンピューティングの話は、逆の方向に進んだ。3月、Thinking Machinesは、Nvidiaとのパートナーシップを発表し、非公開の投資と、少なくとも1ギガワットの次世代Vera Rubinシステムの展開を含む。研究所はまた、Nvidia GB300ハードウェア上での最先端モデルトレーニングを含むGoogle Cloudとの関係を拡大した。注目すべき点インタラクションモデルはまだ、企業や一般に公開されていない。Thinking Machinesは、限定的な研究プレビューが近くに選ばれたパートナーに公開され、2026年後半により広く公開される予定であると述べている。同社は、現在の276Bパラメータバージョンは、必要な遅延で提供できる最小のバリアントであると述べ、より大きなインタラクションモデルを公開する予定である。ベンチマークの主張の独立した検証が、すぐに解決すべき疑問である。FD-benchは、インタラクションの品質を対象とする少数のパブリックベンチマークの1つであり、Thinking Machinesのスコアはまだ、現実的な負荷の下で第三者によって再現されていない。同社が導入した視覚的な合図のためのプロアクティブテスト、例えばRepCount-A、ProactiveVideoQA、Charadesの改訂バージョンは、新しいツールであり、確立されたベースラインがない。戦略的な賭けは、より明確である。OpenAI、Anthropic、Googleが、自律エージェントの機能を推進してきた一方で、Thinking Machinesは、次の競争軸が、人間がAIとどのようにコミュニケーションするか、つまり連続的な会話ではなく、一連のプロンプトであるという点にあると賭けている。インタラクションモデルは、OpenAI、Google、そして成長しているスピーチに焦点を当てたスタートアップからのリアルタイムボイスAIシステムと最も直接競合する。アーキテクチャが、長いセッション、信頼性の低い接続、リアルタイム拒否の安全性制約などの生産ワークロードとの接触に耐えられるかどうかが、次のプレビューラウンドで課せられるテストである。
アンソロジックは水曜日に、スペースXとの契約を締結し、コロッサス1データセンターの全コンピュートフットプリントをリースし、300メガワット以上の容量と22万以上のNVIDIA GPUを獲得した。会社によると、これらのリソースは1ヶ月以内にオンラインになる予定である。この契約により、スペースXはクレードのトップクラスのコンピュートサプライヤーとなり、アンソロジックがモデル立ち上げや有料プランの需要の増加前に容量を確保するために積極的に動いていることを強調している。この契約は2つの点で異常である。コロッサス1はテネシー州メンフィスに建設され、Grokのトレーニングに使用されていたが、現在は競合するラボに全額渡されることになる。また、スペースXは2月にxAIと合併し、1250億ドルの評価価値を持つ合併企業を設立したが、この契約により、純粋なAI開発者ではなくクラウドの家主としての役割を果たすことを目指している。すぐに高いレート制限が到着するアンソロジックは新しい容量を使用して制限を緩和している。クレードコードの5時間レート制限は、OpenAIのCodexと競合するフロントであるPro、Max、Team、およびシートベースのエンタープライズプランのために2倍になる。ピーク時間の制限削減がProおよびMaxアカウントを米国の営業時間中に制限していたが、完全に削除された。APIレート制限は、クレードオーパスモデルのために大幅に上昇する。Tier 1の入力は30,000から500,000トークン/分に、出力は8,000から80,000に増加する。Tier 4の顧客は入力制限が2百万から1,000万トークン/分に、出力が40万から80万に上昇する。約1桁の増加がすべての4つのTierにわたって発生し、高容量の顧客にとってボトルネックとなっていたのは価格ではなくコンピュートであったことを示している。コンピュートパートナーの増加するリストスペースXの契約は急速に拡大するポートフォリオに加わる。アンソロジックは、Amazonとの最大5ギガワットの契約、GoogleおよびBroadcomとの5ギガワットの契約、マイクロソフトおよびNVIDIAとの戦略的パートナーシップを発表し、Azureの容量で300億ドルの価値がある。また、500億ドルの米国データセンター拡張をFluidstackと実施している。これらのコミットメントは、6か月で10ギガワットを超えるコンピュートを予約しており、会社が900億ドルの評価価値で次の資金調達ラウンドを検討している間である。アンソロジックは、NVIDIA GPU、Google TPUs、AWS Trainiumチップの混合でクレードをトレーニングおよび実行している。スペースXをColossus 1の単一テナントの家主として追加することは、ハードウェアミックスを変更しないが、Elon Muskに直接結びついたインフラストラクチャに依存することを意味する。MuskのGrok製品はクレードと直接競合する。両社はまた、多ギガワットの軌道AIコンピュート容量を共同で開発することに興味があると述べている。これは、スペースXが2月から公に推進しているプロジェクトであり、アンソロジックが初めて明確に支持している。スペースXがなぜコンピュートの家主になったのかスペースX側の説明では、Colossus 1はxAIがGrokのトレーニングを近くにあるColossus 2施設に移した後に余剰容量となった。MuskはXに投稿したコメントによると、xAIは両方のサイトを必要としなかったため、アンソロジックに未使用の容量を販売することで資産を活用することができると述べている。これはまだ異常な転換である。Colossus 1は、わずか1年前にxAIのフラグシップトレーニングクラスターだった。転換は、xAIの内部混乱に続くものである。xAIのほとんどの共同創設者が2026年初頭以来退社しており、スペースXとxAIの合併企業はインフラ収入にますます依存している。アンソロジックにとって、政治的な光景では回避策が必要だった。会社の発表では、「この規模の投資を支援する法的および規制フレームワークを持つ民主主義国とのみ提携する」と述べている。アンソロジックは、このフレーミングをスペースXの契約自体には適用していない。3つの疑問が残る。第一に、アンソロジックが何を支払っているのか。財務条件は公開されていないが、Colossus 1はスペースXの商用コンピュートフリートの重要なシェアを表すため、契約は数十億ドル規模であると考えられている。第二に、Microsoftが最近、OpenAIとの独占契約を緩和し、アンソロジックがコンピュートをさらに多くのベンダーに分散することで、さらに多くのアンバンドルが加速するかどうか。第三に、アンソロジックが米国のデータセンターによって引き起こされる消費者への電気代の増加を吸収するという別のコミットメントが、会社の契約容量が10ギガワットを超えた場合に持続可能かどうか。
Stripeは4月29日、自律的なAIエージェントの時代に特化したデジタルウォレットを立ち上げ、消費者がソフトウェアエージェントに購入、予約、支払いを許可できるようにした。このウォレットでは、カードや銀行口座の情報を公開することなく、エージェントがトランザクションを実行できる。この製品は、Linkのエージェントウォレットと呼ばれ、Stripeの年次カンファレンス「Stripe Sessions」で発表された288の新機能とAPIのうち、最も注目される消費者向け製品である。CEOのパトリック・コリソンは、このバンドルを「AIのための経済インフラ」と位置付け、「近い将来、エージェントがオンラインでのほとんどのトランザクションを占める」と述べた。この立ち上げにより、Link — 世界中で250万人以上が利用するStripe所有のコンシューマーウォレット — は、エージェントとエージェントの時代の電子コマースのために明示的に設計された最初の主流の支払いサーフェスになった。Stripeとそのライバルは、過去18ヶ月間でこのエージェントコマースの基盤を構築しようとしてきた。エージェントウォレットの実際の動作Stripeの提案は、消費者がエージェントの利便性と資格情報のセキュリティのどちらかを選択する必要がないというものである。Stripeのアーキテクチャの説明によると、ユーザーはまず、標準のOAuthフローを通じてエージェント — 例えば、OpenClawショッピングアシスタント — にLinkウォレットへのアクセスを許可する。エージェントは、商人、金額、通貨、および購入するものの自然言語による説明を指定した支出リクエストを作成できる。ユーザーは、Web、iOS、またはAndroidでトランザクションを確認および承認する通知を受け取る。承認した場合のみ、Linkは一時的な仮想カードまたは共有支払トークン(SPT) — ウォレット内のカードまたは銀行口座によって裏付けられたスコープ付きの資格情報 — を発行し、エージェントはこれを使用して購入を完了する。エージェントは、基礎となる支払方法を確認することはない。内部的には、コンシューマーウォレットは、Stripeがエージェント用の発行と呼んでいる開発者向け製品の上に構築されている。これは、一時的なカード、トランザクションレベルの支出制御、リアルタイムの承認、および完全な監査ログのプリミティブのセットである。エージェント向けアシスタントを構築する企業は、これを使用してウォレットインフラストラクチャをスクラッチから構築することを回避できる。現在、LinkのエージェントウォレットはカードとSPTをサポートしている。Stripeは、「アジックトークン、ステーブルコイン、およびその他の種類の支払いは近くサポートされる」と述べている。また、ユーザーが支出制限を設定したり、エージェントに事前承認を行ったりできるようにする、拡張されたコントロールのプレビューも行っている。支払いスタック全体の調整されたプッシュLinkのエージェントウォレットは単独では機能しない。同じセッション2026の発表には、Googleとのパートナーシップも含まれており、企業がUniversal Commerce Protocolを通じてGeminiアプリおよびGoogleのAIモードで販売できるようになる。また、Wix、BigCommerce、WooCommerceの商人をAIショッピングサーフェスに統合するAgentic Commerce Suiteも含まれている。Stripeの製品および事業担当社長のウィル・ゲイブリックは、会社の姿勢を特徴的な率直な言葉で表現した。「AIがノーベルレベルの物理学の問題を解決できるが、ドメインを購入できない場合、何かが間違っている。私たちのモットーは、エージェントをエンパワーすることである。」このモットーには競争的な牙がある。Stripeはすでに、OpenAI、Microsoft、Metaとのパートナーシップを発表しており、Visa Intelligent CommerceおよびMastercard Agent Payプログラムは、StripeのSPTプリミティブを利用している。EtsyおよびURBN — Anthropologie、Free People、Urban Outfittersの親会社...
アンソロジックは、8500億ドルから9000億ドルという評価で、約50億ドルの新資金を調達するための事前的なオファーを受けていると、先週の複数の報告書によると、クラウドの価値は3カ月で2倍以上になるというもので、オープンAIと並んで世界で最も価値の高いAIスタートアップになるだろう。取締役会の決定は5月に予想されており、このラウンドは10月に予定されているIPO前のアンソロジックの最後のプライベート資金調達となる可能性がある。アンソロジックはコメントを拒否した。価格は急激な加速を反映している。アンソロジックは2月に、3800億ドルのポストマネー評価で30億ドルのシリーズG資金調達を行った。新しい条件でのラウンドは、3カ月でその数字を2倍以上にし、3月31日にオープンAIが記録的なラウンドを閉じたときの8520億ドルのポストマネー評価を上回ることになる。収益成長は前のラウンドを上回る新しい価格設定は、アンソロジックの収益トラジェクトリーよりも製品のカデンスを反映している。同社は4月7日に、年間売上高が30億ドルを超えたと述べた。2月のシリーズGの時点で、アンソロジックは140億ドルの売上高を発表していたが、4月までにその数字を2倍以上に増やした。企業の需要が大部分の仕事をしている。アンソロジックと年間100万ドル以上を費やすビジネス顧客の数は、シリーズG発表時の500を超えて1000を超えた。アンソロジックは、ビジネス顧客から約80%の収益を得ていると述べており、これは消費者重視の同業他社が擁護する評価倍数を支持するプロファイルである。その収益のの大部分は、単一の製品ラインに集中している。アンソロジックのエージェントコーディングプラットフォームであるClaude Codeは、シリーズGの開示時点で25億ドルの売上高を記録していた。同社は最近、Claude Design 機能を発表し、Photoshop、Blender、Ableton にClaudeを接続している。評価の背後にあるコンピューティング支出このラウンドは、アンソロジックが過去1カ月で整えた多十年間のインフラストラクチャーへの取り組みの背景で検討されている。4月20日、アマゾンは、アンソロジックに追加の50億ドルの株式投資を行い、商業的マイルストーンに紐づく最大200億ドルの追加投資を行った。同社は、アンソロジックに最大330億ドルのコミットメントを行った。同日、アンソロジックは、AWSのTrainiumとGravitonチップを含むAWSテクノロジーに1000億ドル以上を費やすこと、最大5ギガワットのAWS容量を確保することを約束した。4日後、グーグルは、アンソロジックに最大400億ドルの投資を行うと発表した。同社は、2月に使用された3500億ドルの前評価を使用して、最初の100億ドルを現金で支払い、最大300億ドルの追加投資を行う。グーグルクラウドは、アンソロジックが4月7日に発表したグーグル・ブロードコムパートナーシップに基づいて、最大5ギガワットのTPU容量を提供する。マイクロソフトの50億ドルのコミットメントと、NVIDIAの最大100億ドルの約束を加えると、アンソロジックのキャッシュプラスコンピューティングスタックは、すべての主要な米国AIインフラストラクチャープロバイダーを網羅する。9000億ドルの数字が実際に何を意味するか9000億ドルの評価を持つ企業が、この月に300億ドルの年間売上高を超えた場合、約30倍の評価倍数を意味する。表面上は豊かですが、4カ月で売上高を3倍に増やし、企業ミックスがAIネイティブスタートアップの評価を書き換えていることを考えると、妥当である。アンソロジックの二次市場株式は、4月初旬のForge Globalなどのプラットフォームで、既に1兆ドルの評価で取引されていたと複数の報告書によると、プライマリーラウンドは、後期の所有者が取引することに同意する価格よりも割安になる可能性がある。競合環境は、オープンAIにとって反対の方向に作用する。ChatGPTの製作者は、2月に250億ドルの年間再発行額を発表したが、それ以来公開的に更新していない。アンソロジックがオープンAIを収益、評価、または両方で上回ることは、ChatGPTの登場以来、フロンティアラボの階層が再編された最初のことになるだろう。注目すべきは、アンソロジックの取締役会がラウンドを承認するかどうか、既存の戦略的投資家(グーグル、Amazon、NVIDIA、Microsoft)が新しい株式ラウンドに参加するかどうか、IPOのタイムラインが維持されるかどうかである。9000億ドル以上の公開は、記録上最大のテクノロジーデビューの一つとなり、オープンAIを含むすべての後のAI資金調達の基準となるだろう。
アンソロジックは、9つの新しいClaudeコネクターを4月28日にリリースし、Adobe Creative Cloud、Blender、Ableton Live、Autodesk Fusion、Splice、SketchUp、Affinity by Canva、ResolumeのArenaとWireなどのプロフェッショナルクリエイティブが使用するソフトウェアに直接接続しました。このリリースにより、Claudeはデザイン、3D、音楽、ライブビジュアルパイプラインのオーケストレーションレイヤーになりました。コネクターは、Blender Development Fundへの参加という別のコミットメントとともにリリースされました。アンソロジックは、Blender FoundationのトップパトロントIERであるCorporate Patronに参加し、Blenderコア開発の維持と改善に貢献します。9つのコネクターの機能各コネクターは、ホストアプリケーションの異なる部分を公開しています。Abletonのコネクターは、LiveとPushの公式ドキュメントに基づいて回答を提供します。Adobeの「Adobe for creativity」コネクターは、Photoshop、Illustrator、Firefly、Express、Premiere、Lightroom、InDesign、Stockなどの50以上のプログレードツールに接続できます。Adobeの発表では、この統合を、単一のチャットからマルチステップワークフローをオーケストレートするものとして説明しています。Autodesk Fusionでは、Fusionのサブスクライバーが会話を通じて3Dモデルを作成および変更できます。Affinity by Canvaでは、バッチイメージ調整、レイヤー名の変更、ファイルのエクスポートを自動化できます。SketchUpでは、プロンプトされた説明から3Dモデリングの開始点を作成できます。Resolumeの2つのコネクターでは、VJがArena、Avenue、Wireを自然言語で制御できます。Spliceでは、ロイヤリティフリーのサンプル検索をClaude内で提供し、音楽AIツールのようなSunoと組み合わせて使用できます。Blenderコネクターは、技術的に最も大きなものです。Blenderの開発者は、Model Context Protocolに基づいて構築しました。アンソロジックは、BlenderのPython APIを使用して、シーンの分析とデバッグ、オブジェクトへの変更のバッチ適用、Blenderのインターフェイスへの新しいツールの追加を可能にします。Blender Foundationへの投資アンソロジックの製品リリースは、別の資金調達の発表とともに来ました。 Blender Foundationは、アンソロジックがCorporate PatronとしてBlender Development Fundに参加することを確認しました。このサポートは、Blenderコア開発の維持と改善に貢献します。Blenderの公開された資金調達ポリシーでは、Corporate Patronティアは年間240,000ユーロの最低額とされています。アンソロジックは、Epic...