

Google は 2 月 19 日、Gemini 3.1 Pro をリリースしました。これは、同社のフラグシップ AI モデルであり、推論性能を 2 倍以上向上させながら、前身モデルの価格を維持しています。最も注目すべき数字は、ARC-AGI-2 というベンチマークで、モデルが完全に新しいロジック パターンを解決する能力をテストします。このベンチマークでは、Gemini 3.1 Pro は 77.1% のスコアを獲得しました。Gemini 3 Pro は 31.1% でした。この 46...


デビッド・シルバーは、強化学習の先駆者であり、Google DeepMindでのAlphaGoの開発を主導した人物で、ロンドンを拠点とするスタートアップIneffable Intelligenceのシードファンディングで1億ドルを調達しています。このスタートアップは、大規模言語モデルは超知能への間違った道であるという前提に基づいています。この取引は、Sequoia Capitalが主導し、最終化されれば、ヨーロッパのスタートアップが閉じたことがある最大のシードラウンドになります。Nvidia、Google、Microsoftは参加するために交渉をしている間、交渉はまだ進行中で、最終的な条件は変わる可能性があります。このラウンドでは、会社の評価額は4億ドルとなります。シルバーは、DeepMindでの強化学習のVPを務め、2025年11月にIneffable Intelligenceを設立し、2026年1月に取締役に任命されました。会社の使命は、シルバーが説明したように、「すべての知識の基礎を自己発見する、無限に学習する超知能」を構築することです。この説明には、故意の挑発が含まれています。インターネットのテキストで訓練されたLLMを拡張するために、業界が数百億ドルを費やしている間、シルバーは、このアプローチには天井があると主張しています。人間のデータに対する反対シルバーのテーゼは、彼が有名になった仕事から直接導かれています。2017年、DeepMind CEO Demis Hassabisとシルバーは、AlphaGo Zeroを発表しました。これは、人間のゲームデータがまったくないで、自己対戦を通じて完全に学習したAlphaGoのバージョンです。これは、元の人間が訓練したAlphaGoを100ゲームで0に負かしました。結果は、AIコミュニティを驚かせました。スクラッチから、相互作用と報酬のみを通じて学習したシステムは、人間の知識に匹敵するだけでなく、それを完全に上回り、人間データで訓練されたバージョンは1ゲームも勝つことができませんでした。シルバーは、このアプローチをAlphaZeroを通じて拡張しました。AlphaZeroは、スクラッチからチェス、将棋、囲碁をマスターしました。また、MuZeroを通じて、ゲームのルールを教えられないで計画する方法を学びました。各システムは、同じ結論を強化しました。最良のパフォーマンスは、人間を模倣することではなく、経験を通じて学習することから来ます。DeepMindのポッドキャストでは、シルバーは、退職する前に、2つのAIの時代について説明しました。現在の「人間のデータの時代」と、来る「経験の時代」です。現代のLLMは、人間のデータとフィードバックに依存しており、固有の制限を生み出しています。人工超知能への道は、人間の知識を完全に超えることです。これは「アルバータ学派」の哲学です。シルバーが学んだアルバータ大学にちなんで名付けられました。強化学習の先駆者であるリッチ・サットンは、2019年のエッセイ「The Bitter Lesson」で、人間の知識に頼る方法は、計算と学習を拡大する方法に必ず敗れると主張しました。シルバーは、この原則に基づいて会社を構築しています。超知能スタートアップレースシルバーは、メジャーラボを離れて、超知能に焦点を当てたベンチャーに異常な額の資金を調達した最初のエリート研究者ではありません。OpenAIの元チーフサイエンティストであるイリヤ・サツケーバーは、2024年に同様のテーゼでSafe Superintelligenceを立ち上げました。那は、製品会社の圧力の外側で集中した努力により、超知能に早く到達できるというものです。SSIは、以来数十億ドルを調達し、300億ドルを超える評価額を達成しました。この類似は、教訓に富んでいます。両者の研究者は、自分たちが定義した組織を離れました。両者は、現在のパラダイム – LLMのスケーリングとチャットボットのサブスクリプションの販売 – が迂回路であると信じています。両者は、製品や結果を生み出す前に、評判のみに基づいて大量の資本を引き付けました。しかし、アプローチは異なります。サツケーバーは、SSIの技術的な方向性についてほとんど公に話していません。シルバーは、明確に述べています。強化学習、自己対戦、第一原理からの学習 – 言語モデルではありません。ほとんどのAIラボがLLMをより良く推論させる方法について議論している間、シルバーは、LLMが基礎となるべきかどうかを疑問視しています。1億ドルのシードは、AIの資金調達の風景がどのように劇的に変化したかを反映しています。 Anthropicは最近、350億ドルの評価額に近づきました。OpenAI、Google、Anthropicが新しいモデルを加速するペースで出荷するにつれて、フロンティアAIの競争圧力が激化しています。この背景に対して、シングルリサーチャーが率いる事前製品会社の4億ドルの事前評価額は、新しい正常です。Sequoiaにとって、取締役のアルフレッド・リンとパートナーのソーニャ・ハウンの主導でラウンドを主導することは、明確です。シルバーは、本当に人間の知能を特定のドメインで超えたシステムを構築した、生きている5人のうちの1人です。強化学習が一般的な超知能への正しい道である場合、彼はそれを見つける最も可能性のある人物です。リスクは同様に明確です。AlphaGoとAlphaZeroは、明確なルール、完全な情報、明確な報酬シグナルを持つドメインで成功しました。現実世界には、これらの特性はありません。ゲームを超えて自己対戦をオープンエンドドメイン – 科学、エンジニアリング、推論 – に拡大することは、未解決の問題です。シルバー自身がDeepMindで数年間取り組んだ問題です。Ineffable Intelligenceのロンドン拠点は、ヨーロッパのAIの野心のための潜在的なアンカーとしても位置付けられています。ヨーロッパは、世界クラスのAI研究者を生み出していますが、アメリカの研究所がより大きな報酬とより迅速な拡大インフラストラクチャを提供するため、研究者を維持するのに苦労しています。1億ドルのヨーロッパのシードラウンドは、シリコンバレーの最も優れたベンチャー企業によって支持されており、フロンティアAI研究の地理が広がっていることを示しています。ただし、Sequoia、Nvidia、Google、Microsoftはすべてアメリカの投資家です。シルバーの賭けは、業界のLLMへの執着が地元の最大値を表す – 印象的ですが、最終的には限界がある...


アダニ・グループは、1,000億ドルの投資を発表し、2035年までにインド全土に再生可能エネルギーを使用したハイパースケールAIデータセンターを構築することを目指しています。このコミットメントは、ニューデリーで開催されたインドAIインパクトサミットの2日目に明らかとなり、インドのAIインフラストラクチャーへの企業による最大の投資となり、世界的に見ても最大級のものとなります。この投資は、AdaniConnexの既存の2 GWプラットフォームから5 GWのデータセンター容量を目指しており、GoogleやMicrosoftとのパートナーシップを通じて4つの主要キャンパスで実現される予定です。アダニ社は、この直接支出が、サーバー製造、主権クラウドプラットフォーム、支援産業に追加の1,500億ドルを誘発し、10年間で2,500億ドルのAIインフラストラクチャー・エコシステムを作り出すと推定しています。「エネルギーとコンピューティングのバランスをとることができた国が、次の10年を形作るだろう」と、アダニ社の会長ガウタム・アダニは発表で述べました。GoogleとMicrosoftが構築を牽引データセンターの拡張は、プロジェクトに即座の信頼性と需要をもたらす2つのハイパースケーラー・パートナーシップによって牽引されています。Googleとの間で、アダニ社は、Andhra PradeshのVisakhapatnamにインド最大のギガワット・スケールAIデータセンター・キャンパスを構築し、Noidaにも施設を設ける予定です。Googleは、5年間で150億ドルをVisakhapatnamハブに投入し、新しい国際海底ケーブルを含み、Google SearchやYouTubeのグローバル基準と同じ仕様で構築される予定です。最初のフェーズのみで約1 GWの電力容量を目指しています。Microsoftとのパートナーシップは、HyderabadとPuneのキャンパスを網羅し、ネットワークに地理的多様性を追加します。Flipkartも、デジタル・コマースと高性能コンピューティングに焦点を当てた2番目のAIデータセンターに署名しています。これらのパートナーシップは、データセンター開発における基本的な課題の1つである、保証された需要に対処しています。ギガワット・スケールの施設を構築することは、コミットメントされたアンカー・テナントがなければ、資本集約的でリスクがあります。世界最大の2つのクラウド・プロバイダーがロックインされ、インフラストラクチャーがグローバル・スタンダードを満たすことを他の潜在的な顧客に信号することで、投資をデリスク化し、信号を送信します。アダニ社は、施設だけでなく、運用に必要な電力供給も構築しています。同社の西インドのKhavda再生可能エネルギー・プロジェクトは、約7 GWが運用中であり、アダニ・グリーン・エナジーのポートフォリオ全体で11 GW以上となり、エネルギー基盤を提供します。同社は、再生可能エネルギー発電とバッテリー・ストレージの拡大に著しい追加投資を計画しており、世界最大の単一ロケーション・バッテリー・エネルギー・ストレージ・システムの1つを含みます。再生可能エネルギー・アプローチは重要です。エネルギー・コストは、データセンターの最大の継続的な費用であり、GoogleやMicrosoftのようなハイパースケーラーにとって、炭素中和電力は増加的に調達要件となっています。データセンターとエネルギー・サプライを両方コントロールすることで、アダニ社は、競争的に価格設定されたクリーン・コンピューティングを提供できます。これは、世界的に見てもこの規模ではほとんどの競合他社が一致できない組み合わせです。インドのAI主権への道この発表は、インドが世界的なAIレースで積極的に自己を位置付けているときに来ました。インドAIインパクトサミットは、グローバル・サウスで初めて開催された世界的なAIサミットであり、約20カ国の国家元首と、Meta、Microsoft、Google、OpenAI、NvidiaのCEOが参加しています。インド政府のAIミッションは、国内AI能力の構築に約120億ドルをコミットしています。インドのAI採用はすでに加速しています。インドは現在、1億人の週間ChatGPTユーザーを擁し、OpenAIの2番目の最大市場となっています。しかし、消費のみではAI経済を構築できません。インドが欠けているのは、AIモデルを国内でトレーニングし提供するために必要な物理インフラストラクチャー・レイヤー、つまりデータセンター、チップ、エネルギー・システムです。代わりに、米国やシンガポールにあるコンピューティング能力に依存しています。アダニ社の計画は、同社が主権AIスタックと呼ぶ5層構造を通じてこのギャップに直接対処しています。アプリケーション、モデル、チップ、エネルギー、データセンターで構成されています。同社は、インドのスタートアップ、研究機関、ディープ・テック・エントレプレナー向けにGPU容量を予約しています。この詳細は、純粋な商業的な不動産プレイからこのプロジェクトを区別しています。また、インドの大学との間で、AIインフラストラクチャー・エンジニアリングの専門カリキュラムを開発し、トランスフォーマー、電力電子、熱管理システムのサプライ・チェーンを地元化しています。主権AIの枠組みは意図的です。サウジアラビアからフランスまで、国々は外国製コンピューティングへの依存が戦略的な脆弱性を生み出すことを認識して、国家AIインフラストラクチャー・プログラムを立ち上げました。インドのアプローチは、規模と構造で異なります。政府が建設計画を立てるのではなく、既存のエネルギーと物流資産を持つ民間企業を活用して、商業的および国家的利益の両方に役立つインフラストラクチャーを構築しています。規模の文脈1,000億ドルのアダニ社のコミットメントは、ほとんどの個別のAIインフラストラクチャー支出発表を上回ります。比較として、Amazonは将来の数年間で、世界中でAIとクラウド・インフラストラクチャーに2,000億ドルを費やす予定です。Microsoftは、2025年度 aloneに800億ドルをコミットしています。しかし、これらの数字は世界的な運営を網羅しています。アダニ社の約束は、1つの国に集中しています。このベットには実際のリスクがあります。アダニ・グループは、2023年にショート・セラーの報告書が同社の時価総額から約1,500億ドルを引き下げた後、信頼性の危機に直面しましたが、同社はその後大きく回復しています。10年間、1,000億ドルのインフラストラクチャー・プログラムを実行するには、資本市場への継続的なアクセス、規制環境の安定、AIコンピューティングの需要の成長が必要です。しかし、AIにおけるインフラストラクチャー対イノベーションの議論は収束しつつあります。AI企業が数百億ドル規模の評価額を獲得するにつれ、物理的なレイヤー、つまり電力、冷却、接続性が、拘束的な要素となっています。アダニ社は、世界で最も人口の多い国におけるこのレイヤーを制御することで、世界的なAI経済の重要な部分を制御することを賭けています。既にハイパースケーラー・パートナーシップが確立されていることを考えると、このベットは1年前よりも投機的ではありません。


OpenAIは、オープンソースエージェントOpenClawのオーストリア人開発者であるPeter Steinbergerを、会社の次世代の個人用AIエージェントのリーダーに迎えた。CEOのSam Altmanは、土曜日に採用を発表し、Steinbergerを「多くの素晴らしいアイデアを持つ天才」と呼んだ。この動きは、OpenAIが自律的なAIエージェントへの取り組みを強化していることを示している。Steinbergerが過去数ヶ月で単独で開発したOpenClawは、1月末にウイルス的に広がった後、急速に成長した。「私の次の使命は、母親でも使えるエージェントを作ることだ」とSteinbergerは、ブログ投稿で説明した。「私はビルダーである。私は世界を変えたいのではなく、会社を大きくしたいのではない。OpenAIとチームを組むことが、世界中にこれをもたらす最速の方法である。」PSPDFKitからOpenClawへSteinbergerは13年間、Appleエコシステムに焦点を当てた開発ツール会社PSPDFKitを構築した。3年間の休暇を経て、彼はソフトウェア開発に戻ったが、まったく異なる分野でだった。OpenClawは、ClawdbotとMoltbotという名前を経て現在の名前になったTypeScriptベースのWebアプリケーションで、20年間iOSとmacOSのコードを書いてきた人物によって構築された。このピボット自体は、AIツールが未知のドメインでの構築の障壁を低減したことを証明している。このプロジェクトは2026年1月末にウイルス的に広がり、オープンソースの性質が一部の理由である。OpenClawの魅力は簡単だった。ローカルで実行され、シェルコマンドを実行し、ファイルを管理し、コミュニティによって構築されたスキルのライブラリを介して外部サービスに接続するエージェント。その急速な採用は成長の痛みとともにやって来た。独立したセキュリティ研究者は、OpenClawのClawHubマーケットプレイスにあるスキルに悪意のあるコードが含まれていることを発見した。これは、エージェントプラットフォームを有用にする拡張性がそれらを脆弱にすることも意味することを思い出させるものである。Steinbergerは迅速に動き、VirusTotalと提携して自動スキャニングを実装したが、この事件は、どのオープンエージェントエコシステムにも直面する構造的な課題を強調した。OpenClawが財団に移行OpenAIは、OpenClawをその企業構造に吸収するのではなく、プロジェクトを独立したオープンソース財団に移行させることを後援した。Altmanは、この決定を多エージェントの観点から説明した。「未来は非常に多エージェントになるだろう。オープンソースをサポートすることが私たちにとって重要である。」OpenClawリポジトリは、コミュニティからの貢献を受け続けることになる。財団構造は、プロジェクトの方向性を制御する単一の会社を防ぐように設計されている。OpenAIの後援により、プロジェクトの独立性を保ちながら継続的な開発が保証される。これは、Linux FoundationやApache Software Foundationをサポートする大手テクノロジー企業と同様のモデルである。この取り決めは、業界全体の変化も反映している。Anthropicによって開拓され、現在はOpenAIによって採用されているスキルフレームワークは、AIエージェントを特殊な機能で拡張するためのデファクトスタンダードになった。OpenClawをオープンに保つことで、OpenAIはこの新興エコシステムとの互換性を保証し、それを断片化しない。OpenAIのエージェント戦略への影響Steinbergerの採用は、OpenAIのエージェントに焦点を当てた積極的な動きのパターンに合致する。同社は、ChatGPT Atlasをエージェントモードで発表し、ブラウザに多段階のタスクを自律的に実行する能力を与えた。先月、同社は最新のモデル更新とともにエンタープライズエージェント管理ツールをリリースした。しかし、Steinbergerが述べたように、一般のユーザーにとって信頼性の高いエージェントを構築することは、未解決の問題のままである。現在のAIエージェントはデモや制御された環境で優れているが、実世界のタスクの予測不可能な複雑さに苦労する。フライトを予約するエージェントを構築することは印象的だが、フライトがキャンセルされたときにエッジケースを処理するエージェントを構築するには、別のレベルの堅牢性が必要である。Steinbergerの経験は、実際のユーザーが毎日使用する製品を構築した実践的な洞察を提供する。彼は、理論的には何ができるかだけでなく、実際のユーザーが予期せぬ方向にエージェントを押したときに何が壊れるかを理解している。Altmanは、この仕事は「すぐに私たちの製品オファリングの核心になる」と述べた。言語は、OpenClawのアーキテクチャと教訓が、ChatGPTがエージェントタスクを処理する方法に影響を与えることを示唆している。OpenAIにとって、この採用は、数週間で最も人気のあるオープンソースエージェントを作成した人物が、会社の最先端のモデルとインフラストラクチャにアクセスして、さらに大胆なことを成し遂げることができるという賭けである。より広いエージェントエコシステムにとって、企業による採用は、よくある緊張を引き起こす。企業スポンサーを獲得したオープンソースプロジェクトは、リソースを獲得するが、コミュニティの信頼を失うリスクがある。OpenClawの財団モデルが真正な独立性を維持するか、形式的なものになるかは、OpenAIが今後数ヶ月間にどのようにガバナンスを扱うかによって決まる。


インドには現在、100万人の週間アクティブなChatGPTユーザーが存在し、OpenAIの第2位の市場となっています。CEOのSam Altmanは、インドAIインパクトサミットの前に、この数字を共有し、インドは「フルスタックAIリーダー」となり得る国であり、インド政府との提携を深める計画があると述べました。この数字は、ChatGPTの800万人の世界的な週間アクティブユーザーのうち8人に1人がインドにいることを意味します。さらに驚くべきことは、インドのユーザーベースは過去1年で4倍に増加し、主に学生によって推進されています。現在、インドにはChatGPTの学生ユーザーが最も多い国となっています。しかし、注目すべき数字は、より難しい質問を隠しています。インドのユーザーは圧倒的にChatGPTの無料プランを使用しています。平均月額モバイルデータプランの費用が3ドル未満の市場で、無料ユーザーを有料サブスクライバーに変えることは、OpenAIの成長物語が収益物語になるかどうかをテストすることになります。インドのAIユーザーをめぐる競争OpenAIは、インドを戦略的優先順位として扱う唯一の企業ではありません。Googleは、先月、Reliance Jioと提携して、Jioの5Gサブスクライバーに18か月間のGemini AI Proアクセスを無料で提供しました。最初は18歳から25歳のユーザーを対象としていたが、後にすべての対象ユーザーに提供を拡大しました。この取引には、Gemini 3、パーソナルインテリジェンス機能、および2TBのクラウドストレージへのアクセスが含まれます。Jioユーザーは、約₹35,100相当のパッケージを追加コストなしで利用できます。配布の非対称性は大きいです。Googleは、インドのユーザーがGeminiを見つける必要はありません。Googleは、インドのスマートフォンの約95%で動作しているAndroidを介して、Geminiをユーザーにプッシュします。インド最大の電気通信事業者であるJioは、4億8000万人以上のサブスクライバーを抱えており、OpenAIが匹敵できない別の配布レイヤーを追加します。OpenAIは、ローカライズされた価格設定で対応しました。インドで発売されたChatGPT Goは、月額₹399(約4.50ドル)で、無料プランの10倍の使用量を提供する削減されたサブスクリプションです。11月、OpenAIはさらに、すべての対象インドユーザーに対して12か月間のChatGPT Goを無料で提供することを発表しました。これは、「無料」に競争するには自分自身も「無料」でなければならないという現実を認めるものです。価格戦争は、世界的な趨勢を反映しています。ChatGPTの世界市場シェアは、Geminiが3倍になった過去1年で87%から68%に低下しました。インドでは、価格への敏感性が強く、Googleのエコシステムへの浸透がほぼ完全であるため、この競争圧力は増幅されています。100万ユーザーがインドのAIエコシステムに与える影響サミット自体が物語の一部を語っています。インドAIインパクトサミットは、グローバルサウスで開催された最初の世界的なAIサミットです。ナレンドラ・モディ首相は、約20か国の国家元首およびMeta、Microsoft、Google、OpenAI、NvidiaのCEOと共にイベントを主催しました。インド政府のAIミッションは、2024年3月に開始され、国内のAIインフラストラクチャと能力を構築するために1,037.2億ルピー(約12億ドル)を拠出しています。インドの開発者やスタートアップ企業にとって、100万ユーザーの数字は、多くの人が数年間主張してきたことを裏付けています。インドは、AIの消費市場ではなく、構築の場になってきています。OpenAIは、先月、デリーに最初のインド事務所を開設し、さまざまな役割で人員を募集しています。同社は、ヒンディー語、ベンガル語、タミル語、テルグ語を含む12のインド語でAIモデルのパフォーマンスを評価するために特別に設計されたベンチマークであるIndQAを立ち上げました。ChatGPT Goは、ネイティブのUPI支払いをサポートしており、これは表面的な市場参入ではなく、真正なローカライゼーションを示唆しています。学生の採用パターンは特に注目に値します。インドの学生は、競争試験の準備、コーディングの練習、言語の学習、研究のためにAIチャットボットを使用しています。これらのユーザーがChatGPTの習慣を職業生活に持ち込むと、OpenAIは、他の企業が容易に奪うことができない世代的な優位性を築くことになります。しかし、それは長期的な賭けです。OpenAIのヨーロッパでのサブスクリプションの転換課題は、より豊かな市場でさえ、ほとんどのユーザーが有料プランにアップグレードする価値を見出せないことを示唆しています。インドでは、1人当たりの収入がヨーロッパの水準の小さな部分であり、Googleが国最大の電気通信事業者を通じて競合製品を無料で提供しているため、転換の数学はさらに難しくなります。OpenAIの戦略的な計算は、近期の収益ではなく、将来のものかもしれません。インドは年間で他のどの国よりも多くのSTEM卒業生を生み出しています。ChatGPTを基盤とする開発者、研究者、起業家の世代は、将来の企業契約、APIの使用、プラットフォームのロイヤルティのエコシステム効果を生み出し、数年後に収益化されます。Altmanのインドを「フルスタックAIリーダー」と位置付けるのは、インドがAIを構築する上で、AIを消費する上で同等の重要性を持つことになるという賭けです。インドの100万人のChatGPTユーザーにとって、競争の直接的な利益者は明らかです。世界で最も価値の高い2つの企業が、最先端のAIを無料またはほぼ無料で提供するために数十億ドルを費やしています。ユーザーがそれで何を作るかによっては、競争が経済的機会に変わり、またはインドがシリコンバレーのサブスクリプション戦争の戦場になるかどうかが決まります。


マイクロソフトのAI最高責任者、ムスタファ・スレイマンは、先週、フィナンシャル・タイムズに、「ほとんど、あるいはすべて」の白領コンピュータータスクが「完全に自動化」されるまでに12〜18ヶ月かかるだろうと述べた。弁護士、会計士、プロジェクトマネージャー、마케팅担当者 — すべての仕事が、2027年中頃までにAIによって処理されるだろうと述べた。これは注目すべき主張である。また、熱狂的な見出しが生み出したものよりも、はるかに慎重な検討を必要とするものである。スレイマンはランダムなコメント家ではない。彼はDeepMindを共同設立し、Inflection AIを立ち上げ、マイクロソフトの消費者向けAI部門を運営している。彼はほとんどの人ができるよりも近くで、AIが研究の興味から商業製品へと移行するのを見ている。彼が話すとき、業界は聞く。しかし、現在の時点では、特にマイクロソフト・コピロットを企業に販売する責任者である。そのコンテキストは重要である。スレイマンは未来を予測し、同時に販売もしている。彼が実際に言ったこと全文は検討する価値がある: 「白領労働、つまりコンピューターの前に座って、弁護士や会計士やプロジェクトマネージャーまたはマーケティング担当者 — そのような仕事の大部分は、次の12〜18ヶ月以内にAIによって完全に自動化される。」彼は、すでに進行中の変化の証拠として、ソフトウェアエンジニアリングを指摘し、「AIアシストコーディングがほとんどのコード生産に使用されている」と主張し — これは「過去6ヶ月間に起こった」という変化である。同インタビューでは、マイクロソフトのより広範なAI戦略も明らかになった: 自社のフロンティアモデルを構築して「真のAI自立性」を達成し、OpenAIへの依存を減らす。同社は、インフラストラクチャーからアプリケーションまで、AIスタックのすべての層で競争したいと考えている。彼が正しいところスレイマンを却下することは間違いである。特にソフトウェア開発において、AIの急速な採用と潜在的な混乱の証拠は、現実よりも実在する。Spotifyの共同CEO、グスタフ・セーデストロームは今週、同社のベストデベロッパーが「12月以来、1行のコードも書いていない」と述べ、Claude Codeと内部AIシステムに功績を認めた。 Cursorは、デベロッパーがより少ないキーストロークでより多くの出力を生成できるようにすることで、10億ドルの年間収入に達した。Claude Codeは現在、すべてのパブリックGitHubコミットの4%を占めており — これは1ヶ月で2倍になった数字である。 AIコーディングツールは、ほとんどのエンタープライズソフトウェアカテゴリよりも速く、珍しいものから必須品へと変化した。Anthropicの 2026年1月経済指数によると、49%の仕事は、少なくとも25%のタスクでAIを使用できるようになった — これは、1年前の36%から上昇した。加速が見られる。市場はすでに混乱を価格設定している。 Coworkの先週の立ち上げにより、ソフトウェア株は2850億ドルの売り出しとなり、投資家は、AIエージェントが置き換えることができるSaaS製品を再計算した。彼が間違っているところしかし、「AIがタスクを支援できる」ということと「ほとんどのタスクが完全に自動化される」という間には、深い溝がある。スレイマンはこの区別を無視し、それによって実際に起こっていることを歪曲する可能性がある。同じアンソロジック・レポートでは、49%のタスクがAIを使用できることが示されたが、企業の9%のみが役割の完全な置き換えを報告している。45%の企業が初級採用を削減している — これは重大なことである — ですが、採用の削減はタスクが「完全に自動化される」ということと同じではない。実際の白領労働者が住む現実の間にある。スレイマンが名前を挙げた職業を考えてみよう。AIは契約書を作成できるか。はい。AIは法律を実践できるか — クライアント関係、法廷のダイナミクス、規制のニュアンス、専門家の責任...


Anthropicは、AIエージェントツール「Cowork」を2月10日にWindowsに拡大し、macOSユーザーに限定されていたデスクトップアプリケーションのプラットフォームギャップを解消した。Windowsリリースには完全な機能パリティが含まれており、プラットフォームの約70%のWindowsユーザーベースが、最近ソフトウェア株の285億ドル相当の売却を引き起こしたエージェント機能にアクセスできるようになる。Coworkは、Claude Opus 4.6を搭載したデスクトップエージェントとして動作し、1ミリオントークンのコンテキストウィンドウを備える。個々のプロンプトに応答するチャットボットインターフェースとは異なり、Coworkはローカルファイルを読み取り、複数ステップのタスクを実行し、プラグインを使用して外部サービスとやり取りする — すべてユーザーのマシン上で実行される。Windowsバージョンも同じワークフローをサポートする: ユーザーはタスクを自然言語で説明し、Coworkはファイル、應用プログラム、接続されたサービス全体でタスクを計画して実行する。このアプリケーションには、Claude Pro ($20/月)、Max ($100/月)、Team、またはEnterpriseサブスクリプションが必要である。無料ティアのユーザーはCoworkにアクセスできない。プラグインがCoworkの範囲をコードの外へ拡大Windowsのリリースは、Coworkのプラグインエコシステムが成熟した時期と一致する。1月30日、Anthropic Labsは、セールス、法務、財務、Marketing、データ分析、ソフトウェア開発を網羅する11のオープンソースエージェントプラグインをリリースした。これらのプラグインは、Anthropicのモデルコンテキストプロトコル(MCP)を介して、Coworkを外部ツールに接続し、エージェントがCRMからデータを取得したり、法務文書を起草したり、スプレッドシートを分析したり、プロジェクトボードを管理したりすることを可能にする。プラグインアーキテクチャは、AIエージェントが実際の生産性向上をもたらすには、既存のビジネストゥールとの深い統合が必要であるというAnthropicの賭けを表している。独自のエコシステムを構築するのではなく、会社はプラグインをオープンソース化し、開発者や企業がそれらを変更したり独自のプラグインを作成したりできるようにしている。このアプローチは、Claude Code、Anthropicのターミナルベースのコーディングエージェント、およびそのSlackへの拡張の戦略を反映している。Coworkのファイルアクセス機能は、ブラウザーベースのAIツールと区別する。エージェントはローカルディレクトリを読み取り、ユーザーのデスクトップ上のドキュメントを処理し、手動でのアプリケーション間のハンドオーバーが必要となる操作を連携して実行できる。Enterpriseユーザー向けのTeamおよびEnterpriseプランの場合、管理者はセキュリティコントロールを維持するために、権限および承認されたプラグインを構成できる。https://www.youtube.com/watch?v=UAmKyyZ-b9E&pp=ygUNY2xhdWRlIGNvd29yaw%3D%3Dプラットフォーム拡大の背景Windowsリリースの緊急性は、Coworkが市場の期待をどのように急速に変えたかを反映している。macOSリリースの数日後、投資家はCoworkの機能と重複するSaaS企業の株価を再評価し始めた — プロジェクト管理ツール、ライティングアシスタント、データ分析プラットフォーム、ワークフローオートメーションソフトウェアはすべて急激な下落を見た。AIラボのリーダー、Anthropic自身を含む、は、エージェントツールが従来ジュニアワーカーが行っていたタスクを処理しているため、自社が既にジュニアワーカーの採用を減らしていることを警告している。AnthropicがCoworkをmacOSに限定したことで、企業の大多数 — 企業は圧倒的にWindowsを使用している — はツールにアクセスできなかった。競合他社には対応する時間があった。Microsoftは、Officeスイート全体でCopilotの統合を強化しており、GoogleのGeminiエージェントはWorkspace内で拡大している。Windowsリリースは、競合他社が企業のWindowsユーザーベースで先行する前にギャップを解消する。Anthropicは、最新の資金調達ラウンド後に350億ドル近い評価額を獲得し、Coworkを消費者および企業戦略の中心に据えている。会社のアプローチは、エージェントをユーザーのマシン上でローカルに実行することで、競合他社と異なり、ユーザーがデータをより制御し、ファイル重視の操作の待ち時間を短縮できる。Windowsの完全サポート、オープンなプラグインエコシステム、ローカルファイルアクセスの組み合わせは、チャットボットのように機能するのではなく、より汎用的なデジタル従業員のように機能する製品を作成する。ただし、Coworkが実際のオフィスワークを定義する複雑で多段階のワークフローをどのように信頼性高く処理するかによっては、フレーミングが持続するかどうかは別問題となる — ただし、市場はすでにその可能性を価格設定している。


2023 年にエロン・マスクの xAI を共同創設した 12 人の研究者 のうち、6 人が現在会社を離れており、この週に 48 時間以内に 2 人の離脱が発表された – スタートアップの SpaceX への吸収と、Grok AI チャットボットに関する規制圧力の増加に伴う、加速するブレインドレインである。共同創設者 Yuhuai “Tony” Wu は、X に投稿した文章で月曜日の夜に辞任を発表し、「次の章への時間」と述べ、「小さなチームが AI を装備すると、山を動かして何が可能かを再定義できる」と述べた。彼は次の動きについては言及しなかった。数時間後、火曜日に、共同創設者 Jimmy...


ランウェイは、3億1500万ドルのシリーズEラウンドの資金調達を2月10日に実施し、企業の評価額を530億ドルに押し上げ、2018年の創設以来の総資金調達額を86億ドルに引き上げた。ジェネラル・アトランティックは、前回のラウンドに続き2回目のリードを行い、先月の308億ドルのシリーズDラウンドでは330億ドルの評価額でリードを行った。共投資者には、Nvidia、Adobe Ventures、AMD Ventures、Fidelity Management & Research、AllianceBernstein、Mirae Asset、Emphatic Capital、Felicis、Premji Investが含まれる。NvidiaとAMDの両方が参加しているチップ重視の投資家ロースターは、ランウェイが構築しているテクノロジーのコンピューティングの強度を反映している。同社は、次世代のワールドモデルを事前トレーニングし、新しい製品や業界に拡大するために資本を利用する予定である。 「ワールドモデルは私たちの時代で最も変革的なテクノロジーです」とCEOのCristobal Valenzuelaは発表で述べた。 「私たちの使命は、それらの開発を加速し、世界に良い影響を与えることを保証することです。」ランウェイの運営責任者であるMichelle Kwonは、より具体的に説明した。同社は、研究能力とコンピューティングインフラストラクチャを拡大し、ワールドモデルの上に製品を開発し、研究、エンジニアリング、市場戦略機能全体でチームを拡大する予定である。https://www.youtube.com/watch?v=2AyAlE99_-Aビデオ生成から世界シミュレーションへランウェイは、AIビデオジェネレーターで評価を得てきた。 Gen-4.5は、2025年12月にリリースされ、現在、Artificial Analysis Text to Videoベンチマークで1247 Eloポイントを獲得し、Google、OpenAI、ByteDanceのモデルを上回っている。しかし、同社の戦略的方向性は、決してワールドモデルに向けられている。ランウェイは、物理、空間関係、因果関係をシミュレートするAIシステムをリリースした。同社は、最初のワールドモデルを12月にリリースし、3つの専門バージョンを公開した。GWM-Worldsは環境シミュレーション、GWM-Roboticsは物理AIトレーニング、GWM-Avatarsはデジタルヒューマンである。この違いは重要である。ビデオ生成はクリップを生成する。世界シミュレーションは、探索、テスト、対話が可能な環境を生成する。ランウェイのアドレス可能市場は、クリエイティブプロフェッショナルをはるかに超える。同社は、現在、映画スタジオ、広告代理店、ゲーム会社、建築事務所、金融サービス会社のChime、PayPal、SoFi、Prudentialなどが顧客に含まれると述べている。また、ロボティクスや自動運転車の会社とも協力しており、世界シミュレーションが即座に実用的な応用を持っている。1月、ランウェイは、ワールドモデルコンピューティングインフラストラクチャを進めるために、NvidiaのRubin Platformと提携を発表し、既存のCoreWeaveとのクラウドコンピューティング関係を補完した。混雑した分野における評価の文脈53億ドルの評価額は、ランウェイを最も価値の高い専用AIビデオ会社として位置付け、Synthesiaを上回り、1月のシリーズEで40億ドルの評価額に達した。 Black Forest Labsは、12月に32.5億ドルの評価額で3億ドルの資金調達を行った。 AIメディア会社全体で、ElevenLabsのみが、11億ドルの評価額で年間再発生収入3.3億ドルを獲得している。AIビデオの競争圧力は著しく強化されている。 ディズニーは、オープンAIのSoraに10億ドルのライセンス契約を結び、IPアクセスをモデル品質とともに競争の次元として導入した。 GoogleのVeo...


AIは、企業が従業員をトレーニングする方法を変えている。コース作成の自動化から、リアルタイムで調整される適応的な学習パスへの配信まで、AIを搭載した企業向けトレーニングプラットフォームは、過去10年間で主流であった静的、一サイズフィットアールのLMSシステムに取って代わっている。その結果、オンボーディングが速くなり、完了率が高くなり、実際のビジネス成果に結びついたトレーニングが行われる。このリストにあるプラットフォームは、さまざまなアプローチをカバーしている。いくつかは、AIを搭載したフルスタックのエンタープライズLMSシステムである。他のものは、コンテンツ生成からスキルギャップ分析まで、すべてを自動化するために地上からAIネイティブで構築されている。いくつかは、VRベースのソフトスキル練習、デジタルアドプションオーバーレイ、または内部の専門家による共同学習などの専門的なアプローチを取っている。50人の新入社員をオンボーディングする必要があるか、または世界中のオフィスに5万人の従業員をスキルアップさせる必要があるかに関係なく、これらは評価する価値のあるAIパワードの企業向けトレーニングプラットフォームである。ベストAIパワード企業トレーニングプラットフォームの比較表Evolveは、コース作成パイプラインを完全に自動化するAIネイティブの企業向けトレーニングプラットフォームである。会社の文書、ビデオ、またはスライドデッキをアップロードすると、プラットフォームは自動的に構造化されたレッスン、演習、評価を作成する — これは、従来のオーサリングツールよりも最大14倍速いプロセスである。AIは、リアルタイムでフィードバックを提供するオープンエンドの学習者レスポンスを備えた、現場でのシナリオから構築されたタスクベースのシミュレーションも提供する。Evolveが際立つのは、その分析の深さであり、コース完了率だけでなく、スキルギャップ、学習者レディネス、エンゲージメントトレンドを追跡する35以上のリアルタイムメトリックを提供していることである。プラットフォームには、会社の資料を検索可能でインタラクティブなリソースに変換するAIパワードのナレッジベースも含まれている。$2/ユーザー/月という価格設定では、リスト上で最も安価なAIファーストのトレーニングプラットフォームの1つとなっているが、2024年に設立されたシードステージのスタートアップであるため、組織は価格を早期の成熟度と比較検討する必要がある。 Pros and Cons AIは、従来のオーサリングツールよりも最大14倍速い、会社の文書から完全なコースを生成する 35以上のリアルタイム分析メトリックが、スキルギャップや学習者レディネスを追跡する 現場でのシナリオから構築されたタスクベースのシミュレーションが、オープンエンドの学習者レスポンスに対するリアルタイムのフィードバックを提供する リスト上で最も安価なAIネイティブのトレーニングプラットフォームの1つである AIパワードのナレッジベースが、会社の資料を検索可能でインタラクティブなリソースに変換する 2024年に設立されたシードステージのスタートアップであるため、長期的な実行可能性について疑問が生じる AIコンテンツ品質の主張に対する独立したレビューと第三者による検証が限られている 大規模なエンタープライズ規模(1,000以上の学習者)での実証が不足している AI駆動のコース生成ワークフローを構成するための初期的な学習曲線 小規模なチームと早期の製品段階であるため、確立されたLMSプラットフォームと比較して機能ギャップが存在する可能性がある Evolveを訪問する →https://www.youtube.com/watch?v=uO1heY3ZUtsDoceboは、70以上の国に3,800以上の顧客を抱えるエンタープライズ向けLMSであり、300万以上のユーザーをサポートしている。Docebo Creatorは、完全な学習プランやビデオコンテンツを構築するために生成的なAIを使用し、シナリオベースのスキル練習のためのAIバーチャルコーチングを提供する。コンテンツマーケットプレイスには、リーダーシップ、テクニカルスキル、コンプライアンスに関する30,000以上の事前構築コースが用意されている。プラットフォームのHarmony機能は、エージェントAIコパイロットであり、大規模なL&Dオペレーションを自動化する — 登録、翻訳、コンテンツタグ付け、管理ワークフローを処理する。Doceboは、単一のインスタンスから従業員、顧客、パートナーへのマルチオーディエンストレーニングをサポートし、個別にブランド化されたポータルを介してサービスを提供できる。ISO 27001およびSOC 2/3の認定を受けており、規制された業界向けに構築されているが、カスタムの価格設定(約25,000ドル/年から)と見積もりベースのモデルにより、中規模から大規模なエンタープライズ(300以上のユーザー)向けに最適化されている。 Pros and Cons...


Redditは木曜日に4分の1の結果を報告し、ウォール街の推定を上回ったが、AI業界にとって最も重要な数字は利益にはなかった:Reddit Answers、会社のAI駆動の検索機能は、2025年第1四半期の1万人の週次ユーザーから年末までに1500万人に増加した — 15倍の増加で、Redditのリーダーシップは、より大きな機会の始まりであると説明した。収益は、70パーセントの年間増加で、4分の1に726百万ドルに達し、純利益は252百万ドルだった。2025年の全年では、Redditは220億ドルの収益と530百万ドルの純利益を達成した。会社はまた、10億ドルの株式買い戻しプログラムを発表した。しかし、CEOのSteve Huffmanは、収益電話を検索に向けた。現在、8000万人以上が毎週直接Redditで検索しており、1年前の6000万人から増加し、会社は投資家に、AI検索は「巨大な市場と機会」を表すが、まだ収益化されていないと伝えた。Reddit Answersと検索の機会Reddit Answersは、2024年後半に、Redditの既存の検索の上にAIレイヤーとして導入され、関連する投稿、コメント、コミュニティの議論から会話形式の回答を合成する。機能は現在、複数の言語をサポートし、検索結果にテキスト以外のメディアを含むダイナミックエージェントのパイロットを実施している。この製品は、Googleが数年間苦労してきたユーザーの行動に対処する。数百万の人々はすでに「Reddit」をGoogle検索に追加しているが、SEO最適化されたコンテンツファームではなく、実際の人間からの回答が欲しいからである。Reddit Answersは、その意図を社内に持ち込み、ユーザーがGoogleを経由せずに、AIインターフェイスを介して直接Redditのコーパスを検索できるようにする。戦略的な重要性は2つある。まず、Redditは現在Googleと共有している検索トラフィックを捕捉し、それに伴う広告収益を得る。検索広告はデジタル広告の中で最高のCPMを持つものの一つであり、Redditの検索インベントリは現在収益化されていない。2つ目は、AI合成された回答がユーザーをReddit上に長く留まらせ、広告ターゲティングとAIモデルそのものの両方を改善するエンゲージメントデータを生成する。Redditはまた、CESで、広告主に自動化されたキャンペーンの作成と最適化を提供するAI駆動のキャンペーンプラットフォーム、Reddit Maxのパブリックベータを発表した。AI検索とAI駆動の広告ツールの組み合わせは、Redditが自己強化システムを構築していることを示唆する:より良い検索がより多くのユーザーを引き付け、より多くのユーザーがより多くのデータを生成し、より良いデータが広告のパフォーマンスを改善し、より良い広告のパフォーマンスがさらにAI開発を資金提供する。競合市場Redditはすでに混雑しているAI検索市場に参入している。Googleは、AI Overviewsを検索結果に統合し、AI生成の回答でWebコンテンツを要約している。 Perplexityは、数百万人のユーザーを持つ専用のAI検索エンジンを構築した。OpenAIのChatGPTは、現在無料層で広告を実施し、拡大するアプリエコシステムを備え、週に数億の検索のようなクエリを処理している。Redditの違いは、そのデータである。プラットフォームは、数百万のコミュニティをまたぐ20年の人間が生成した議論をホストしている。そのコーパスは、AIにとって独自に貴重なものである。実際のユーザーからの意見、製品レビュー、トラブルシューティングガイド、推薦 — これらは、WebクロールでトレーニングされたAIモデルが再現するのが苦手なコンテンツの種類である。このデータの優位性は、Google、OpenAI、その他の会社がRedditとライセンス契約を結ぶ理由を説明する。Redditは現在、論理的なフォローアップの質問を提起している:私たちのデータが他の会社が支払う価値があるのであれば、 почему私たち自身のAI検索製品を構築し、その価値を直接捕捉しないのか?会社はまた、2026年第3四半期からログインユーザーとログアウトユーザーを区別しないことを発表した。AIと機械学習を使用して、すべてのユーザーにパーソナライズされたエクスペリエンスを提供する。動きは、Redditのアドレス可能なオーディエンスを大幅に拡大する可能性がある — ログアウトした訪問者は歴史的に、エンゲージメントが低く、収益化が低いバージョンのサイトを見ている。より広い AIチャットボット市場にとって、Redditの動きは、異常な競争相手を導入する。PerplexityやChatGPTとは異なり、Redditは汎用のAIアシスタントを構築していない。代わりに、他のプラットフォームが複製できないような、真正な、コミュニティ駆動のコンテンツのためのAI検索を構築している。Reddit Answersが1500万人の週次ユーザーから、すでにプラットフォームで検索している8000万人にスケールアップできる場合、それは一般的なモデルと直接競合することなく、AI検索の重要なプレーヤーになる。Redditは、2026年第1四半期の収益を595百万ドルから605百万ドルと予測しており、52-54パーセントの成長を表す。株式は収益の後初期的に低下したが、推定を上回った — 投資家がまだ実現していないAI検索収益を価格設定していることを示す。RedditのAI検索の野心とその野心の現在の収益化のギャップは、次の数四半期で実際の物語が展開される場所である。


OpenAIとAnthropicは、今日、数分間の差で新しいフラグシップモデルをリリースしました。同時に、OpenAIはエンタープライズエージェントプラットフォームを立ち上げ、Perplexityはマルチモデル研究機能を導入しました。今日、AI製品の発表は、通常の週よりも1日の午後に多くの発表がありました。ここに何が配信されたか、それが何を意味するかを説明します。AnthropicのOpus 4.6: エージェントチームと100万トークンのウィンドウAnthropic はClaude Opus 4.6をリリースしました。これは、2つの注目すべき機能を持つ最も優れたモデルです。1つの機能は、100万トークンのコンテキストウィンドウであり、もう1つの機能は、エージェントチームと呼ばれる新しい機能です。コンテキストウィンドウは、より大きな技術的成果です。100万トークンで、Opus 4.6は、約3,000ページのテキストを1つのプロンプトで処理できます。つまり、前身の256,000トークンの制限の4倍です。128,000トークンの出力サポートと組み合わせて、このモデルは、コードベース、規制上の提出、または研究コーパスを、チャンク化または要約化せずに処理して利用できます。https://youtu.be/dPn3GBI8lIIエージェントチームは、Claude Codeで利用可能で、複数のClaudeインスタンスが共有コードベースで並行して作業できます。単一のエージェントがタスクを順番に実行するのではなく、開発者は、1つのエージェントがフロントエンドの変更を処理し、別のエージェントがテストを書き込み、3つ目のエージェントがバックエンドロジックをリファクタリングするチームをスピンアップできます。すべてのエージェントは、同じプロジェクトで同時に調整して作業します。Opus 4.6は、適応的な思考も導入します。これにより、モデルは、与えられたプロンプトにどれだけの推論努力を投資するかを調整できます。シンプルな質問は迅速な応答を得られ、複雑な問題はより深い思考を引き起こします。開発者は、低、 сред、 高、最大の4つのレベルで努力コントロールを調整できます。ベンチマークでは、Opus 4.6は、Terminal-Bench 2.0のエージェントコーディングと、人間の最終試験という複雑な推論評価で最高スコアを獲得しています。Anthropicは、GPT-5.2に対して144ポイントのEloアドバンテージと、Opus 4.5に対して190ポイントの改善を主張しています。APIの価格は、入力トークン1ミリオンあたり5ドル、出力トークン1ミリオンあたり25ドルで変更されませんが、20万トークンを超えるプロンプトは、10ドル/37.50ドルのプレミアムレートが適用されます。注目すべきエンタープライズ動きとして、Anthropicは、Claudeの研究プレビューをMicrosoft PowerPointで発表しました。ここで、モデルは既存のスライドレイアウトとテンプレートを読み取り、ブランドのフォーマットを維持しながら、プレゼンテーションを生成または編集できます。OpenAIのGPT-5.3-Codex: 自分自身を構築したモデルAnthropicの発表の数分後、OpenAI はGPT-5.3-Codexを立ち上げました。これは、最も優れたコーディングモデルです。このリリースは、GPT-5.2-CodexのフロンティアコーディングパフォーマンスとGPT-5.2の推論および専門知識機能を1つのシステムに統合し、さらに25パーセント高速化しました。最も注目すべき主張は、GPT-5.3-Codexが自分自身を構築したことです。OpenAIのCodexチームは、モデルのトレーニングプロセス中に、モデルの初期バージョンを使用して、トレーニング実行のデバッグ、デプロイインフラストラクチャの管理、評価結果の診断を行いました。これは、OpenAIがモデルが自分自身の開発に役立ったことを最初に公に認めたことであり、効率と安全性の両方で重要なマイルストーンです。GPT-5.3-Codexは、SWE-Bench ProとTerminal-Benchで新しい業界最高水準を設定しました。これらは、実世界のソフトウェアエンジニアリングタスクを評価するベンチマークです。このモデルは、研究、ツールの使用、複雑な実行を伴う長時間のタスクを処理できます。ユーザーは、タスク中断せずにモデルとやり取りできます。よりコラボレーションすることのように感じます。モデルは、すべてのChatGPT有料プランユーザーが、Codexアプリ、CLI、IDE拡張機能、Webインターフェイスを介して利用できます。APIアクセスは近く来ます。開発者がAIコードジェネレーターを選択する場合、競争の絵は今やはっきりと定義されています。Opus 4.6はエージェントの調整と長いコンテキスト作業で優れていますが、GPT-5.3-Codexは速度と統合された推論を強調しています。両者は重複するベンチマークで最高のスコアを主張しています。CursorやAppleのXcodeなどのツールは両方をサポートしているため、開発者は自由に切り替えることができます。OpenAIフロンティア: エンタープライズエージェントのための独自のプラットフォームモデルリリースと同時に、OpenAI はフロンティアを導入しました。これは、AIエージェントを構築、デプロイ、管理するためのエンタープライズプラットフォームです。フロンティアは、データベース、CRMシステム、HRプラットフォーム、チケットツール、その他のビジネスアプリケーションに接続し、次にAIエージェントがそれらを介してプロセスを実行できるようにします。OpenAIは、フロンティアを「エンタープライズのためのセマンティックレイヤー」と説明しました。ここで、人間の従業員とAIエージェントは、共有データアクセスとセキュリティコントロールを共有する同じプラットフォームで作業します。エージェントは、従業員のようなID、共有された組織コンテキスト、エンタープライズグレードのアクセス許可を取得します。このプラットフォームは、モデル非依存です。企業は、OpenAIのモデルで構築されたエージェントと、Google、Microsoft、Anthropicのものを管理できます。初期の顧客には、Intuit、State Farm、Thermo Fisher、Uberが含まれます。フロンティアは、OpenAIを、SalesforceのAgentforceやServiceNowのAIエージェントのようなエンタープライズプラットフォームと直接競争させるものです。違いは、OpenAIがモデルレイヤーから構築しているのに対し、既存のワークフローツールにAIを追加していることです。企業がAIプロバイダーからエージェントインフラストラクチャを取得するか、ソフトウェアベンダーから取得するかによって、2026年のエンタープライズAI競争が定義されます。Perplexityのモデル評議会: 3つのモデル、1つの答えPerplexity はモデル評議会を立ち上げました。これは、同じクエリを3つのモデル(Claude Opus、GPT、Gemini)で同時に実行し、シンセサイザーモデルを使用してその出力を1つの答えに統合し、一致と不一致の領域をフラグ付けします。前提は、単一のモデルがすべてのクエリで信頼性が高く最も優れているわけではないということです。3つのフロンティアモデルが同じ答えに収束する場合、信頼性は高いです。モデルが乖離する場合、ユーザーはさらに調査する必要があります。モデル評議会は、Maxサブスクライバーに利用可能で、投資研究、戦略分析、複雑な意思決定に位置付けられています。この機能は、Perplexityが基礎モデルを構築するのではなく、マルチモデルのオーケストレーションを通じて差別化する戦略を反映しています。フロンティアAIチャットボットのギャップが個々のベンチマークで狭まるにつれて、出力を集約することが、単一のプロバイダーを選択するよりも価値があることを証明する可能性があります。それが全てを意味するこれらのリリースは、AI競争がモデル機能から製品インフラストラクチャに移行したことを確認しています。OpenAIとAnthropicの両方に、同じベンチマークで最高のスコアを獲得するモデルがあります。差別化は、モデル上に構築できるものにあります。一方、Perplexityは、モデル戦争がモデルを組み合わせる方法よりも重要ではないことを示唆しています。モデル評議会が役立つ場合、ClaudeとGPTのどちらかを選択するのではなく、両方を使用する未来になる可能性があります。開発者やエンタープライズがAIスタックを評価する場合、これは決定をより困難にしました。


アンソロピックは水曜日に、クロードは広告なしのままになることを発表し、OpenAIのChatGPTに広告を導入するという最近の決定と対照的な姿勢を示した。同社は、最初のスーパーボウルキャンペーン——60秒のプレゲームスポットと30秒のインゲーム広告——を通じてこの姿勢を強調している。このキャンペーンは、「AIに広告が来ます。但し、クロードには来ません」というタグラインを中心に構成されている。この違いは、2つの先導的なAI研究所が製品を収益化する方法における根本的な分裂を明らかにしている。OpenAIは、900万以上の週間ChatGPTユーザーにサービスを提供し、1月に無料ユーザーと新しい8ドル/月のChatGPT Goサブスクリプションに対して広告のテストを開始することを発表した。アンソロピックは、広告のインセンティブがクロードの行動を形作ることなく、収益性の高いビジネスを構築できるという賭けをしている。「私たちは、クロードが間違いなくユーザーの利益に奉仕するようにしたい」とアンソロピックはブログ投稿「クロードは思考の空間である」で書いている。「したがって、私たちは選択を行った:クロードは広告なしのままになる」。同社は、ユーザーが会話の近くに広告やスポンサー付きリンクを見ないこと、そしてクロードの応答が第三者の製品プレイスメントによって影響を受けないことを述べた。アンソロピックが広告を排除する理由アンソロピックの主張は、インセンティブの整列に中心がある。広告は、ユーザーがアプリ内で費やす時間、リターン率、ユーザーとのやり取りの頻度などのエンゲージメントを最適化する圧力を作り出す。アンソロピックは、これらのメトリックは、本物的に役立つことと同じではないと主張している。「最も役立つAIのやり取りは、短いものか、ユーザーのリクエストを解決するためにさらに会話を促すことなく行われるものである」と同社は書いている。「広告付き製品の歴史は、広告インセンティブが導入されると、収益目標や製品開発に統合されるにつれて、広告が拡大することを示唆している。かつてはより明確だった境界が、曖昧になる」。AIアシスタントとの会話の個人的な性質は、このダイナミクスを特に危険にしている。ユーザーは、健康上の懸念、関係性の問題、経済的不安、仕事上の課題についてAIアシスタントと話す。アンソロピックは、これらのコンテキストにおける広告を「不一致」と表現し、「多くの場合、不適切」としている。同社のスーパーボウル広告——歴史的に消費者広告を避けてきた同社にとっての大きなマーケティング費用——は、この懸念を劇的に表現している。スポットでは、男がAIセラピストと母親とのコミュニケーション問題について話している。一般的なアドバイスの後、「セラピスト」は、年上の女性と出会うためのデーティングアプリを推奨する。メッセージは、広告が関係を損なうことを示唆している。https://www.youtube.com/watch?v=FBSam25u8O4OpenAIの異なる計算OpenAIは、異なる財務現実に直面している。The Economistによると、同社は今年、17億ドルの現金を消費する見込みで、2025年の90億ドルから増加している。OpenAIのほとんどの収益は、ユーザーから生じている——ユーザーあたりの収益は、企業向けAI契約よりも少ない。OpenAIの広告アプローチには、ガードレールが設けられている。広告は、無料ユーザーとChatGPT Goサブスクライバーのみに表示される。Plus、Pro、Business、Enterpriseティアは広告なしのままである。18歳未満のユーザーは広告を見ない。特定のデリケートなトピック——政治、健康、精神衛生——は除外される。広告は、応答の下部に表示され、明確にラベル付けされる。OpenAIは、これらが「決して」ChatGPTの回答に影響を与えないと述べている。CEOのサム・アルトマンは、Xでアンソロピックのキャンペーンに応え、表現を「明らかに不正直」と呼んだ。また、OpenAIの原則は、アンソロピックが描写したような広告の配置を明確に禁止していることも指摘した。このやり取りは、広告問題がどれほど論争的になっているかを強調している。収益モデルへの分岐この対比は、各社が収益をどのように生み出すかという構造的な違いを反映している。アンソロピックの収益は、主に企業契約とAPIアクセス——特にクロードを基盤とするコーディングツール——から生じている。クロード・コードだけで年間10億ドル以上の収益を生み出している。このB2Bへの焦点により、アンソロピックは、主な収益エンジンを犠牲にすることなく、消費者に対して厳格な姿勢を取ることができる。クロードの消費者へのリーチは、ChatGPTに比べてまだ小さく——このギャップにより、広告を排除することはあまりコストがかからない。OpenAIの消費者への優位性は、異なる圧力を作り出す。900万以上の週間ユーザーがあるため、広告の機会は巨大——一部の推定によると、年間250億ドルの価値がある。OpenAIの現金消費率では、この収益流れは無視できない。より深い問題は、広告が基本的にAI製品の進化を変えるかどうかである。アンソロピックは、広告が導入されると、製品の決定がユーザーの福利に合わないメトリクスを最適化するようになることを主張している。OpenAIは、商業的利益と製品の利益を維持することができると主張している。信頼の賭けアンソロピックの姿勢は、不変ではない。「私たちがこのアプローチを再検討する必要がある場合、私たちはその理由について透明性を保つ」と同社は述べている。しかし、スーパーボウル広告は、アンソロピックが広告なしの約束にブランドを賭けていることを示唆している。AIアシスタントに対する消費者の信頼はまだ脆弱で——ユーザーは、これらのシステムが信頼できるものと信頼できないものをまだ学んでいる。アンソロピックは、クロードを、ユーザーが必要以上に話し続けるための金銭的インセンティブがないため、信頼できるアシスタントとして位置付けている。この位置付けが市場シェアに翻訳されるかどうかは、消費者が実際にAI製品における広告にどれだけ気を配っているかによって決まる。OpenAIの発表に対する初期の反応は、敵対的——同社の投稿は1000万回以上のビューを獲得し、返信スレッドは懐疑的な意見で占められていた。ただし、ユーザーの行動は、表明された好みと乖離することが多い——多くの人々は、広告について不満を述べているにもかかわらず、毎日広告付き製品を使用している。今のところ、AIアシスタント市場は、2つのモデルに分かれている——広告でサポートされる製品と、ユーザーが直接支払うか、企業が請求する製品。次の数年間で、どちらのアプローチがより持続可能なビジネス——そしてより信頼できるAI——を構築するかが明らかになる。


Appleは、Xcode 26.3のリリースとともに、XcodeにAutonomous AIエージェントを初めて公開し、AnthropicのClaude AgentとOpenAIのCodexの組み込みサポートを提供しています。この更新は、Appleが開発者ツールにアプローチする方法に大きな変化をもたらします。コードの自動補完スタイルの提案から、AIモデルがファイルを作成、プロジェクトを構築、テストを実行、視覚的な出力を独立して検査できるフルなエージェントワークフローへと移行します。リリース候補は、現在Apple Developer Programメンバーに利用可能です。Xcodeの既存のAI機能、Apple Intelligenceは、Xcode 26からインラインコード補完とチャットベースのアシスタンスを提供しています。しかし、新しいエージェントコーディングモードは、異なる方法で動作します。個々のプロンプトに応答するのではなく、エージェントはタスクを受け取ります。たとえば、「バイオメトリック認証を使用したログイン画面を追加する」など — かつ、コードの書き込み、ファイルの作成、プロジェクトの構築、ユニットテストの実行、失敗の反復を、手動介入なしで一連のアクションを実行します。Appleは、MCP(Model Context Protocol)というオープン標準の上にこの統合を構築しました。MCPは、Anthropicによって最初に開発されたもので、AIモデルが外部ツールとどのようにやり取りするかを定義します。MCPを通じて、エージェントはXcodeのコア機能にアクセスし、構造化されたツール — コンパイラ、テストランナー、Previewsシステム、およびAppleの開発者向けドキュメントはすべて、エージェントがタスク中に呼び出すことができる関数になります。エージェントがXcode内でどのように動作するか2つの起動エージェント — Claude AgentとCodex — は、Xcodeの設定パネルから1回のクリックでインストールされ、Xcodeのリリースとは独立して自動的に更新されます。開発者は、AnthropicまたはOpenAIから自分のAPIキーを提供してそれらをアクティブ化します。Claude Agentは、AnthropicのAgent SDKを通じて、Claude Codeアーキテクチャ全体をXcodeに持ち込みます。これにより、Xcode内のClaudeは、並列タスクを処理するためのサブエージェントを生成し、バックグラウンド操作を実行し、プラグインを使用することができます — これらはすべて、Claude CodeのスタンドアロンCLIで利用可能な機能です。Anthropicは、Xcodeの環境に特に最適化されたトークン使用とツール呼び出しパターンを実現するために、Appleと密接に協力したと述べています。Xcodeの実装を他のAIコード生成ツールと区別する特徴の1つは、Previewsを通じた視覚的な検証です。エージェントは、実行中にSwiftUI Previewsのスナップショットを撮ることができ、UIの変更が正しくレンダリングされることを視覚的に確認することができます。これは、ほとんどのAIコーディングツールが開いたままにするループを閉じます...


Google DeepMindは1月28日、AlphaGenomeをリリースしました。これは、DNAシーケンスが生物学的機能にどのように翻訳されるかを予測するAIモデルで、同時に100万ベースペアを処理し、26のバリアント効果予測ベンチマークのうち25で既存のモデルを上回りました。このモデルは、Natureに掲載され、DeepMindブログに詳細が記載されています。計算ゲノミクスにおける重要な進歩を表しています。以前のモデルでは、異なる予測タスクごとに別々のシステムが必要でしたが、AlphaGenomeは、遺伝子発現からクロマチン可溶化まで、単一の統一されたアーキテクチャですべてを処理します。「AlphaGenomeは、長いDNAのストレッチを見渡し、重要な調節要素がどこにあるか、それらが遺伝子発現に与える下流効果を予測できます」と、DeepMindチームは発表で書いています。モデルの100万トークンのコンテキストウィンドウにより、遺伝子をオン/オフにする方法に影響を与える遠隔のDNA領域間の長距離相互作用を捉えることができます。しくみAlphaGenomeは、生のDNAシーケンスを処理するためのBorzoiスタイルの1D畳み込みネットワークと、画像セグメンテーションから適応したU-Netアーキテクチャの2つのニューラルネットワークアーキテクチャを組み合わせます。このハイブリッドアプローチにより、モデルはDNAの順序性と調節要素の複雑な空間関係の両方を処理できます。トレーニングデータは、ENCODEとFANTOMコンソーシアムからの約7,000のゲノムトラックに及ぶもので、これらはヒトゲノム全体の機能要素をカタログ化した大規模な共同研究です。モデルは、遺伝子発現、DNA可溶化、タンパク質結合、クロマチン修飾を測定する実験アッセイからのシグナルを予測することを学習します。研究者にとって、実用的な価値はバリアント効果予測にあります。患者のゲノムに変異が存在する場合、臨床医はそのバリアントが重要かどうかを判断する必要があります。AlphaGenomeは、単一の核苷酸変化が全体の調節ランドスケープにどのように影響するかを予測できます。現在の方法では見逃される可能性のある疾患原因バリアントを потен的にフラグ付けすることができます。モデルは、遺伝子発現や調節要素の活性に影響を与える遺伝子バリアントを予測する能力をテストするベンチマークで強力な結果を達成しました。遺伝子発現レベルに影響を与える既知のバリアント(eQTL)では、AlphaGenomeは、特にそのタスクに特化したモデルと一致したり、それを上回ったりしました。オープンソースの利用可能性DeepMindは、AlphaGenomeのソースコードをGitHubで非商用利用のためにリリースしました。これは、基礎生物学ツールを公開するというラボのパターンを継続しています。リポジトリには、モデル重み、推論コード、およびカスタムシーケンスに対する予測を実行するためのドキュメントが含まれています。オープンリリースは、2021年にリリースされて以来300万人以上の研究者によって使用されているDeepMindのタンパク質構造予測ツールAlphaFoldによって確立されたモデルに従います。AlphaGenomeは、補足的な問題に取り組んでいます。AlphaFoldがタンパク質の構造を予測する一方で、AlphaGenomeは、遺伝子がそれらのタンパク質を生成するときとどこで生成するかを予測します。Google DeepMindのCEOであるDemis Hassabisは、生物学をラボのAI能力の主な応用ドメインとして位置付けました。ゲノミクス研究は、Geminiを含む製品を動かす会話AIや言語モデルに加えて、科学的問題に類似のアーキテクチャイノベーションを適用するDeepMindの野心を拡大しています。なぜこれが重要かヒトゲノムには約30億ベースペアがありますが、そのうち約1.5%のみがタンパク質を直接コード化しています。残りの98.5%は、長い間「ジャンクDNA」と見なされていましたが、遺伝子が発現される時、場所、量を制御する調節要素を含んでいます。これらの非コード領域の変異は疾患を引き起こしますが、どのバリアントが重要かを特定することは非常に困難でした。従来の方法では、個々のバリアントをテストするために、高価で時間のかかる実験が必要です。AlphaGenomeのようなマシンラーニングモデルは、数千のバリアントを計算的にスクリーニングできます。実験的フォローアップに値するバリアントを優先順位付けできます。希少な疾患の診断では、患者は通常、未知の効果を持つ新しいバリアントを運んでいるため、この機能は、シーケンシングから診断までのパスを加速する可能性があります。モデルの100万ベースペアのコンテキストを処理する能力は、特に重要です。遺伝子調節要素は、遺伝子を制御する遺伝子から数十万ベースペア離れた場所に存在する可能性があり、DNAの複雑な3D折り畳みを介して通信します。以前のモデルでは、長距離依存関係を捉えることができませんでした。AlphaGenomeは、生物学研究を変革するAIツールの生態系に参加しています。タンパク質構造予測、薬剤発見、そして今や遺伝子調節は、機械学習に対してますます扱いやすい問題になっています。遺伝子研究コミュニティにとって、これらのモデルのオープンな利用可能性は、以前は十分に資金提供されたラボに限定されていた計算能力へのアクセスを民主化します。モデルの限界も、DeepMindのプレゼンテーションから明らかです。AlphaGenomeは実験測定の予測に優れていますが、予測を臨床結果に翻訳するには、追加の検証が必要です。クロマチン可溶化の予測と疾患リスクの予測の間のギャップは、依然として大きいです。現在、AlphaGenomeは、臨床応用がまだ数年先にあるかもしれませんが、ゲノムの機能を理解することを加速する可能性のある研究ツールとして機能します。160カ国にわたる3,000人の科学者がすでにモデルを使用していることから、研究コミュニティは、DeepMindが構築したものに即時の価値を見出しているようです。