Connect with us

Unite.AI

お知らせ

April 14, 2026
By Antoine Tardif, CEO & Founder of Unite.AI, CEO & Founder of Unite.AI

KumoがKumoRFM-2を発売、伝統的な企業向けマシンラーニングを置き換える基礎モデル

Kumoは、KumoRFM-2を発表しました。これは、構造化された企業データ用に特別に設計された次世代の基礎モデルで、データウェアハウスから予測を生成する方法に根本的な変化をもたらします。伝統的なマシンラーニングパイプラインが特徴エンジニアリングとカスタムモデル開発に数ヶ月を要するのに対し、KumoRFM-2は、自然言語を使用して、トレーニングや専門知識を必要とせずに、瞬時に予測を生成できるようにします。その核心では、モデルは新しいカテゴリのAIを表しています。関係型基礎モデルは、簡略化されたテーブルに平坦化するのではなく、企業データ構造上で直接操作します。これは、企業AIの最も持続的な制限の一つに対処しています。ここでは、モデリングが開始される前に、データセット間の貴重な関係がしばしば失われることがあります。静的パイプラインからリアルタイム予測システムへ企業向け予測分析は、歴史的に見て、遅く、リソースを大量に消費するものでした。新しいユースケースごとに、顧客流失予測、不正検出、需要予測など、別々のパイプラインが必要でした。これには、データクリーニング、特徴エンジニアリング、モデルトレーニング、チューニングが含まれます。KumoRFM-2は、この全ワークフローを単一の事前トレーニング済みシステムに置き換えます。代わりにモデルを構築するのではなく、ユーザーは予測したいものを定義します。モデルはリクエストを解釈し、基礎となるデータベースから必要なコンテキストを構築し、単一のパスで予測を生成します。これは、コンテキスト内学習と、Predictive Query Language (PQL) と呼ばれる宣言的インターフェイスの組み合わせによって実現可能です。ここで、ユーザーは、計算するための手順ではなく、気付いている結果を表します。結果は、「モデルを構築する」から「質問する」へのシフトであり、これは、組織全体で予測AIを使用するための障壁を大幅に下げます。関係データがなぜ困難であったのか大多数の既存のAIシステムは、構造化された企業データを不正に扱うため、苦労しています。伝統的なモデル、包括してタブラーAIシステムや大規模言語モデルを含む、データを単一のテーブルに平坦化することに依存しています。しかし、現実世界の企業データは、顧客が取引にリンクされ、取引が製品にリンクされ、製品が在庫にリンクされ、すべてが時間の経過とともに進化する、相互接続されたシステムとして存在します。この構造を平坦化すると、最も貴重な予測信号を含む関係が除去されます。また、チームは手動でこれらの信号を特徴エンジニアリングを通じて再作成する必要がありますが、これは時間がかかり、エラーが発生しやすいプロセスです。KumoRFM-2は、関係型データベース上で直接操作することでこれを完全に回避し、テーブル、タイムスタンプ、エンティティ間の接続を保持します。アーキテクチャの内部: KumoRFM-2の動作KumoRFM-2の背後にある重要な革新は、その階層的な関係グラフトランスフォーマーアーキテクチャです。これは、同時に複数のレベルでデータを処理します。最初のレベルでは、モデルは行と列の注意を組み合わせて個々のテーブルを分析します。これにより、テーブル内で特徴がどのように関連しているかを理解し、無関係またはノイズの多いデータを早期にフィルタリングできます。重要な点は、予測ターゲットがこの段階で導入されることです。つまり、モデルは最初からタスクに条件付けられます。2番目のレベルでは、モデルはテーブル間のグラフベースの推論を実行します。外部キー関係を使用して、データベースの異なる部分のデータを接続します。たとえば、顧客プロファイルを購入履歴または行動パターンにリンクし、テーブル間の信号を特定します。これらの信号は、別の方法では失われる可能性があります。3番目のレベルでは、モデルはサンプル間の注意を組み込み、複数の例から同時に学習できるようにします。これにより、完全なトレーニングデータセットを必要とせずに、比較的小さな数のコンテキスト例から一般化できます。この段階的な設計は重要です。データポイントを同時に処理することによる計算爆発を避けると同時に、ノイズを除去することで精度を向上させます。トレーニングの代わりにコンテキスト内学習KumoRFM-2の定義する特徴の1つは、伝統的なトレーニングではなくコンテキスト内学習に頼ることです。モデルを各タスクにトレーニングするのではなく、KumoRFM-2は、関係型データの大規模なミックス（合成および実世界のデータ）で事前にトレーニングされます。ユーザーが予測リクエストを提出すると、システムは自動的にコンテキスト例のセットを生成します。つまり、データベースの小さなサブグラフと既知の結果がペアになります。これらの例は、モデルがパターンを推測し、重みを更新せずに予測を生成するためのガイダンスとして機能します。実践では、これは次のことを意味します：タスク固有のトレーニングはありません特徴エンジニアリングはありませんモデルチューニングはありません伝統的な監督学習に必要なデータの0.2%しかない場合でも、モデルは最先端のパフォーマンスを達成できます。実世界ベンチマークでのパフォーマンスKumoRFM-2は、ECサイト、ヘルスケア、ソーシャルプラットフォーム、企業システムなどの業界を含む41の予測タスクで評価されています。モデルは、一貫して伝統的な監督マシンラーニングアプローチを上回ります。包括してエンジニアリングされたアンサンブルや関係型ディープラーニングシステムが含まれます。企業ベンチマークでは、広く使用されているソリューションを大幅に上回り、ファインチューニングによってさらに改善されます。生の精度を超えて、モデルは強いロバスト性を示しています：関係リンクの多くが欠けている場合でもパフォーマンスを維持しますノイズまたは不完全なデータで劣化が最小限に抑えられます歴史データが限られているコールドスタートシナリオで優れたパフォーマンスを発揮しますこの堅牢性は、データ品質がしばしば一貫性がない企業環境では特に重要です。スケールへの対応: 500億行までKumoRFM-2は、現代のデータインフラストラクチャのスケールで動作するように設計されています。システムは、データベースネイティブ実行と、高スループットのデータアクセスが可能なカスタムグラフエンジンの組み合わせを使用して、500億行を超えるデータセットを処理できます。代わりに、データを別のMLシステムに移動するのではなく、計算はデータが存在する場所、SQLデータベースまたはクラウドデータウェアハウスに直接プッシュされます。このアプローチにより、待ち時間が短縮され、展開が簡素化され、組織は予測機能を既存のワークフローに直接統合できます。自然言語をインターフェイスとして別の定義的な特徴は、モデルの自然言語インターフェイスです。ユーザーは次のような質問を投げかけることができます： 30日以内に顧客が流失する可能性が高いのは誰ですか? どのリードが最も変換される可能性が高いでしょうか? どの製品が需要の増加を見込めるでしょうか? システムはこれらのクエリを構造化された予測ロジックに翻訳し、基礎となるデータで実行し、予測と説明の両方を返します。これは、予測分析をよりアクセスしやすくし、AIエージェントとの統合を可能にし、予測が自動化された意思決定ワークフローの一部として埋め込まれるようにします。エージェント駆動型企業インテリジェンスへの道KumoRFM-2は、エージェントを念頭に置いて設計されています。その予測機能は、AIエージェントがより大きなワークフローの一部として呼び出すことができるモジュラー「スキル」として公開できます。これにより、予測モデリングは、検索、推論、実行と組み合わせて使用できる構成可能なビルディングブロックになります。この文脈では、モデルは分析者向けのツールではなく、次世代の企業オートメーションの基礎レイヤーです。データサイエンスの役割の再定義KumoRFM-2は、組織がデータサイエンスに取り組む方法に大きな変化をもたらします。各タスクに特化した数十のモデルを構築して維持するのではなく、チームは、瞬時に新しい問題に適応する単一の汎用システムに頼ることができます。これにより、特徴エンジニアリングとモデルチューニングの専門知識の必要性が減り、実験とイテレーションが速くなります。多くの組織にとって、これは、中央集権的なデータサイエンス機能から、予測インサイトが複数の部門にわたってアクセス可能な、より分散されたモデルへの移行を意味する可能性があります。新しい基礎モデルカテゴリ基礎モデルはすでに言語やビジョンのドメインを変革していますが、構造化された企業データは、最後のフロンティアの1つとなっています。KumoRFM-2は、構造化データ用の専門化された基礎モデルが何を達成できるかを示す初期の例を表しています。関係型推論、コンテキスト内学習、自然言語インタラクションを組み合わせることで、予測AIの新しいパラダイムを導入します。広く採用されれば、このアプローチは、企業がデータとやり取りする方法を再定義する可能性があります。予測分析を、複雑で遅延されたプロセスから、リアルタイムで組織全体の機能に変える可能性があります。
April 13, 2026
By Alex McFarland

MiniMaxがM2.7をオープンソース化 – 自己進化型エージェントモデル

中国のAI企業であるMiniMaxは、MiniMax M2.7の重みをリリースしました。これは、229億パラメータのMixture-of-Expertsモデルで、自身の開発サイクルに参加しました。会社によると、これは自己進化型AIの第一歩です。元々は3月18日に発表されましたが、MiniMax M2.7は現在、Hugging Faceで無料で利用可能です。SGLang、vLLM、Transformers、NVIDIA NIMに対するデプロイメントサポートも提供されています。このモデルは、SWE-Proで56.22%、Terminal Bench 2で57.0%のスコアを獲得し、オープンソースLLMの中で最も強力なものの1つとなっています。モデルが自分自身を構築する方法M2.7について最も注目すべきことは、その自己イテレーションへの参加です。MiniMaxは、内部バージョンのモデルをプログラミングスキャフォールドの最適化に割り当て、100ラウンド以上を自律的に実行しました。プロセス中、M2.7は失敗トラジェクトリを分析し、スキャフォールドコードを変更し、評価を実行し、各変更を保持または元に戻すことを決定しました。モデルは、自己で最適化を発見しました。温度や頻度ペナルティなどの最適なサンプリングパラメータを体系的に検索し、ファイル間でバグパターンを自動的にチェックするワークフローガイドラインを設計し、エージェントループにループ検出を追加しました。MiniMaxは、この自律プロセスから内部評価セットの30%のパフォーマンス改善を報告しています。MiniMaxの強化学習チーム内では、M2.7は現在、日常のワークフローを30%から50%処理しています。研究者は、重要な決定のみに関与し、モデルは文献レビュー、実験追跡、データパイプライン、デバッグ、メルジリクエストを管理しています。MiniMaxはまた、MLE Bench LiteでM2.7をテストしました。これは、OpenAIの22の機械学習コンペティションのスイートで、単一のA30 GPUで実行されます。3回の24時間トライアルで、モデルのベストランは9つの金メダル、5つの銀メダル、1つの銅メダルを獲得しました。平均メダル率は66.6%で、Gemini 3.1と並び、Opus 4.6（75.7%）とGPT-5.4（71.2%）に次ぐものでした。エンジニアリングとオフィスワークのベンチマークパフォーマンスソフトウェアエンジニアリングのベンチマークでは、M2.7は最先端のクローズドソースモデルに匹敵または近づいています。SWE-Proでの56.22%のスコアは、GPT-5.3-Codexと一致しています。VIBE-Proでは55.6%のスコアを獲得し、SWE Multilingualでは76.5、Multi SWE Benchでは52.7を獲得しました。AIコードジェネレーターを超えて、MiniMaxはM2.7をプロフェッショナルオフィスタスクに位置付けました。GDPval-AAでは、45モデルのドメインエキスパートを評価し、M2.7はオープンソースモデルの中で最高の1495のELOスコアを獲得しました。Opus 4.6、Sonnet 4.6、GPT-5.4に次ぐものでした。Toolathonでは46.3%の精度を達成し、MiniMaxのMM Claw評価では、40の複雑なスキル（それぞれ2,000トークンを超える）で97%のスキルコンプライアンス率を維持しました。モデルは、MiniMaxがAgent Teamsと呼ぶネイティブのマルチエージェントコラボレーションをサポートしています。ここで、複数のモデルインスタンスは、タスクで協力しながら異なるロールアイデンティティを維持します。この機能は、安定したロール境界とエージェント間の対立的な推論が必要なビジネスオートメーションのためのAIエージェントシナリオをターゲットにします。MiniMaxは、M2.7をMixture-of-Expertsアーキテクチャで構築しました。つまり、229億の合計パラメータのうち、サブセットのみが単一の推論パス中にアクティブ化されます。これにより、モデルは、同等の出力品質の密なモデルよりも安価で高速に提供できます。これは、開発者がモデルをローカルで実行したい場合、または限られたインフラストラクチャで実行したい場合に重要な考慮事項です。MiniMaxはまた、OpenRoomをオープンソース化しました。これは、AIによって構築されたインタラクティブなデモで、エージェントのインタラクションをリアルタイムのビジュアルフィードバックとともにWeb GUI内に配置し、大規模な言語モデルを生産性の向上を超えてインタラクティブなエンターテイメントに拡張するという会社の意欲を示しています。リリースにより、Meta、Alibaba、DeepSeekのモデルが境界を押し広げているオープンウェイトエージェントスキルのランドスケープに、もう1つの競合オプションが追加されました。自己進化の角度 – モデルが自分自身の後継者を改善するために有意義に貢献する – はまだ初期段階ですが、M2.7は、100以上の自律的な最適化ラウンドから30%の内部ベンチマークの改善を提供し、ループ内に人間の介入はありません。
April 9, 2026
By Alex McFarland

AnthropicがManaged Agentsを立ち上げ、エンタープライズAIワークロードを実行

Anthropicは、Claude Managed Agentsをリリースしました。これは、ビジネスがクラウドホストされたAIエージェントを独自のインフラストラクチャを管理せずに構築してデプロイできる、組み立て可能なAPIのスイートです。Claudeプラットフォームでのパブリックベータで利用可能なこのサービスは、サンドボックス化、ステート管理、資格情報の処理、ツールの実行を処理するため、エンジニアリングチームはエージェントのロジックではなく、運用オーバーヘッドに焦点を当てることができます。この立ち上げは、Anthropicがエンタープライズプラットフォーム市場に最も直接的な進出です。モデルアクセスのみを販売するのではなく、会社はフルエージェントスタックを実行することを提供しています。つまり、自律的なAIワークのマネージドランタイムプロバイダーとして自分を位置付けていることになります。Managed Agentsの機能プロダクショングレードのAIエージェントを構築するには、通常、数ヶ月のインフラストラクチャ作業が必要です。サンドボックス化されたコードの実行、チェックポイント、資格情報の管理、スコープされたパーミッション、エンドツーエンドのトレースなどです。Managed Agentsは、これらすべてをホストサービスに抽象化します。開発者はエージェントのタスク、ツール、ガードレールを定義します。Anthropicの組み込みオーケストレーションハーネスは、ツールを呼び出すタイミング、長時間のセッション間でコンテキストを管理する方法、エラーからの復旧方法を決定します。セッションは、断線しても進度が維持されるように、数時間 автономに実行できます。https://www.youtube.com/watch?v=I1BvAHOsjBU立ち上げに伴うエンジニアリングブログポストは、コアアーキテクチャを3つのコンポーネントの分離として説明しています。つまり、「脳」（Claudeとそのハーネス）、「手」（サンドボックスとツール）、「セッション」（耐久イベントログ）です。各コンポーネントは独立して失敗したり、交換されたりすることができます。コンテナが死んだ場合、ハーネスはそれをツール呼び出しエラーとして捕捉し、新しいものを起動します。ハーネス自体がクラッシュした場合、新しいインスタンスは最後に記録されたイベントから再開できます。セキュリティは構造的な分離によって処理されます。資格情報は、Claudeが生成したコードが実行されるサンドボックス内に存在しません。Git操作の場合、アクセストークンはサンドボックスの初期化中に挿入されますが、エージェントのリーチ外のままです。MCP（モデルコンテキストプロトコル）を介して接続された外部サービスについては、OAuthトークンはセキュアバウルトに格納され、プロキシを介してアクセスされます。このシステムには、マルチエージェントの調整（現在は研究プレビュー中）も含まれており、エージェントは複雑な作業を並列化するために他のエージェントを生成して指示できます。早期導入者と価格いくつかの会社はすでに、Managed Agentsをプロダクションワークフローに統合しています。 Notionは、カスタムエージェントを介してClaudeをワークスペースに直接埋め込み、チームがアプリを離れることなく、コード、プレゼンテーション、スプレッドシートを委任できるようにしました。 Rakutenは、1週間で展開した専門エージェントを、SlackやTeamsに接続して、製品、販売、営業、財務に展開しました。 Asanaは、プロジェクト内で人間と一緒に作業するAIチームメイトを構築し、CTOのAmritansh Raghavは、Managed Agentsが高度な機能をより迅速に出荷するのを支援したと述べています。 Sentryは、SeerというデバッグツールをClaudeパワードエージェントに接続し、パッチを書き、プルリクエストを開き、フラグ付きバグからレビュアブルな修正までを1つのフローで行うことができます。Atlassianは、開発者がJiraから直接タスクを割り当てることができるエージェントを構築しています。価格は消費ベースです。標準のClaude APIトークンレートが適用され、有効なランタイム時間ごとに1時間あたり$0.08が加算されます。公式ドキュメントによると、このサービスでは、SDKが自動的に設定する特定のベータヘッダー (managed-agents-2026-04-01) が必要です。この立ち上げは、AnthropicがClaudeの周りに開発者インフラストラクチャを構築するというパターンを拡張しています。過去1年間で、同社は Claude Coworkをリリースし、Claude CodeをSlackに導入して、チャット内開発を可能にし、デスクトップコントロール機能を追加し、スキルフレームワークを確立し、それが広く採用されています。Managed Agentsは、この軌道を単一のホストオファリングに統合し、カスタム AIエージェントインフラストラクチャと直接競合します。未解決の疑問は、企業がフルエージェントランタイムを単一のAIベンダーに任せるかどうかです。1時間あたり$0.08の価格設定は、ほとんどのインハウスインフラストラクチャコストを下回る程度ですが、機密性の高いワークロードを実行する組織は、すべてのエージェントアクティビティをAnthropicのサーバー経由でルーティングすることをためらうかもしれません。Managed Agentsの顧客VPCへの接続をサポートすることは、この懸念の一部を解決しますが、「脳」 – Claudeとそのハーネス –...
January 14, 2026
By Alex McFarland

アンソロピック、Claude Codeの力をすべての人に Cowork で実現

アンソロピックは1月12日にCoworkをリリースしました。これは、デスクトップエージェントで、シンプルなフォルダベースのインターフェイスを通じて、非技術的なユーザーにClaude Codeの機能を提供します。この研究プレビューは、拡張されたアンソロピックラボのイニシアチブの一環として発表され、開発者以外の多くの専門家が最も強力なAIツールにアクセスできなかったターミナルの障壁を除去します。CoworkはmacOSのClaude Desktopアプリ内で実行されます。ユーザーがフォルダを選択すると、Claudeはそのディレクトリ内のファイルを読み取り、編集、作成できます。すべての操作は自然言語チャットを通じて制御されます。結果は、ファイルシステムのサンドボックスやコマンドラインのナビゲーション方法を知らなくても、Claude Codeのエージェント機能が利用できるようになります。このタイミングは戦略的転換を示唆しています。Claude Codeは研究プレビューから6ヶ月で10億ドル規模の製品に成長し、主に開発者を対象としていました。しかし、アンソロピックは予想外の事実に気付きました。開発者は、Claude Codeをバケーションリサーチ、スライドデッキの作成、メールの整理、ハードドライブからの結婚式写真の回復などに使用していました。Coworkはこの行動を、すべての人を対象とした製品に正式化しました。https://www.youtube.com/watch?v=UAmKyyZ-b9E専門家にとっての意味Claude Codeは、静かに最も能力の高いAIコード生成ツールの1つとなりました。コードの書き方だけではなく、ファイルを伴う複雑な多段階作業にも対応しています。クラウドディレクトリを整理し、レシートのスクリーンショットからスプレッドシートを生成し、散在するノートから報告書を下書きし、人間が数時間かかるワークフローを実行できます。問題はアクセスでした。Claude Codeを使用するには、コマンドラインツールのインストール、ターミナルコマンドの理解、開発環境の設定が必要でした。弁護士、コンサルタント、마케팅担当者、研究者、その他の知識労働者にとって、障壁は高すぎました。彼らの仕事は、ドキュメントの操作や多段階の推論にあたるもので、Claude Codeが得意とする分野です。Coworkはこの障壁を除去します。財務分析者は、Claudeを四半期報告書のフォルダに指示し、トレンドをプレゼンテーションにまとめるよう依頼できます。コンサルタントは、Claudeにプロジェクトファイルを整理し、ドキュメントを命名規則に従って名前を変更し、要約メモを生成するよう依頼できます。研究者は、数十の情報源からのノートを構造化された文献レビューにまとめることができます。アクセスのシフトは重要です。Claude Maxに月100ドルから200ドルを支払う用意がある専門家であれば、以前は技術的なユーザーに限定されていたエージェントAIの機能にアクセスできます。AIの導入を検討している組織にとって、この機能は誰が利益を得られるかを大幅に拡大します。Coworkのしくみインターフェイスは故意にシンプルに設計されています。ユーザーはセッションを開始するためにフォルダを選択します。Claudeはそのサンドボックス環境内でファイルを読み取り、編集、作成できます。これは、エージェントがシステムの他の場所にある機密データにアクセスするのを防ぐセキュリティ境界です。指示はチャットを通じて行われます。ユーザーは「ダウンロードフォルダを整理して、各ファイルを並べ替えて名前を変更してください」というように指示し、Claudeは全ワークフローを実行します。ファイルタイプの分析、適切なサブディレクトリの作成、ファイルの移動、整合性のある名前付けスキームの適用など、手動で30分かかる作業が数分で完了します。アンソロピックは、Coworkを適切な注意を払って扱うことを明示的に推奨しています。会社は、機密情報を含むフォルダへのアクセスを与えないことを警告し、Claudeが「ローカルファイルの削除など、破壊的なアクションを取る」可能性があることを注意しています。エージェントはサンドボックス内で自律的に動作し、これにより力とリスクが生じます。開発の背景は、Coworkが何を表すかについての文脈を追加しています。アンソロピックのClaude Code責任者であるボリス・チェルニーによると、4人チームが約10日間でClaude Code自体を使用して全アプリケーションを構築しました。非開発者が複雑な作業を行うことを可能にするツールは、AIによって2週間足らずで作成されました。プロフェッショナルトレーニングの必要性Coworkのリリースは、数ヶ月間にわたって構築されてきたことを明確に示しています。自律的な作業が可能なAIアシスタントは、実験的なものではなくなりました。専門家が今すぐに学ぶ必要があるプロダクションツールです。Cowork自体の学習曲線は最小限です。チャットインターフェイスです。ただし、エージェントAIと効果的に作業するには、新しいスキルの開発が必要です。複雑なリクエストを明確な指示に分解し、AIが何ができるかできないかを理解し、出力をエラーで確認し、結果が不足している場合はプロンプトを繰り返します。今すぐにこのトレーニングに投資する組織は、競合他社よりも先にエージェントワークフローに関する機関的知識を開発できます。Coworkのようなツールを利用できる専門家とできない専門家の間のギャップは、AIの機能が拡大するにつれて拡大します。業界インフラストラクチャーの構築Coworkはアンソロピックが基盤となる機能を構築するというパターンに従います。会社は、Model Context ProtocolをLinux Foundationに寄付し、Agent Skillsをオープンスタンダードとして公開しました。これらは現在、Microsoft、OpenAI、Googleなどによって採用されています。このアプローチには戦略的な意味があります。アンソロピックは、ユーザーを独自のエコシステムにロックインしようとしていません。代わりに、AIエージェントがどのように動作するかを定義し、Claudeが自分たちが作成した標準の最良の実装になることを賭けています。現在、CoworkはmacOSのClaude Maxサブスクライバーのみに利用可能で、他のサブスクリプション層には待ちリストがあります。アンソロピックは、クロスデバイス同期を追加し、WindowsにCoworkを実装することを、研究プレビューから学ぶにつれて計画しています。専門家へのメッセージは明確です。6ヶ月前に開発者だけが使っていたように思われたツールは、誰でも学ぶことができます。Coworkは、エージェントAIのアクセシビリティ時代が到来したことを示す合図です。
January 12, 2026
By Antoine Tardif, CEO & Founder of Unite.AI, CEO & Founder of Unite.AI

LambdaTest Rebrands to TestMu AI, Formalizing Its Shift to Agentic Quality Engineering

LambdaTest は、TestMu AI にブランド変更しました。これは、クラウドベースのテストプラットフォームから、コードが人間が合理的にテストできるよりも速く生成される時代にソフトウェアの品質を処理するように設計されたフルスタックのエージェント AI システムへの会社の移行を正式に表明するものです。新しいアイデンティティは、マーケティングのリセットではなく、数年間のアーキテクチャと製品のシフトを反映しています。TestMu AI は、品質エンジニアリングを、コードの変更について推論し、新しいコードパスに適応し、AI ドリブンの開発自体と同じ速度で動作できる、オートノマスな、継続的に学習するレイヤーとして位置付けます。クラウドテストインフラストラクチャから品質インテリジェンスへ2018 年に設立された LambdaTest は、当初、具体的なインフラストラクチャの問題を解決することに焦点を当てていました。つまり、チームが自分のテストラボを維持せずに、数千のリアルブラウザとデバイスで Web とモバイルアプリケーションをテストできるようにすることでした。そのクラウドベースの実行エンジンは、不安定性を減らし、フィードバックループを短縮し、迅速に進化する開発チームで広く採用されました。プラットフォームが成熟するにつれて、LambdaTest は実行だけでなく、オーケストレーション、分析、開発者ワークフローの統合に大幅に投資しました。2020 年初頭までに、同社は、継続的なデリバリーエンバイロメントで動作する企業向けに大規模なテストを実行する、世界で最も広く使用されているクラウドテストプラットフォームの 1 つになりました。しかし、生成的な AI がソフトウェアの書き方を変え始めたとき、会社は構造的なミスマッチを特定しました。伝統的なテスト — ほとんどが静的なスクリプトと人間が維持する自動化の周りを構築 — はボトルネックになり始めました。コード生成は加速しましたが、品質システムはまだ反応的でした。なぜブランド変更が重要かTestMu AI への移行は、会社がそのミスマッチに対応した方法を反映しています。2022...
December 19, 2025
By Alex McFarland

ChatGPTのアプリストアは、OpenAIが「すべてのプラットフォーム」になるための試み

OpenAIは12月17日にChatGPT向けのアプリの提出を開始し、800万人の週間ユーザーが会話の中で直接サードパーティのサービスを発見して接続できるアプリディレクトリを立ち上げました。この動きは、ChatGPTにAppleのApp Storeモデルを搭載してパワーアップさせます。初期のパートナーには、Spotify、Booking.com、DoorDash、Dropbox、Google Drive、Apple Musicが含まれます。開発者は現在、OpenAIのApps SDKを介してアプリを提出してレビューを受けることができます。アプリができることアプリは、外部のコンテキストを会話に持ち込み、アクションを可能にすることによって、ChatGPTの会話を拡張します。食料品の注文、旅行の予約、プレゼンテーションの作成、アパートの検索などです。2024年1月に立ち上げられたGPT Storeとは異なり、カスタマイズされたチャットボットのパーソナを提供していたアプリは、実際のサービスに接続し、リアルなトランザクションを実行できます。アプリディレクトリは、Featured、Lifestyle、Productivityのカテゴリに分かれており、ツールメニューまたはchatgpt.com/appsからアクセスできます。ユーザーは、ChatGPTのインターフェイスを離れることなく、サービスを閲覧、接続、操作できます。OpenAIの品質基準を満たし、ユーザーに共鳴するアプリは、より目立つように表示されるか、ChatGPT自体によって推奨される可能性があります。現在、開発者はネイティブアプリまたはウェブサイトへのリンクアウトのみで収益化できます。OpenAIは内部の収益化オプションを検討しているものの、収益分配モデルまたはアプリ内購入システムにコミットしていません。プラットフォーム戦略アプリストアは、OpenAIがモデルプロバイダーからプラットフォーム会社への進化の最新のステップを表しています。 Adobeとの統合により、PhotoshopとAcrobatがChatGPTに搭載されました。 Instant Checkoutにより、PayPalとStripeを介してコマースが可能になりました。 Atlasブラウザにより、ChatGPTがエージェント機能を備えたWebナビゲーションに拡張されました。各部分は、同じ目的に向かって構築されています。ChatGPTを、ユーザーがデジタルサービスとやり取りするための主なインターフェイスにすることです。OpenAIが成功すれば、ChatGPTに飛行機の予約や夕食の注文を依頼することは、アプリのアイコンをタップするのと同じくらい自然になり、基礎となるサービスは目に見えないインフラストラクチャになります。戦略的論理は、AppleのApp Storeが変革的なものになった理由と同じです。iPhoneは単なる電話ではありませんでした。第三者がユーザーにリーチするための表面になりました。OpenAIは、会話型AIが同じ中間化を達成できることを賭けています。開発者への意味機会は大きいですが、不確実性があります。800万人のユーザーへのアクセスは、ほとんどのアプリが夢見るものです。ChatGPTの推奨システムは、従来のアプリストアが苦労する方法で発見を促進できます。ユーザーは、アプリを検索する必要はありません。会話の中でChatGPTがコンテキストに応じてアプリを提案するからです。しかし、経済的側面はまだ不明です。アプリ内での収益化がない場合、開発者はChatGPTのユーザーを直接顧客に変える必要があります。これは、iOSアプリとは異なる価値提案です。iOSアプリでは、トランザクションはエコシステム内で発生します。開発者は、実際には配布を変換の摩擦と交換しています。承認プロセスもリスクを導入します。OpenAIは、公開され、フィーチャーされるものを制御します。OpenAI自身の機能、または将来の機能と競合するアプリは、明らかな競合に直面します。会社の品質基準は主観的であり、歴史は、プラットフォーム所有者がエコシステムが成熟するにつれて中立的な審判者であることを維持しないことを示しています。競合の影響Googleは最も直接的な課題に直面しています。GeminiはGoogle Workspaceと深い統合を持っていますが、OpenAIが構築しているサードパーティのアプリエコシステムはありません。Googleの強みである、ユーザーが必要とするサービスを所有することは、ユーザーがそれらのサービスにアクセスするために制御できない会話型の中間者を好む場合、弱みになります。Anthropicや他のAIラボは、異なる問題に直面しています。Claudeは推論やコーディングに優れていますが、この規模でプラットフォームの野心を追求していません。ChatGPTのアプリエコシステムがスイッチングコストを生み出す場合、ユーザーは接続されたサービスに投資し、特定の統合を中心にワークフローを構築します。モデル品質だけでは競争するのに十分ではない可能性があります。より広い質問は、会話型AIがプラットフォームビジネスを維持できるかどうかです。アプリストアは、ユーザーが個々のアプリの周りに習慣を形成するため機能します。ChatGPTの価値提案は、逆です。個々のアプリを不要にする1つのインターフェイスです。開発者が、自分たちを不可視にするように設計されたプラットフォームに投資するかどうかは、まだ見る必要があります。現在、OpenAIはビジネスを開いていることを示しています。アプリは来ます。質問は、関与する全員にとって経済的メリットがあるか、OpenAIだけがメリットを得るかです。
December 11, 2025
By Alex McFarland

OpenAI、GoogleのGemini 3に対する内部「コードレッド」後にGPT-5.2をリリース

OpenAI 今日、GPT-5.2をリリースし、CEOのサム・アルトマンがGoogleのGemini 3が同社の前のフラグシップを上回ったことに対して内部の「コードレッド」を宣言してから1ヶ月以内にモデルを出荷しました。このスピードアップされたリリースは、OpenAIの主要モデルイテレーションとしては最も短いものです。GPT-5.1はGPT-5の後を3ヶ月で追ったですが、競争的な圧力によってそのタイムラインは劇的に圧縮されました。OpenAIのベンチマークチャートでは、GPT-5.2 Thinkingは、さまざまな推論テストでGemini 3とAnthropicのClaude Opus 4.5を上回っています。「私たちは、5.2を設計して、人々にとってさらに多くの経済的価値を解放するために」と、OpenAIのアプリケーションCEOのフィジ・シモは述べました。「スプレッドシートの作成、プレゼンテーションの構築、コードの記述、画像の認識、長いコンテキストの理解、ツールの使用、そして複雑なマルチステッププロジェクトのリンクがより良くなりました。」コードレッドメモアルトマンは12月1日に内部メモを送信し、Googleの新しくリリースされたGemini 3がベンチマークテストでGPT-5.1を上回ったことを受けて、ChatGPTの改善に向けてリソースを動員しました。「私たちは、ChatGPTにとって非常に重要な時期にあります」とアルトマンは報告によると書いています。メモは、広告機能の計画を延期して製品の品質に焦点を当てることを含む優先順位の変更を呼びかけました。この動きは、Google自身の「コードレッド」3年前にChatGPTの登場が検索巨人の支配を脅かしたときと同じで、競争的な立場がAIでどれほど速く変化するかを強調しています。COOのブラッド・ライトキャップは、今月初めのフォーチュンイベントで話し、警報をビジネスの標準的な慣行としてではなく、パニックとしてではなく説明しました。「多くの企業は、焦点を鋭くするために、時折このようなことを行います」と彼は競争的な物語を軽視しながら、GPT-5.2の開発の背後にある緊急性を認めました。ベンチマークパフォーマンスOpenAIの内部テストでは、GPT-5.2がGemini 3が先行していた推論ベンチマークでリードを取り戻しています。モデルは、コード生成、ドキュメント作成、画像理解、そしてマルチステップタスクの完了などの分野で改善されています。これらの分野では、企業の顧客は一貫したパフォーマンスを要求しています。改善は、ChatGPTが800万人の週間アクティブユーザーに近づく中ですが、無料から有料ティアへの転換率に関する疑問に直面しています。モデルパフォーマンスの改善は、競合他社が同等の価格点でますます優れた代替品を提供する中で、サブスクリプションコストを正当化するのに役立つ可能性があります。GPT-5.2のツール使用能力の強化は、10月にリリースされたOpenAIのブラウザ、ChatGPT Atlasをさらに強化します。マルチステップタスクを自律的に実行できるエージェント機能は、改善された推論とツールの調整から直接利益を得ます。競争的ダイナミクスGemini 3への迅速な対応は、モデルリーダーシップが迅速に変化する市場を反映しています。Googleの11月のリリースは、GPT-5とGPT-5.1がベンチマークリードを維持していた数ヶ月後にOpenAIを驚かせました。AnthropicのClaude Opus 4.5は、その後すぐにリリースされ、別のフロンティアコンペティターを追加しました。OpenAIは同時に、企業の採用を推進し、Slack CEOのDenise Dresserを最初のチーフレベニューオフィサーとして今週雇用しました。同社は、ウォルマート、モルガンスタンレー、ターゲットを含む100万を超えるビジネス顧客にサービスを提供しています。これらの契約は、モデルパフォーマンスが競争力を維持することにかかっています。コードレッドアプローチは、OpenAIがモデル品質を漸進的なものではなく、存続的なものと見なしていることを示唆しています。収益を生み出す機能である広告を延期してモデル開発を加速させることは、能力が市場の立場を導くことを示唆しています。少なくとも今のところは。GPT-5.2は、ChatGPT Plus、Pro、Enterpriseのサブスクライバーにすぐに利用可能です。APIアクセスは、OpenAIの開発者プラットフォームを通じて標準的なロールアウト手順に従います。同社は、リリースに伴う価格変更を発表していません。GPT-5.2がベンチマークリードを維持できるかどうかは、GoogleとAnthropicがどれほど迅速に反応するかに依存します。圧縮された開発サイクルは、数ヶ月にわたるモデルリードの時代が終わり、競争的な優位性が数週間ではなく数カ月続くことを示唆しています。
December 10, 2025
By Alex McFarland

OpenAI、Slack CEOを初のチーフレベニューオフィサーに任命

OpenAIは、Slack CEOのDenise Dresserを初のチーフレベニューオフィサーに任命し、ChatGPTメーカーが大量のユーザーベースを持続可能な企業収入に変換するためのプッシュを示唆しています。Dresserは、会社が火曜日に発表したように、OpenAIのグローバルレベニューストラテジーを企業販売と顧客サクセス全体で担当します。她はCOOのBrad Lightcapに報告し、来週から開始する予定です。この人事は、OpenAIが世界中で100万を超えるビジネス顧客にサービスを提供している際に来ています。顧客には、Walmart、Morgan Stanley、Intuit、Databricks、Target、Lowe’sが含まれます。ChatGPTの800万の週間ユーザーとともに、会社は基本的な課題に直面しています。無料使用を有料サブスクリプションと企業契約に変換することです。「私たちは、数百万人の労働者にAIツールを提供する道筋上にあります。業界全体にわたって」と、OpenAIアプリケーションのCEOであるFidji Simoは述べました。「Deniseは、そのような変化を以前にも導いてきました。彼女の経験は、ビジネス全体でAIを有用で信頼性が高くアクセスしやすくするのに役立つでしょう。」Salesforceの血統Dresserは、Salesforceで10年以上を過ごし、同社の最大かつ最も複雑な顧客にサービスを提供するグローバルセールス組織を構築して率いてきました。彼女は2023年にSlackのCEOとなり、ワークプレイスメッセージングプラットフォームをSalesforceとの統合と製品全体にAI機能を埋め込むためのプッシュを導きました。彼女のエンタープライズソフトウェアセールスの背景は、OpenAIのリーダーシップにおけるギャップを解決します。同社は消費者向け製品の構築と研究ブレークスルーの生成において優れていますが、企業規模でのそれらの機能の収益化には、異なる専門知識が必要です。「私は、私のキャリアを通じて、カテゴリを定義するプラットフォームのスケーリングを支援してきました。OpenAIが企業変換の次の段階に入るにつれて、その経験をもたらすことを楽しみにしています」とDresserは述べました。SlackのチーフプロダクトオフィサーのRob Seamanが、Slackの臨時CEOを務めることになります。企業収入の圧力この人事は、OpenAIが直面している経済的現実を反映しています。The Informationは最近、同社が2025年上半期に約430億ドルの収入を記録したと報告しました。これは2024年全体よりも約16%増加です。しかし、同社のインフラストラクチャコストは依然として巨額であり、最近の5000億ドルの評価額は継続的な成長を要求しています。OpenAIは、ビジネス向けAIツールを使用する労働者の75%が、速度または品質の向上を報告しており、多くの場合、1日あたり40〜60分を節約できることを主張しています。重度のユーザーは、1週間に10時間以上を節約しています。Dresserの任務は、これらの生産性の向上を繰り返し契約する企業契約に変換することです。この人事は、OpenAIがAnthropicとより直接競合できるようにもなります。Anthropicは、Claudeプラットフォームを通じて企業顧客を積極的にターゲットに定めています。MicrosoftのCopilot製品とGoogleのGemini for Workspaceは、企業AI支出に対する追加の競争です。製品の拡大はセールスインフラストラクチャを必要とするOpenAIは、企業セールスモーションを必要とする製品を急速に拡大しています。同社は、AIが自律的にマルチステップタスクを実行できるエージェント機能を備えたAtlasブラウザを10月に発売しました。同社のAPIビジネスは、AIエージェントとカスタムアプリケーションを構築する開発者にサービスを提供しています。これらの製品には、DresserがSalesforceで構築し、Slackで洗練した、コンサルティングセールス、実装サポート、および継続的な顧客サクセス管理などの機能が必要です。タイミングは、OpenAIが次の成長段階に備えていることを示唆しています。消費者による採用の3年後、同社は企業契約に焦点を当てているようです。企業契約は、インフラストラクチャ投資を維持し、評価額を正当化する可能性があります。Slackにとって、Dresserの離脱は、Microsoft Teamsや新興のAIネイティブコラボレーションツールからの競争圧力に直面している時期に不確実性を生み出します。Seamanの臨時リーダーシップが延長されるか、Salesforceが恒久的な交代要員を募集するかは、親会社がSlackの戦略的重要性をどのように見なしているかによって決まる可能性があります。DresserのSlackでの15億ドルの収入事業からOpenAIの企業事業を構築するへの移行は、今年のAI業界で最も重要なエグゼクティブ転換の1つを表しています。彼女の成功または失敗は、OpenAIが技術的リーダーシップを投資家が期待する商業的支配力に変換できるかどうかを決定するのに役立ちます。
December 8, 2025
By Alex McFarland

Anthropic、Claude CodeをSlackに導入してインチャット開発を実現

Anthropicは、Claude CodeがSlackに導入され、開発者がチームのワークスペースを離れることなく、チャット会話から直接コーディングタスクを委託できるようにしたことを発表した。この統合は、研究プレビューとして導入され、開発者はSlackのスレッドで@Claudeをタグ付けして、最近のチャンネルコンテキストを使用してコーディングセッションを開始できる。開発者がチャンネルでバグレポートまたは機能リクエストに言及すると、Claude Codeは会話を分析し、関連するリポジトリを決定し、解決策の作業を開始し、スレッドに進捗状況を投稿できる。システムは、完了した作業へのリンクやプルリクエストを開くことができ、開発者がアプリケーションを切り替えることなく、会話からコードに移行できる。Slackを中心としたエンジニアリングチームの場合、この統合により、チャットと開発環境の間のコンテキストスイッチングのフリクションが排除される。より深いプラットフォーム統合Slack統合は、AnthropicとSalesforceの10月に発表されたより広範なパートナーシップを基盤としている。この契約により、ClaudeとSlackの間で双方向の接続が確立され、AIがSlackのModel Context Protocolサーバーを介してチャンネル、メッセージ、ファイルにアクセスできるようになった。このインフラストラクチャにより、Claude CodeはSlackキャンバスから仕様を読み取り、プラットフォーム内でコードを直接ドキュメント化できる。エンジニアリングチームは、初期の議論からコードレビューまでの全ワークフローをSlackのインターフェイス内で維持できる。このタイミングは、AnthropicがClaudeをエンタープライズワークフローに埋め込もうとする努力を反映している。Claude Codeは2025年5月に一般提供が開始され、Netflix、Spotify、KPMG、L’Oréal、Salesforceを含む主要エンタープライズによって採用されている。製品は10月にWebで導入され、コマンドラインインターフェイス以外でのアクセスが拡大した。Anthropicは、Claude Codeが一般提供開始後6ヶ月で年間1億ドルの収益を達成したと報告し、エンタープライズでの急速な採用を強調した。同社は、12月2日にBun、JavaScriptランタイムを取得し、Claude Codeのインフラストラクチャを拡大した。開発者の注目を競うSlack統合により、Anthropicは、Microsoft、Google、エマージングスタートアップからのコーディングアシスタントとより直接競合できる。GitHub CopilotはIDEベースのアシスタンスで優位性を占めるが、Slack統合により、開発者がすでに非同期コラボレーションを行っている場所で開発者に会うことができる。AIコーディングアシスタントを使用するチームの場合、チャットメッセージから開発タスクをトリガーする機能は、現在手動での手渡しが必要なワークフローをストリームライン化できる。製品マネージャーはSlackでバグを説明し、Claude Codeがすぐに調査を開始し、エンジニアリングチームがリアルタイムで進捗状況を確認できる。Claude Codeは、単純なコードジェネレーターではなく、エージェントシステムとして動作する。作業を計画し、リポジトリ全体のファイルを編集し、ツールを実行し、複数の開発ワークフローを実行する。最新のClaude Opus 4.5モデルがこれらの機能を提供し、計画の深さとプロンプトインジェクション攻撃への抵抗力が向上している。エンタープライズ顧客は、AnthropicのTeamおよびEnterpriseプランでClaude Codeをバンドル機能として受け取り、中央集権的なポリシーマネジメントを利用できる。管理者は、ツールのアクセス許可、ファイルアクセス、サーバー構成について、すべてのデプロイメントに対する内部ポリシーを適用できる。開発チームへの影響Slack統合により、AIコーディングツールが既存のワークフローとどのように統合されるかが変化する。開発者が新しいインターフェイスを採用する必要性ではなく、Anthropicは機能をチームがすでに日常的に使用しているプラットフォームに埋め込んでいる。このアプローチが成功するかどうかは、Claude Codeがチャットベースのやり取りに固有のコンテキストの制限をどのようにうまく処理できるかに依存する。複雑な開発タスクは、Slackスレッドで伝達できる以上の理解を必要とすることが多い。研究プレビューは、Claude Codeがこのギャップをどのようにうまく埋めるかを明らかにするだろう。現在、統合は一部のユーザーに限定されており、Anthropicはより広範なロールアウト前にフィードバックを収集している。早期アクセスを希望するチームは、Anthropicのエンタープライズチャンネルを介して参加を申請できる。
December 2, 2025
By Alex McFarland

Apple Names Former Google Gemini Lead as New AI Chief

AppleはAmar Subramanyaを新しいAI担当副社長に任命しました。彼は、7年間Appleのマシンラーニングの取り組みを率いてきたJohn Giannandreaに代わります。Subramanyaは、16年間GoogleでGemini Assistantのエンジニアリング担当責任者を務め、その後MicrosoftでAI担当コーポレートVPを短期間務めた後、会話AIの深い専門知識をSiriの近代化に苦労している会社に持ち込みます。彼は、CEOのTim Cookではなく、Appleのソフトウェアエンジニアリング担当シニアVPのCraig Federighiに報告することになります。「AIは長年にわたりAppleの戦略の中心であり、AmarをCraigのリーダーシップチームに迎え入れ、Appleに彼の並外れたAIの専門知識をもたらすことを嬉しく思います」と、CookはAppleの公式発表で述べました。リーダーシップの変更は、Appleにとって重要な時期に起こっています。同社のAIの野心は、Apple Intelligenceの機能が遅れ、SiriがChatGPTやGeminiなどの競合他社に比べて後れを取っているという認識が広がっているため、繰り返し失敗しています。Giannandreaの退任はSiriの後退に続くGiannandreaは、2018年にGoogleからAppleに移り、そこで検索とAIの責任者を務めていました。彼の在任中、AppleのAIとマシンラーニングの組織を構築し、Apple Foundation Models、Search and Knowledge、Machine Learning Research、AI Infrastructureを担当しました。しかし、最近の数ヶ月は、AppleのAIの取り組みにとって厳しいものでした。Bloombergは、今年の早い時期に、CookがGiannandreaからSiriの管理権を取り上げ、Voice AssistantのMike Rockwellに渡したと報道しました。那のような再編は、Siriの進化のペースに対する内部の不満を示唆しています。Giannandreaは、2026年春に完全に退任する前に、Appleのアドバイザーを務めることになります。彼の元の組織の一部は、Sabih KhanとEddy Cueに移管され、同様のチームと一致するようにします。Subramanyaの履歴書は、Appleの最近の苦闘に対する意図的な対抗策のようです。Googleでは、GeminiとImagen 3という2つの最も高度なAIシステムを作成したチームの主要メンバーでした。Gemini Assistantの構築経験は、Siriが目指すものになることを目指して急いで機能を強化しようとしているAppleにとって、貴重なものになる可能性があります。緊急性の信号Subramanyaの採用のスピードは注目に値します。彼のLinkedInプロフィールによると、Microsoftに参加してからわずか4ヶ月でAppleに移籍しました。つまり、Appleは彼を積極的に採用し、Microsoftでの彼の在職期間を混乱させた可能性があります。彼の新しい役割は、3つの分野に焦点を当てます。Apple Foundation Models、ML研究、AI Safety and Evaluationです。基盤モデルへの重点は、Appleが独自の大規模言語モデルを構築することに重点を置いていることを示唆していますが、同社はSiriの特定の機能を動かすためにGoogleと協議しているようです。報告構造も示唆に富んでいます。SubramanyaがFederighiに報告することになるため、AIのリーダーシップをソフトウェアエンジニアリングの組織とより密接に統合することになります。これにより、AI機能がiOS、macOS、その他のプラットフォームに展開されることが加速する可能性があります。Appleの競合他社は静止していません。OpenAIはChatGPTの機能を拡大し続けています。一方、GoogleはGeminiを製品ラインナップ全体に押し進めています。AnthropicのClaudeや他のモデルは、Appleがエコシステムの優位性を通じて一度は支配していた開発者の注目を集めています。進む道Subramanyaは、重大な課題と同時に、相当のリソースを引き継ぎます。Appleのユーザーベース、ハードウェアとソフトウェアの統合、およびデバイス上の処理能力は、プライバシーを優先するAIエクスペリエンスを提供するためのユニークな優位性を提供します。これは、同社が繰り返し強調してきた姿勢です。疑問は、新しいリーダーシップが、これらの優位性を、ユーザーが現在AIアシスタントから期待している製品に翻訳できるかどうかです。強化されたSiriの機能は、来年リリースされる予定ですが、Subramanyaは、Appleがついに競合他社と同等、またはそれ以上の能力を持つアシスタントを提供できるかどうかで評価されることになります。Appleにとって、このリーダーシップの移行は、人事の変更以上のものです。7年前にGiannandreaがGoogleからやって来たとき以来、AIの世界が劇的に変化したことを認めるものです。
November 25, 2025
By Antoine Tardif, CEO & Founder of Unite.AI, CEO & Founder of Unite.AI

トランプ大統領、科学的発見を加速する「創世ミッション」AIイニシアチブを発表

ドナルド・J・トランプ大統領は、アメリカでの科学研究の方法を変革することを目的とした、主要な国家的人工知能イニシアチブ「創世ミッション」を立ち上げました。このプログラムは、アポロ時代以来の連邦科学資源の最大の動員と位置付けられています。創世ミッションでは、エネルギー省（DOE）とその国家研究所のネットワークに、アメリカの最も優れた科学的頭脳、最も強力なスーパーコンピューター、そして膨大なデータを1つの協力的なAI駆動型システムに統合するよう指示しています。高度なAIを活用することで、このイニシアチブは、医療、エネルギー、材料科学などの分野で科学的ブレークスルーを劇的に加速させることを目指しており、発見のタイムラインを数年から数日または数時間に短縮することを目指しています。トランプ大統領は、ホワイトハウスでのイベントで正式に創世ミッションを発表し、これをAIが主導する新しい発見の時代と位置付けました。大統領は、この努力の緊急性と規模を歴史的な国家プロジェクトと比較し、「歴史を通じて、マンハッタン計画からアポロ計画まで、私たちの国の最も優れた頭脳と産業は、必要なときに呼びかけに応えてきました」と述べました。創世ミッションは、これらの頭脳に再び呼びかけ、新的アメリカのイノベーションとAIリーダーシップの「新しい黄金時代」をもたらすことを目指しています。エネルギー長官のクリス・ライトは、このイニシアチブを主導するよう指示されています。その他の主要人物には、DOE科学担当次官官房のダリオ・ギル博士（創世ミッションディレクターに指定）、ホワイトハウス科学顧問のマイケル・クラティオス、そして、AIおよび暗号化の特別顧問としてトランプ大統領に仕えるテクノロジー起業家のデビッド・オー・サックスが含まれます。創世ミッションの目標と戦略的優先事項創世ミッションの目標は、AIを研究生産性の力乗数として利用して、科学的発見の速度を加速することです。ホワイトハウスは、AIと高度なコンピューティングを動員することで、このイニシアチブが10年以内にアメリカの科学とエンジニアリングの生産性と影響力を2倍に増やすことができるという見通しを示しています。これは、実験設計、データ分析、シミュレーションなどのタスクをAIで自動化および最適化することを意味し、従来の時間の小さな部分でブレークスルーを可能にします。創世ミッションの優先研究ドメインは、DOEによって特定された20の最も緊急な科学技術課題を網羅しています。これらには、次のものが含まれます。生物技術と健康 – 新しい疾患治療法と生物工学の進歩の発見エネルギー技術 – 先進的な核分裂と核融合からグリッドの近代化まで重要材料 – 材料科学の向上による供給チェーンの確保宇宙探査 – 宇宙技術のブレークスルーへのAIの応用量子情報科学 – 量子コンピューティングとAIの活用半導体とマイクロエレクトロニクス – チップ設計と製造の加速これらの焦点分野は、アメリカの技術的リーダーシップ、経済的競争力、国家安全保障を強化することを目指しています。創世ミッションの主要特徴このイニシアチブは、2025年11月24日に署名された大統領令を通じて立ち上げられました。これは、アポロ計画やマンハッタン計画と同等の国家プロジェクトと位置付けられています。ミッションのリーダーシップには、創設者としてドナルド・J・トランプ大統領、主導する政府機関責任者としてエネルギー長官のクリス・ライト、ミッションディレクターとしてDOE科学担当次官官房のダリオ・ギル博士、ホワイトハウス科学顧問のマイケル・クラティオス、そしてAIおよび暗号化の特別顧問としてデビッド・オー・サックスが含まれます。ミッションの目標は、10年以内にアメリカの研究開発の生産性と影響力を2倍に増やすこと、生物技術、エネルギー、重要材料などの分野での科学的発見を加速すること、そしてアメリカの技術的リーダーシップと国家安全保障を強化することに焦点を当てています。その戦略的優先事項は、少なくとも20の高影響力の科学的および技術的課題を網羅しており、生物技術、先進的な製造、重要材料、核分裂および核融合、宇宙探査、量子情報科学、半導体などが含まれます。イニシアチブの核心は、連邦のスーパーコンピューター、先進的なAIモデル、そして大量の科学データセットを、研究ワークフローを加速するための安全でクローズドループのシステムに接続する、AI実験プラットフォームの作成です。ミッションには明確なマイルストーンがあります。優先的な課題を特定するために60日、国家計算リソースをインベントリ化するために90日、基本的なデータセットとAIモデルをカタログ化するために120日、ロボット実験室と自動化された施設を評価するために240日、および初期の運用能力を実証するために270日です。リソースについては、プログラムは、DOEの17の国家研究所、スーパーコンピューター、および広範なデータリポジトリを活用します。立ち上げ時に特定の資金は割り当てられませんでした。代わりに、取り組みは既存のリソースから始まり、将来的には議会の支援が期待されています。イニシアチブはまた、公私協力も受け入れています。学術界や産業界とのパートナーシップを奨励しています。NvidiaやAnthropicのような企業は、すでに参加を表明しています。最後に、政策の姿勢は、軽いタッチの規制を重視し、統一された連邦AI標準を優先し、国家競争力を維持するために、革新よりも規制的な管理を優先します。AIプラットフォームとテクノロジーの構築創世ミッションの中核となるのは、連邦の計算リソースと科学施設を接続する、洗練されたAI駆動型の研究プラットフォームの作成です。この「アメリカ科学とセキュリティプラットフォーム」は、戦略的セクターのための米国政府のAIエンジンと位置付けられています。DOEは、高性能計算クラスター、国の最も速いスーパーコンピューター、そして大量の連邦データセットと先進的なAIツールを、安全でクローズドループのネットワークに統合します。この環境内で、ドメイン固有の基礎モデルや自律的なAIエージェントなどのAIシステムが、科学的問題を探索するために展開されます。仮説を提案し、実験を設計およびシミュレートし、結果を分析し、さらにはリアルタイムでロボット実験室を制御します。このインフラストラクチャは、物理的なR&Dラボをデジタル機能と接続し、データから発見までのシームレスなパイプラインを作成します。このプラットフォームは、世界で最も複雑な科学装置となる予定で、DOEの4万人以上の科学者とエンジニアによって使用される予定です。民間の革新者とのコラボレーションは、厳格なサイバーセキュリティプロトコルと機密データの保護によって管理されます。管理の目標は、AIの革新が速くて安全であることを保証することです。世界のAIランドスケープにおける位置付け創世ミッションは、人工知能における世界的な競争と新興技術の時代に登場しました。管理は、創世ミッションを、特に中国でのライバル投資に対する対抗手段と位置付けました。AIを国家戦略の中心に据えることで、アメリカは、世界的な技術的優位性の争いをリードする決意を示しています。国際的な取り組みと比較して、創世ミッションは、AIの規制を重視するのではなく、革新を優先しています。管理は、州法のパッチワークを防ぎ、AIのガバナンスをストリームライン化するために、単一の連邦標準を推進しています。この軽いタッチの規制の姿勢は、先行する管理からの転換を示し、AIツールの迅速な展開を優先しています。しかし、資金と実施は、まだ重要な障害です。すぐに新しい連邦資金がなければ、創世ミッションは、既存のリソースの再配分と将来的に議会の支援に依存します。初期のマイルストーンは、早期の勝利を示し、政治的および民間部門のより広範な支援を集めるように構成されています。創世ミッションが成功に導かれる場合、アメリカ国外での公共および民間のAI戦略に大きな影響を与える、国家AIプロジェクトの展開の新しい規範を設定する可能性があります。業界と専門家の反応創世ミッションは、主要なAI企業や研究者から早期の支持を得ています。NvidiaやAnthropicのようなテクノロジー企業は、前例のない規模の国家AIインフラストラクチャに貢献する機会を挙げて、パートナーシップを発表しています。政策分析家や学術リーダーは、科学的加速への焦点を歓迎し、創世ミッションを、エネルギーや医療などの分野でより速いブレークスルーを提供するための、勇気ある一貫したアプローチと評しています。国家研究所のリソースとAIツールを統合する能力は、連邦のR&Dプログラムの影響とリーチを拡大することが期待されています。同時に、長期的な資金、管理、倫理的なAIの展開に関する疑問が残っています。規制緩和の批判者は、スピードを追求するためにリスク管理を最小限に抑えることに対して警告しています。革新と責任のバランスをとることは、創世ミッションが進化するにつれて、継続的な課題となるでしょう。国際的に、同盟国や競合他社は、注目を集めています。何人かのために、このイニシアチブは、モデルとなります。他の人にとっては、自らのAIの野心を二倍にするための呼びかけとなります。創世ミッションを立ち上げることで、トランプ管理は、AIを政策のトピックから、科学そのもののアーキテクチャを再定義することを目指す、国家的なイニシアチブへと昇格させました。
November 24, 2025
By Alex McFarland

Anthropic、Claude Opus 4.5 を公開

Anthropic は公式に Claude Opus 4.5 をリリースしました。これは、先進的なコーディングパフォーマンスとエンタープライズプロダクティビティ機能を備えた、現在のところ最も高度な大規模言語モデル (LLM) です。フラグシップモデルは、SWE-bench Verified で 80.9% のスコアを達成し、AI コード生成の現在のリーダーとなり、OpenAI の最新モデルと直接競合しています。Opus 4.5 はエージェントワークフローで優れており、競合モデルが 10 回の試行を必要とするのに対し、4 回の試行で最高の能力に達します。新しいモデルの価格は、Claude API を介して入力トークン...
November 18, 2025
By Alex McFarland

Google、Gemini 3 Proを発表 – ベンチマークを超えたパフォーマンス

Googleは今日、Gemini 3 Proをリリースしました。これは、記録的なベンチマークと新しいエージェント開発プラットフォームであるAntigravityを備えた、最も高度なAIモデルです。モデルはLMArenaで1501 Eloを獲得し、Gemini 2.5 Proの1451を上回り、主要なAI評価メトリック全てでトップを獲得しました。このリリースは、AI業界での数ヶ月にわたる期待の後、10月22日に選択されたユーザーにモデルが静かにロールアウトされたことを受けて行われました。 Googleの開発者向けリリースでは、コーディング機能と自律エージェント機能を強調しており、Claudeのコーディング性能やOpenAIの開発ツールと競合するために会社を位置付けている。Gemini 3 Proは、約75万語に相当する100万トークンのコンテキストウィンドウをサポートしており、200Kと1Mトークンの2つのティアを提供して、さまざまなユースケースに対応しています。モデルは、テキスト、画像、ビデオ、オーディオを処理する際の卓越したマルチモーダル能力を示し、視覚的推論とグラフィック生成が向上しています。統合は、Workspace、Chrome、Androidを含むGoogleの製品エコシステム全体に及んでいます。記録的なベンチマークパフォーマンスGemini 3 Proは、MMLUベンチマークで91.8%の精度を達成し、Gemini 2.5 Proの89.5%を5ポイント上回りました。モデルは、特に複数の知識ドメインをまたぐ質問に強みを示し、92%のスコアを達成しました。一方、Gemini 2.5は、同様の課題で65%に低下しました。コーディングに特化したベンチマークでは、Gemini 3 ProはSWE-bench Verifiedで76.2%のスコアを達成し、前身を大幅に上回りましたが、Claude 4.5の77.2%には及ばなかった。モデルは、WebDev Arenaのリーダーボードで1487 Eloのスコアを達成し、優れたWeb開発能力を示しました。Terminal-Bench 2.0では、ツールの使用とコンピュータ操作を測定し、Gemini 3 Proは54.2%のスコアを達成しました。モデルは、Gemini 2.5 Proよりも約2倍高速の推論を提供し、タスクサイズ全体で実行時間が短縮されました。50行のPythonスクリプトなどの小さなタスクは、12秒で完了します。一方、10,000行のデータを扱う大規模タスクは、15分30秒で完了します。Googleは、Gemini...
November 6, 2025
By Alex McFarland

Perplexity Strikes $400 Million Partnership with Snap to Bring AI Search to Snapchat

Perplexity AIは今日、Snapとの4億ドルの契約を発表し、2026年初頭から約10億人のSnapchatユーザーにAIパワードの検索エンジンを提供することを目指しています。この契約は、1年間にわたる現金と株式の支払いとして構成されており、Perplexityの会話型AI検索機能をSnapchatの既存のチャットインターフェースに直接統合します。この契約により、Snapchatユーザーはアプリ内で質問をして、プラットフォームを離れることなく検証された情報から明確な会話形式の回答を受け取ることができます。この機能は、2023年2月から利用可能な既存のMy AIチャットボットを置き換えるのではなく、補完するものです。Perplexityの統合は、リアルタイムの情報発見のための専用の回答エンジンとして機能します。PerplexityのCEOであるAravind Srinivasは、「数百万の人々がSnapchatを通じてつながり、世界を発見しています。PerplexityをSnapchatに導入することで、発生する好奇心に直接対応できるようになります」と述べました。この契約は、Perplexityが既存のAI検索エンジンや会話型AIプラットフォームと競合する中での同社の大規模な商業契約の1つです。財務への影響と戦略的ビジョンこの発表は、Snapの2025年第三四半期の財務報告と同時に行われ、10%の年間増加となり、1.51億ドルの収益が記録され、1.49億ドルの分析家の予想を上回りました。Snapの株価は、双方の発表後、取引時間外に20%以上上昇しました。SnapのCEOであるEvan Spiegelは、会社のより広範なAI戦略を強調しました。「私たちの目標は、AIをより個人的、社会的、楽しいものにすることです。つまり、友情、スナップ、会話の織り成す物語にAIを組み込むことです。このパートナーシップは、Snapchatでの発見とつながりを強化するAIの力に関する私たちの共有ビジョンを反映しており、将来的にはさらに革新的なパートナーと共同して進めていきたいと思います。」Perplexityパートナーシップからの収益は、機能が世界中で展開される2026年から、Snapの財務成績に貢献し始めます。同社は、2025年第三四半期に9.43億人の月間アクティブユーザーと4.77億人の日間アクティブユーザーを報告しており、前年比7%と8%の増加となりました。このパートナーシップにより、Snapは、同様にAIアシスタントをソーシャルメディアプラットフォームに統合しているMetaとXと並ぶことになります。Snapは以前、OpenAIの技術を利用したMy AIを立ち上げましたが、Perplexityの統合により、信頼できる情報の出典と引用に特化した専用の検索機能が追加されます。Snapは、調整後EBITDAが38%増加して1.82億ドルとなり、2025年第四四半期の収益予測を168億ドルから171億ドルとし、8%から10%の年間増加を示唆しました。同社の調整粗利益率は、前四半期の52%と前年同期の54%から55%に改善しました。企業が同様のAIパワード機能を活用しようとする場合、ソーシャルメディアのAIツールやAIマーケティングツールは、顧客エンゲージメントとコンテンツ発見のための機能を拡大し続けています。
November 3, 2025
By Alex McFarland

OpenAI、7年間、380億ドルのAWSクラウドパートナーシップを確保

OpenAIは、Amazon Web Services（AWS）と380億ドルの契約を結び、Microsoft以外のクラウドコンピューティングリソースを多様化し、2026年までに数十万のNvidia GPUにアクセスできるようになった。7年間の契約により、OpenAIは、Amazon EC2 UltraServersに搭載されたNvidia GB200とGB300 AIアクセラレータを米国のデータセンターで利用できるようになり、AWS CEOのMatt Garmanは、50万を超えるチップを使用したクラスターを実行する会社の能力を強調し、OpenAIの拡大する計算需要に対応できるインフラストラクチャを整える。OpenAIは、発表直後にAWSリソースの使用を開始し、2026年末までに契約したすべての容量を完全に展開し、2027年以降もさらに拡大する計画を立てている。契約には、AIアプリケーションの日常的な展開に使用される数千万の従来のCPUにもアクセスすることが含まれる。Microsoftパートナーシップの進化このパートナーシップは、OpenAIが先週行った企業再編成を終えた後の最初の大規模なインフラ契約であり、会社は非営利団体としての起源から解放された。OpenAIは、10月末にMicrosoftとの契約を再交渉し、テクノロジー大手の最初の拒否権を削除し、OpenAIが複数のクラウドプロバイダーから購入できるようにした。OpenAIは、Microsoftの所有権を維持しており、AWS契約は特に競争的なクラウド市場にとって重要である。会社は、インフラパートナーシップを多様化しており、GoogleやOracleからクラウドサービスを確保し、2025年には約1兆ドルのインフラコミットメントを行った。OpenAIの共同創設者兼CEOであるSam Altmanは、「フロンティアAIのスケーリングには、大規模で信頼性の高いコンピューティングが必要」と述べ、AWSの役割を強調した。パートナーシップは、OpenAIのような会社が高度なシステムを開発するにつれて、AI業界のコンピューティングパワーの需要が高まっていることを反映している。市場への影響と業界の背景Amazonの株価は、発表後、4.83%上昇し、256.01ドルとなり、会社の時価総額は約1.4兆ドル増加した。契約は、AWSの競争的なAIインフラ市場における地位を再確認し、MicrosoftやGoogleに対する人工知能競争で後れを取る可能性についての投資家の懸念を解消した。38億ドルのコミットメントは、2025年のOpenAIの収益予想を大幅に上回り、会社の戦略が需要の先行きを確保することを反映している。OpenAIのChatGPT Atlasブラウザやその他の製品は、MicrosoftとAWSのインフラストラクチャ上で実行され、会社はパフォーマンスとコストを最適化できるようになる。OpenAIのインフラ拡大には、300億ドルのOracle契約や、OracleとSoftBankとの500億ドルのStargateプロジェクトへの参加が含まれる。これらの投資により、会社は次世代モデルのトレーニングとAIツールのビジネスアプリケーションの拡大を可能にし、数百万のChatGPTユーザーに対するリアルタイムの推論に必要な計算能力を維持できる。パートナーシップは、先導的なAI会社が、希少なGPUリソースへのアクセスを確保するために、長期のクラウドコミットメントを確保していることを示している。NvidiaがAIコーディングスタートアップへの追加投資を計画しているため、業界全体で高度なAIアクセラレータの競争が激化している。

More Posts

Page 1 of 312 3