人工知能
オープンソースAIが反撃する:MetaのLlama 4

過去数年間、AIの世界は、オープンなコラボレーションの文化から、厳密に守られたプロプライエタリシステムによって支配されるものに変化しました。OpenAI – その名の通り「オープン」が含まれている会社 – は2019年以降、最も強力なモデルを秘密にしました。AnthropicやGoogleなどの競合他社も、APIの壁の後ろに、最先端のAIを構築しました。これらのモデルは、安全性とビジネス上の利益のために、閉じたアプローチが正当化されましたが、コミュニティの多くの人々は、初期のオープンソースの精神の喪失を嘆きました。
しかし、今、その精神が復活しています。Metaの新しくリリースされたLlama 4モデルは、最高レベルのオープンソースAIを復活させるための大胆な試みを示しています。伝統的に守られていたプレイヤーも注目しています。OpenAIのCEOであるSam Altmanは最近、会社は「オープンモデルについて、歴史の誤った側にいた」と認め、「強力な新しいオープンモデル」GPT-4バリアントの計画を発表しました。簡単に言えば、オープンソースAIが反撃し、「オープン」の意味と価値が進化しています。

(Source: Meta)
Llama 4: MetaのGPT-4o、Claude、Geminiへのオープンチャレンジャー
Metaは、Llama 4を新しいモデルから直接挑戦するものとして紹介しました。Llama 4は、オープンモデルとして位置付けられています。Llama 4は、現在利用可能な2つのバージョン、Llama 4 ScoutとLlama 4 Maverickがあります。両者ともにmixture-of-experts (MoE)モデルであり、クエリごとにパラメーターのみの一部を有効にすることで、ランタイムコストを抑えながら大規模なサイズを実現します。ScoutとMaverickはそれぞれ17億「アクティブ」パラメーター(任意の入力で動作する部分)を備えていますが、MoEにより、Scoutは16人の専門家(109Bパラメーター)を、Maverickは128人の専門家(400Bパラメーター)を横断します。結果として、Llama 4モデルは強力なパフォーマンスを発揮し、独自の特徴を備えています。
たとえば、Llama 4 Scoutは、業界をリードする1000万トークンのコンテキストウィンドウを備えており、ほとんどのライバルよりもはるかに大きいです。これにより、大きなドキュメントやコードベースを一度に処理し、推論することができます。Scoutは、量子化が高い場合、単一のH100 GPUで実行できるほど効率的であり、開発者が実験するためにスーパーコンピュータが必要ないことを示唆しています。
一方、Llama 4 Maverickは、最大の力を発揮するために調整されています。初期テストでは、Maverickが推論、コーディング、ビジョンタスクでトップレベルのクローズドモデルと同等かそれ以上のパフォーマンスを発揮していることがわかりました。実際、Metaはすでに、まだトレーニング中の、Llama 4 Behemothと呼ばれる、さらに大きな兄弟モデルを発表しています。これは、内部的には「GPT-4.5、Claude 3.7 Sonnet、Gemini 2.0 Proを上回る」というメッセージを送っています。オープンモデルはもはや二級のものではなく、Llama 4は最先端の地位を目指しています。
同様に重要なのは、MetaがLlama 4をすぐにダウンロードして使用できるようにしたことです。開発者は、ScoutとMaverickを公式サイトまたはHugging FaceからLlama 4コミュニティライセンスの下で入手できます。つまり、誰でも(ガレージハッカーからフォーチュン500社まで)が、モデルを調整して、自分のハードウェアまたはクラウドにデプロイできます。これは、OpenAIのGPT-4oやAnthropicのClaude 3.7のようなプロプライエタリオファリングと対照的です。これらは、基礎となる重みにアクセスできない有料APIで提供されます。
Metaは、Llama 4のオープン性はユーザーをエンパワーメントすることについて強調しています:「私たちは、Llama 4ハードの最初のモデルを共有し、よりパーソナライズされたマルチモーダルエクスペリエンスを構築できるようにします。」他の言葉で言えば、Llama 4は、開発者や研究者が世界中で使用できるツールキットです。GPT-4やClaudeに匹敵する能力を持つモデルをリリースすることで、Metaは、トップレベルのAIが必ずしも支払い壁の後ろに隠れる必要はないという考えを復活させています。

(Source: Meta)
純粋な理想主義か戦略的なプレイか
Metaは、Llama 4を壮大で、ある意味で利他的な用語で提示しています。 「私たちのオープンソースAIモデル、Llamaは、10億回以上ダウンロードされています。」 CEO Mark Zuckerberg 最近発表しました、そして 「AIモデルをオープンソースにすることは、世界中の人々がAIの利点にアクセスできるようにするために不可欠です。」 これは、Metaが民主化されたAIのトーチベアラーである会社であることを示しています。つまり、より大きな利益のために、最も強力なモデルを共有する用意がある会社です。実際、Llamaファミリーの人気はこれを裏付けています。モデルは驚くほどのスケールでダウンロードされており(数ヶ月で650万から10億ダウンロードに)、Spotify、AT&T、DoorDashなどの企業によってすでに本番で使用されています。
Metaは、開発者が「透明性、カスタマイズ性、セキュリティ」を評価していることを誇りに思っています。つまり、モデルを自分で実行できることです。これは「ブラックボックスAPI」に比べて、「新しい創造性と革新のレベルに到達する」ことを助けるものです。原則的には、これは古典的なオープンソースソフトウェアのエチオス(LinuxやApacheを思い出してください)がAIに適用されているようです。コミュニティにとっては明確な勝利です。
しかし、オープン性の背後にある戦略的な計算も無視できません。Metaは慈善団体ではありません。「オープンソース」は、この文脈では注意書きが付きます。特に、Llama 4は、標準的なパーミッシブライセンスではなく、特別なコミュニティライセンスの下でリリースされています。つまり、モデル重みは無料で使用できますが、制限があります(たとえば、高リソース使用ケースでは、許可が必要になる可能性があり、ライセンスは「プロプライエタリ」です。つまり、Metaによって作成されたものです)。これは、オープンソースイニシアチブ(OSI)が承認するオープンソースの定義ではありません。つまり、企業がこの用語を誤用していると批評家は主張しています。
実践的には、Metaのアプローチは「オープンモデル」または「ソース可用」AIと呼ばれます。コードと重みはオープンですが、Metaはまだ一定の管理を維持し、すべてを公開しません(トレーニングデータなど)。これは、ユーザーにとっての有用性を損なわないものの、Metaが戦略的にオープンであることを示しています。つまり、自分自身(そして、おそらく競争上の優位性)を保護するために、十分なリーシュを維持しています。多くの企業は、重要な詳細を隠しながら、AIモデルに「オープンソース」のラベルを付け、オープン性の真の精神を損なっています。
なぜMetaはオープンにするのでしょうか。競合する景色は手がかりを提供しています。強力なモデルを無料でリリースすることで、開発者や企業ユーザーを迅速に構築できます。 Mistral AI は、フランスのスタートアップで、早期のオープンモデルをリリースして、トップレベルの研究所としての信頼性を獲得しました。
Llamaを市場に導入することで、Metaは、自社の技術がAIエコシステムの基盤となることを保証します。これは、長期的には利益をもたらすでしょう。古典的な抱き合わせ拡張戦略です。もし誰もがあなたの「オープン」モデルを使用するなら、あなたは間接的に標準を設定し、人々をあなたのプラットフォーム(たとえば、MetaのAIアシスタント製品はLlamaを利用している)に向かわせるかもしれません。また、PRとポジショニングの要素もあります。Metaは、利他的なイノベーターとしての役割を演じます。特に、閉じたアプローチに対する批判に直面しているOpenAIと対比してです。実際、OpenAIのオープンモデルの変更は、Metaの動きがどれほど効果的であったかを強調しています。
先駆的な中国のオープンモデルDeepSeek-R1が1月に登場し、以前のモデルを飛び越えたとき、Altmanは、OpenAIは「歴史の誤った側」にいたと示唆しました。現在、OpenAIは将来、強力な推論能力を持つオープンモデルを約束しています。 態度の変化を示しています。これは、Metaの影響が見られません。Metaのオープンソースの姿勢は、そして戦略的です。つまり、AIへのアクセスを拡大するものであり、同時に、ライバルを出し抜き、市場の将来をMetaの条件で形作るための賢い戦術です。
開発者、企業、AIの将来への影響
開発者にとって、Llama 4のようなオープンモデルの復活は、新鮮な空気です。単一のプロバイダーのエコシステムと料金にロックインするのではなく、開発者は、強力なAIを自分で実行する、または自由にカスタマイズするオプションを持ちます。
これは、機密データを誰かのブラックボックスにフィードすることを警戒している金融、ヘルスケア、政府などの機密性の高い業界の企業にとって、大きな利点です。Llama 4を使用すると、銀行や病院は、自社のファイアウォールの後ろに、最先端の言語モデルをデプロイできます。プライベートデータで調整できます。外部エンティティとトークンを共有する必要はありません。また、コストの利点もあります。トップモデルの使用ベースのAPI料金は、急激に増加する可能性がありますが、オープンモデルには使用料はありません。オープンソリューションを選択することで、企業は大幅に節約できます。
したがって、企業がオープンモデルに興味を持っていることは驚くことではありません。多くの企業は、オープンソースAIのコントロールとセキュリティが、クローズドサービスよりもニーズに合致することを認識し始めています。
開発者も、革新の利点を受けます。モデル内部にアクセスできることで、開発者は、クローズドAPIが対応しない可能性のある方法で、ニッチドメイン(法律、バイオテクノロジー、地域言語など)にAIを微調整および改善できます。以前のLlamaモデルを中心としたコミュニティ主導のプロジェクトの爆発(医療知識に微調整されたチャットボット、スマートフォンアプリなど)が、オープンモデルが実験を民主化する方法を証明しました。
しかし、オープンモデル復活は、難しい質問も引き起こします。400Bパラメーターモデルを実行できるだけの計算リソースを持たない開発者にとって、「民主化」は本当に起こるのでしょうか。Llama 4 ScoutとMaverickは、単一のモデルに比べてハードウェアの障壁を低減していますが、依然として重いです。開発者の多くは、クラウドの助けなしにこれらを実行できません。
希望は、モデル圧縮、蒸留、または小さい専門家バリアントなどの技術が、Llama 4のパワーを、よりアクセスしやすいサイズに伝達することです。別の懸念は、悪用です。OpenAIやその他の企業は、強力なモデルをオープンにリリースすると、悪意のあるアクターによって(誤情報の生成、悪意のあるコードなど)悪用される可能性があると長い間主張してきました。
これらの懸念は残っています。オープンソースのClaudeまたはGPTは、企業がAPIに適用するセーフティフィルタなしで悪用される可能性があります。一方、支持者は、オープン性により、コミュニティが問題を識別して修正できるため、モデルがより強固で透明性のあるものになることを示唆しています。オープンモデルコミュニティがセーフティを真剣に受け止め、ガイドラインを共有していることを示す証拠もありますが、緊張は続いています。
明らかになるのは、オープンとクローズドのモデルが共存するハイブリッドAIの風景に向かっていることです。各々が、互いに影響を与え合います。クローズドプロバイダーであるOpenAI、Anthropic、Googleは依然として絶対的なパフォーマンスで優位性を維持しています。実際、2024年末の研究によると、オープンモデルは、トップレベルのクローズドモデルから約1年遅れていることが示されています。しかし、そのギャップは急速に縮小しています。
現在の市場では、「オープンソースAI」は、もう単にホビープロジェクトや古いモデルを指すものではありません。Techの巨大企業やスタートアップのAI戦略の中心です。MetaのLlama 4のリリースは、オープン性の価値の進化を強力に思い起こさせるものです。技術の民主化に対する哲学的な立場であり、同時に、高リスクの業界戦争における戦略的な動きです。開発者や企業にとって、新しい扉を開き、自主性をもたらしますが、新しいトレードオフも複雑にします。さらに、AIの利点が、企業の少数の手に閉じ込められないことを希望させます。 もしオープンソースのエチオスがその立場を維持できるならば。










