人工知能
メタのLLaMAは本当にオープンソースか?

ソフトウェア業界は、オープンソース技術の採用を増やしています。 80%の企業がオープンソースソフトウェアの使用を増やしている と、 2023年のオープンソースの状況報告書 によるといます。
テクノロジー業界の大手企業であるMetaのソフトウェア事業は、重要な影響力を持っています。 Meta Llama プロジェクトは、オープンソースの大規模言語モデルエコシステムへの注目すべき貢献です。 ただし、Metaのオープンソースの主張を詳しく調べると、いくつかの不規則性が見られます。
Meta Llamaを詳しく調べて、ライセンス、課題、オープンソースコミュニティにおけるより大きな影響を評価してみましょう。
オープンソースとは何か
オープンソース の本質を理解することは、 Meta Llama を評価する上で重要です。 オープンソースとは、ソースコードへのアクセスだけでなく、コラボレーション、透明性、コミュニティ主導の開発へのコミットメントを意味します 。 専有ソフトウェアと比較して、オープンソースソフトウェアは通常、ライセンス料が無料で、誰でも著者の明示的な許可なしにコピー、変更、または共有できます。
MetaのLlamaは、これらの基準に従っているかどうかについて検討する必要があります。 透明性、共同開発、コードへのアクセス可能性へのMetaのコミットメントを評価することで、オープンソースの原則にどれだけ準拠しているかが明らかになるでしょう。
Meta Llamaプロジェクトの概要

Llama 2の事前トレーニングとファインチューニングプロセスの概要
Metaのエコシステムの中で重要なツールであるLlamaは、広範な影響を及ぼしています。 その強力な自然言語能力により、開発者は強力なチャットボット、言語翻訳、コンテンツ生成システムを構築およびファインチューンできます。 Llamaは、適応性と柔軟性により、より繊細な言語の理解と生成を可能にします。
Llamaの動作に重要なのは、 Metaの使用ポリシー に定められた原則です。 これらの原則は、プラットフォームの安全で公平な使用を促進し、責任ある使用を規定する倫理的境界を定めます。
応用と影響
MetaのLlamaは、 BERT や GPT-3 などの他の著名なLLMと比較されています。 それは、 多くの外部ベンチマーク でそれらを上回っていることがわかっています。 例えば、Natural QuestionsやQuACなどのQAデータセットです。
ここでは、Llamaの影響を強調するいくつかのユースケースがあります:
- 強力なボット: Llamaは、開発者がチャットボットや仮想アシスタントでユーザーとより高度な 自然言語のやり取り を行えるようにします。
- 感情分析の改善: Llamaは、企業や研究者が大量のテキストデータを分析することで、 顧客の感情 をよりよく理解するのに役立ちます。
- プライバシーの制御: Llamaの適応性と柔軟性により、 現在のリーダーであるOpenAIやGoogle などのLLMに潜在的に混乱をもたらす可能性があります。 自己ホスト化および変更可能なため、プライバシー重視のユースケースではデータとモデルに対する制御が強化されます。
Metaのオープンソースの主張
Metaは、Llamaをオープンソースであると主張し、コラボレーションの枠組みに位置付けます。 したがって、Metaの主張を検討することは、実践とレトリックを判断する上で重要です。
オープンソースの政治的正しさを超えて、Llamaをアクセス可能にすることは有益です。 予想される利点には、Metaとのコミュニティの関与の強化、イノベーションの加速、透明性、より広範な有用性が含まれます。 ただし、これらの主張の真実性は、慎重な検討を必要とします。
MetaのLlamaライセンス
Llama のライセンスモデルには、従来のオープンソースライセンスと異なる独自の特徴があります。 Llamaライセンス は、商業モデルに付属するライセンスよりもより許容的ですが、特定の制限があります。 以下は主なポイントです:
1. カスタムライセンス
Metaは、Llamaにカスタムの部分的にオープンなライセンスを使用しています。これにより、ユーザーはMetaの知的財産権の下で非独占的、世界的、譲渡不可、ロイヤリティフリーの限定ライセンスが付与されます。
2. 使用と派生物
ユーザーは、Llamaの素材を使用、複製、配布、コピー、派生物の作成、変更できますが、ライセンスを譲渡することはできません。
3. 商業条件
700万人以上の月間アクティブユーザーを持つ企業は、Meta AIから商業ライセンスを取得する必要があります。 この要件は、従来のオープンソースライセンスと異なり、Llamaを区別します。
4. パートナーシップ
Llama 2モデルは、 AWS と Hugging Face を介してアクセスできます。 Metaはまた、 Llama 2をAzureモデルライブラリに 持ってくるためにMicrosoftと提携しました。 これにより、開発者はライセンス料を支払わずにアプリケーションを構築できます。
Llamaのオープン性に関する課題と論争

Meta Llamaエコシステム内のユーザーエクスペリエンスには、特定の例で明らかな課題があります。
- ライセンスの制限の複雑さが、ユーザーがこれらの高度なモデルとその派生物をどのように利用するかを複雑にします。
- 選択的なアクセス障壁が生じ、ユーザーの参加の包括性に影を落とします。
- ドキュメントの曖昧さが、ユーザーが不明なガイドラインをナビゲートする必要性を追加する複雑さの層を追加します。
最近の 評価 で、Llama 2を含むいくつかのインストラクションチューニングテキストジェネレーターが、オープンソースの主張について検討されました。 この研究では、利用可能性、ドキュメントの質、そしてアクセス方法を包括的に評価し、モデルをそのオープン性に基づいてランク付けすることを目的としました。 Llama 2は、評価されたモデルの中で2番目に低いランクで、ChatGPTよりもわずかに高いオープン性スコアでした。

Radboud Universityの評価 (2023年6月時点) のLlama 2のオープンソースの主張 (フルテーブルは こちら )
開発者コミュニティは、Llamaについていくつかの批判と懸念を表明しています:
- モデルの取り扱いにおけるMetaの透明性の欠如。
- 使用と派生物に関する制限。
- 大企業に課せられる商業条件。
Metaの対応
MetaのLlamaは、その真のオープン性について議論されてきました。 Metaは、 Llama 2 をオープンソースで、研究および商用利用のために無料で提供していると述べています。 ただし、批評家は、それが 完全にオープンソースではない と主張しています。 紛争の主な点は、トレーニングデータとモデルをトレーニングするために使用されたコードの利用可能性です。
Metaは、モデルの重み、評価コード、およびドキュメントを提供しており、これはオープンソースモデルの重要な側面です。 ただし、Llama 2は他のオープンソースLLMと比較して、ある程度閉じていると見なされます。 モデルのトレーニングデータとトレーニングに使用されたコードは共有されていないため、開発者や研究者がモデルを完全に分析することが制限されます。
オープンソースの完全性の維持

部分的にオープンソースのプロジェクトをオープンソースとして受け入れることは、業界におけるオープンソースの実践の信頼性に有害である可能性があります。 これにはいくつかの潜在的な影響があります:
- コラボレーションの抑制: 非オープンソースプロジェクトをオープンソースとしてラベル付けすることは、潜在的なコラボレーターを遠ざけ、オープンソースの定義であるアイデアの活発な交換と共同の問題解決を妨げる可能性があります。
- イノベーションの抑制: 閉じたプロジェクトをオープンソースとして受け入れることは、開発者が、オープンソースの重要な側面であるコミュニティ、無制限の創造性のあるアイデアの交換を欠いたパスに導く可能性があり、イノベーションを妨げる可能性があります。
- 混乱と採用の障壁: 閉じたソースをオープンソースとして誤認することは、ユーザーや開発者を混乱させ、真正のオープンイニシアチブを採用するのをためらわせる可能性があります。
- 法的複雑さ: 非準拠プロジェクトを採用することは、法的問題を引き起こし、複雑さと潜在的な責任を追加し、コミュニティの透明性と協力の精神を乱す可能性があります。
これらの潜在的な結果に対処するには、オープンソースコミュニティはオープンソースの真の精神を維持する必要があります。 オープンソースの原則と価値観を明確に定義し、コミュニケーションすることで、混乱を防ぎ、プロジェクトがこれらの原則に準拠していることを保証できます。
テクノロジーとAIの最新情報については、 Unite AI をご覧ください。 私たちと一緒に最新情報を入手し、先を行きましょう!












