人工智能
谷歌Meta LLaMA 是否真正开源?

软件行业越来越多地采用开源技术。根据 2023 年开源报告,令人印象深刻的 80% 的企业增加了对开源软件的使用。
作为科技行业的主要参与者,Meta 的软件项目对行业具有重要影响。 Meta Llama 项目是对开源大型语言模型生态系统的重要贡献。然而,仔细检查其开源声明后,我们可以观察到一些不规则性。
让我们更详细地检查 Meta Llama,以评估其许可、挑战和在开源社区中的更大影响。
什么是开源?
了解 开源 的本质对于评估 Meta Llama 至关重要。 开源不仅意味着可以访问源代码,还意味着对合作、透明和社区驱动的开发的承诺。与专有软件相比,开源软件通常是无需许可的,可以被任何人无需作者明确许可的情况下复制、修改或共享。
Meta 的 Llama 值得审查其是否遵守这些标准。评估 Meta 对透明度、协作开发和代码可访问性的承诺将揭示其与开源原则的吻合程度。
Meta Llama 项目概述

作为 Meta 生态系统中的关键工具,Llama 对开发者具有深远的影响。其强大的自然语言能力使开发者能够构建和微调强大的聊天机器人、语言翻译和内容生成系统。Llama 旨在通过其适应性和灵活性实现更细致的语言理解和生成。
Llama 的运行由 Meta 使用政策 中概述的原则指导。这些原则促进了平台的安全和公平使用,并概述了其负责任使用的道德界限。
应用和影响
Meta 的 Llama 与其他著名的 LLMs(如 BERT 和 GPT-3)进行比较。它已被发现在许多外部基准(如自然问题和 QuAC)上 超越 它们。
以下是一些用例,突出了 Llama 对开发者和更广泛的技术生态系统的影响:
- 强大的机器人: Llama 允许开发者创建更先进的 自然语言交互,以便在聊天机器人和虚拟助手中与用户交互。
- 改进的情感分析: Llama 可以帮助企业和研究人员更好地理解 客户情感,方法是分析大量文本数据。
- 隐私控制: Llama 的适应性和灵活性使其 可能破坏 当前 LLM 领导者(如 OpenAI 和 Google)。其自托管和修改能力为隐私专注的用例提供了更多对数据和模型的控制。
Meta 的开源声明
Meta 断言 Llama 的开源性,将其置于协作领域。因此,检查 Meta 的声明对于确定实践和修辞至关重要。
超越开源的政治正确性,使 Llama 可访问是有益的。一些预期的好处包括增强与 Meta 的社区参与、加速创新、透明度和更广泛的实用性。然而,这些声明的真实性需要仔细审查。
Meta 的 Llama 许可
Llama 的许可模式具有与传统开源许可不同的独特特征。 Llama 许可,虽然比许多商业模型附带的许可更宽松,但具有特定的限制。以下是一些关键点:
1. 自定义许可
Meta 使用自定义的部分开源许可,授予用户非独占、全球、非转让和免版税的有限许可,使用 Meta 的知识产权。
2. 使用和衍生作品
用户可以使用、复制、分发、复制、创建衍生作品和修改 Llama 材料,而无需转让许可。
3. 商业条款
每月活跃用户超过 700 万 的公司必须从 Meta AI 获得商业许可。这一要求使 Llama 与传统开源许可区别开来,传统开源许可通常不施加此类限制。
4. 合作伙伴关系
Llama 2 模型可通过 AWS 和 Hugging Face 访问。Meta 还与 Microsoft 合作,将 Llama 2 引入 Azure 模型库,允许开发人员在不支付许可费的情况下使用它构建应用程序。
Llama 开放性的挑战和争议

Meta Llama 生态系统中的用户体验具有挑战性,具体情况揭示了 Llama 模型和衍生作品的限制。
- 许可限制的迷宫使得用户与这些高级模型交互和利用变得复杂。
- 选择性访问障碍出现,给用户参与带来阴影。
- 文档模糊性增加了复杂性,要求用户导航不明确的指南。
最近, Radboud 大学 进行了一项评估,评估了多个指令调优文本生成器(包括 Llama 2)关于其开源声明的真实性。该研究全面评估了可用性、文档质量和访问方法,以根据其开放性对这些模型进行排名。Llama 2 在评估的模型中排名第二,仅高于 ChatGPT。

Radboud 大学对 Llama 2 的开源声明评估(截至 2023 年 6 月,完整表格可在 此处找到)
开发者社区也对 Llama 提出了多项批评和担忧:
- Meta 处理模型的透明度不足。
- 使用和衍生作品的限制。
- 对大公司施加的商业条款。
Meta 的回应
Meta 的 Llama 已经被辩论关于其真正的开放性。虽然 Meta 将 Llama 2 描述为开源和免费用于研究和商业用途,但批评者认为它 不是完全开源。主要争议点是训练数据和用于训练模型的代码的可用性。
Meta 已经提供了模型的权重、评估代码和文档,这是开源模型的一个重要方面。然而,Llama 2 与其他开源 LLM 相比被认为是部分封闭的。模型的训练数据和用于训练它的代码没有共享,这限制了开发人员和研究人员全面分析模型的能力。
维护开源完整性

接受部分开源项目作为开源可能会损害行业开源实践的可信度。一些潜在的影响包括:
- 合作协同的阻碍: 将非开源项目标记为开源可能会阻止潜在的协作者,阻碍开源定义的思想交流和集体问题解决。
- 创新范围的抑制: 接受闭源项目作为开源可能会扼杀创新,导致开发人员走向缺乏开源创新的道路。
- 混淆和采用障碍: 将闭源标记为开源可能会让用户和开发人员感到困惑,导致他们由于怀疑或不明确的区别而犹豫是否采用真正的开源项目。
- 法律迷宫: 接受不符合标准的项目可能会引起法律问题,增加复杂性和潜在的责任,并破坏社区的透明和合作精神。
为了解决这些潜在的后果,开源社区必须坚持开源的真正精神。明确定义和传达开源的原则和价值观可以帮助防止混淆,并确保被接受为开源的项目符合这些原则。
要了解最新的技术和 AI 智慧,请访问 Unite AI。请随时了解并领先于我们!












