人工智能
元开放式人工智能的逆袭:Meta 的 Llama 4 挑战 GPT-4o、Claude 和 Gemini

过去几年,人工智能世界从开放合作的文化转变为由密切守护的专有系统主导的文化。OpenAI 公司——一个字面上以“开放”为名的公司——在 2019 年之后将其最强大的模型保密。竞争对手如 Anthropic 和 Google 也类似地在 API墙后面构建了尖端的人工智能,仅在他们的条件下提供访问。这一封闭的方法部分是由安全和商业利益来证明的,但它让许多社区成员哀叹失去了早期的开放源精神。
现在,这种精神正在东山再起。Meta 的 新发布的 Llama 4 模型标志着一个大胆的尝试,旨在在最高水平上复兴开放源人工智能——即使传统的守护者也正在关注这一点。OpenAI 的 CEO Sam Altman 最近承认,该公司在开放模型方面“站在了历史的错误一边”,并 宣布了计划,即将发布一个“强大的新开放权重”GPT-4 变体。简而言之,开放源人工智能正在反击,而“开放”的含义和价值正在演变。

(来源:Meta)
Llama 4:Meta 的开放挑战者,面对 GPT-4o、Claude 和 Gemini
Meta 将 Llama 4 展现为对新模型的直接挑战,定位为开放权重的替代品。Llama 4 有两种风味可供选择——Llama 4 Scout 和 Llama 4 Maverick,具有令人惊叹的技术规格。两者都是 混合专家(MoE)模型,它们仅激活每个查询的一小部分参数,从而在不压垮运行时成本的情况下实现了巨大的总体规模。Scout 和 Maverick 每个都拥有 17 亿“活跃”参数(即任何给定输入上工作的部分),但由于 MoE,Scout 将这些参数分布在 16 个专家(109B 参数总计)上,而 Maverick 则分布在 128 个专家(400B 总计)上。结果:Llama 4 模型提供了强大的性能——并且具有即使一些封闭模型也缺乏的独特优势。
例如,Llama 4 Scout 拥有业界领先的 1000 万令牌上下文窗口,这远远超过了大多数对手。它可以一次性处理和推理巨大的文档或代码库。尽管其规模庞大,但 Scout 在高度量化的情况下可以在单个 H100 GPU 上运行,暗示开发人员不需要超级计算机来尝试使用它。
与此同时,Llama 4 Maverick 是为最大能力而调整的。早期测试显示 Maverick 在推理、编码和视觉任务上与顶级封闭模型相匹配或超越。事实上,Meta 已经预告了一款更大的兄弟模型 Llama 4 Behemoth,仍在训练中,内部 “在几个 STEM 基准测试中超越了 GPT-4.5、Claude 3.7 Sonnet 和 Gemini 2.0 Pro”。信息很明确:开放模型不再是二流;Llama 4 正在争夺最先进的状态。
同样重要的是,Meta 已经立即将 Llama 4 提供给开发人员下载和使用。开发人员可以从官方网站或 Hugging Face 获取 Scout 和 Maverick,使用 Llama 4 社区许可。这意味着任何人——从车库黑客到《财富》500 强公司——都可以深入研究模型,根据自己的需求对其进行微调,并在自己的硬件或云上部署它。这与 OpenAI 的 GPT-4o 或 Anthropic 的 Claude 3.7 等专有产品形成鲜明对比,后者通过付费 API 提供服务,但不提供对底层权重的访问。
Meta 强调 Llama 4 的开放性是关于赋予用户权力:“我们正在分享 Llama 4 群体中的第一个模型,这将使人们能够构建更个性化的多模态体验。”换句话说,Llama 4 是一个工具箱,旨在让开发人员和研究人员使用。通过发布可以在能力上与 GPT-4 和 Claude 相媲美的模型,Meta 正在复兴这样一种观念:顶级人工智能不必生活在付费墙后面。

(来源:Meta)
真实理想主义还是战略游戏?
Meta 将 Llama 4 以宏伟、几乎是利他主义的方式进行宣传。 “我们的开放源人工智能模型 Llama 已经被下载超过一亿次,” CEO 马克·扎克伯格 最近宣布,并补充说 “开放源人工智能模型对于确保每个人都能获得人工智能的好处至关重要。” 这种描述将 Meta描绘成民主化技术的捍卫者——一家愿意为更大的利益而分享其王冠珠宝模型的公司。的确,Llama 家族的受欢迎程度支持这一点:这些模型的下载量惊人(仅仅几个月的时间,从 6.5 亿跳跃到 10 亿次总下载量),它们已经被 Spotify、AT&T 和 DoorDash 等公司在生产中使用。
Meta 自豪地指出,开发人员欣赏开放模型的“透明度、可定制性和安全性”,这 “有助于达到新的创造力和创新水平”,相比之下,黑盒 API 则无法做到这一点。原则上,这听起来像旧的开放源软件理念(例如 Linux 或 Apache)被应用于人工智能——这是社区的明显胜利。
然而,人们无法忽视这种开放性的战略计算。Meta 不是慈善机构,“开放源”在这种情况下带有条件。值得注意的是,Llama 4 是在特殊的社区许可下发布的,而不是标准的宽容许可——因此,虽然模型权重可以免费使用,但某些高资源使用情况可能需要许可,许可是 “专有” 的,因为它是由 Meta 制作的。这不是 开放源计划(OSI)批准的开放源的定义,这导致一些批评者认为公司滥用了这个术语。
在实践中,Meta 的方法通常被描述为“开放权重”或“源代码可用”人工智能:代码和权重是公开的,但 Meta 仍然保持一些控制权,并不披露一切(例如训练数据)。这并没有降低用户的实用性,但它表明 Meta 是 战略性开放的——保持足够的控制权来保护自己(以及可能的竞争优势)。许多公司都在人工智能模型上贴上了“开放源”的标签,同时却隐瞒了重要细节,破坏了开放的真正精神。
为什么 Meta 要开放?竞争格局提供了线索。发布强大的免费模型可以快速建立广泛的开发人员和企业用户群体——Mistral AI,一家法国初创公司,通过早期开放模型实现了这一点,以获得对顶级实验室的可信度。
通过向市场播种 Llama,Meta 确保其技术成为人工智能生态系统的基础,这可能会在长期内带来回报。这是一种经典的拥抱和扩展策略:如果每个人都使用他们的“开放”模型,那么他们就会间接地设定标准,甚至可能将人们引向他们的平台(例如,Meta 的人工智能助手产品利用了 Llama)。这里还有一种公关和定位的元素。Meta 得以扮演仁慈的创新者的角色,尤其是与 OpenAI 相比,后者因其封闭的方法而受到批评。事实上,OpenAI 在开放模型方面的态度转变部分证明了 Meta 的举动是有效的。
在一款开创性的中国开放模型 DeepSeek-R1 于一月份问世并超越了以前的模型之后,Altman 表示 OpenAI 不想被留在“历史的错误一边”。现在 OpenAI 承诺在未来发布一个具有强大推理能力的开放模型,标志着态度的转变。很难不认为 Meta 的影响在其中。Meta 的开放源定位既是 真实的,又是 战略性的:它真正扩大了对人工智能的访问,但也是一种巧妙的策略,用于超越对手并按照 Meta 的方式塑造市场的未来。
对开发人员、企业和人工智能未来的影响
对于开发人员来说,像 Llama 4 这样的开放模型的复兴是一个令人耳目一新的变化。他们不再被锁定在单一提供商的生态系统和费用中,现在他们有了在自己的基础设施上运行强大的人工智能或自由定制它的选择。
对于敏感行业的企业来说——例如金融、医疗保健或政府——他们担心将机密数据输入某人的黑盒中,这是一个巨大的福音。使用 Llama 4,一家银行或医院可以在自己的防火墙后部署最先进的语言模型,并在私有数据上对其进行微调,而无需与外部实体共享一个令牌。这里还有一个成本优势。虽然顶级模型的基于使用的 API 费用可能会飙升,但开放模型没有使用费——您只需为运行它的计算能力付费。大量使用人工智能工作负载的企业可以通过选择开放解决方案在内部扩展而节省大量资金。
因此,人们看到更多企业对开放模型感兴趣;许多企业已经意识到,开放源人工智能的控制和安全与封闭服务更好地满足了他们的需求。
开发人员也会在创新方面获得好处。通过访问模型内部,他们可以根据自己的需求对其进行微调和改进人工智能,方法是针对特定领域(法律、生物技术、区域语言等)进行定制,这是封闭 API 可能无法做到的。早期 Llama 模型周围的社区驱动项目的爆发——从在医学知识上微调的聊天机器人到在智能手机上运行的迷你版本的爱好者应用——已经证明了开放模型如何使实验民主化。
然而,开放模型的复兴也提出了棘手的问题。是否真正实现了“民主化”,如果只有拥有大量计算资源的人才能运行 400B 参数模型?虽然 Llama 4 Scout 和 Maverick 相比单体模型降低了硬件门槛,但它们仍然是重量级模型——这并没有逃过一些开发人员的注意,他们的 PC 无法在没有云计算帮助的情况下处理它们。
希望是,像模型压缩、蒸馏或较小的专家变体这样的技术将使 Llama 4 的力量渗透到更容易接触的尺寸。另一个问题是滥用。OpenAI 和其他公司长期以来一直认为,公开发布强大的模型可能会使恶意行为者能够生成虚假信息、恶意代码等等。
这些担忧仍然存在:开放源的 Claude 或 GPT 可能会在没有公司在其 API 上强制执行的安全过滤器的情况下被滥用。另一方面,支持者认为开放性允许 社区在随着时间的推移使模型更加强大和透明,而不是任何秘密系统。有证据表明开放模型社区认真对待安全问题,开发自己的防护措施并共享最佳实践——但这是一场正在进行的紧张局势。
越来越明显的是,我们正朝着一个混合的人工智能格局发展,在那里开放和封闭的模型将共存,相互影响。像 OpenAI、Anthropic 和 Google 这样的封闭提供商仍然在绝对性能方面占据优势——目前如此。事实上,截至 2024 年末,研究表明 开放模型在能力方面落后于最好的封闭模型大约一年。但这种差距正在迅速缩小。
在今天的市场中,“开放源人工智能”不再仅仅意味着爱好者项目或较旧的模型——它现在是科技巨头和初创公司的核心人工智能战略。Meta 的 Llama 4 发布是一个强有力的提醒,开放的价值正在演变。它既是一种哲学立场,旨在民主化技术,也是高风险行业战役中的战术举动。对于开发人员和企业来说,它开启了创新和自主性的新门户,即使它带来了新的权衡。对于更广泛的生态系统来说,它带来了希望,即人工智能的好处不会被锁定在少数公司的手中——如果开放源精神能够坚持自己的立场。












