人工智能

为什么Meta最大的AI投资不是模型，而是数据

发布于 2025年6月8日

更新于 2026年5月18日

作者

Alex McFarland

Meta投资Scale AI的10亿美元代表着远不止于一次简单的资金投入——它标志着科技巨头在AI竞争中战略演变的根本转变。这个潜在的交易可能超过10亿美元，将成为Meta最大的外部AI投资，揭示了马克·扎克伯格的公司正在加倍下注于一个至关重要的洞察：在ChatGPT之后的时代，胜利不属于拥有最复杂算法的人，而属于那些控制最高质量数据管道的人。

数据统计：

10亿美元：Meta对Scale AI的潜在投资
870M → 2B：Scale AI的收入增长（2024年至2025年）
7B → 13.8B：Scale AI的估值轨迹在最近的融资轮次中

数据基础设施的必要性

在Llama 4收到了冷淡的反应之后，Meta可能正在寻找安全的独家数据集，以便在与OpenAI和Microsoft等竞争对手中占据优势。这次时机并非巧合。虽然Meta最新的模型在技术基准测试中显示出希望，但早期用户反馈和实施挑战凸显了一个残酷的现实：在今天的AI世界中，仅仅依靠架构创新是不够的。

“作为AI社区，我们已经用尽了所有容易获取的数据，互联网数据，现在我们需要转向更复杂的数据，” Scale AI的CEO亚历山大·王在2024年告诉金融时报。”数量很重要，但质量是至关重要的。” 这个观察准确地抓住了为什么Meta愿意在Scale AI的基础设施上进行如此大量的投资的原因。

Scale AI将自己定位为AI革命的”数据铸造厂”，为希望通过混合自动化和人工专业知识的方式训练机器学习模型的公司提供数据标注服务。Scale的秘密武器是其混合模型：它使用自动化来预处理和过滤任务，但依赖于分布式的训练有素的劳动力来进行人工判断，在AI训练中最重要的地方。

通过数据控制实现战略差异化

Meta的投资论点基于对竞争动态的深刻理解，这种理解超出了传统的模型开发。虽然像Microsoft这样的竞争对手将数十亿美元投入到模型创造者如OpenAI中，Meta却押注于控制支撑所有AI系统的底层数据基础设施。

这种方法提供了几个令人信服的好处：

专有数据集访问 —增强模型训练能力，同时可能限制竞争对手访问相同的高质量数据
管道控制 —减少对外部提供商的依赖，并具有更可预测的成本结构
基础设施焦点 —投资于基础层，而不是仅仅在模型架构上竞争

Scale AI的合作伙伴关系使Meta能够利用AI训练数据需求日益复杂的增长。最近的发展表明，大型AI模型的进步可能不再依赖于架构创新，而是更多地依赖于高质量的训练数据和计算。这种洞察力驱动了Meta在数据基础设施上进行大量投资，而不是仅仅在模型架构上竞争。

军事和政府维度

这项投资对商业AI应用以外的领域也有着重大的影响。Meta和Scale AI都在加深与美国政府的联系。两家公司正在合作开发军事版的Llama模型，称为Defense Llama。Scale AI最近与美国国防部签订了一份合同，开发用于作战的AI代理。

这种政府合作伙伴关系增加了战略价值，这种价值远远超出了直接的财务回报。军事和政府合同提供了稳定的长期收入流，同时将两家公司定位为国家AI能力的关键基础设施提供商。Defense Llama项目展示了如何将商业AI开发与国家安全考虑相结合。

挑战Microsoft-OpenAI范式

Meta在Scale AI的投资将直接挑战当前AI领域中占主导地位的Microsoft-OpenAI合作伙伴模式。Microsoft仍然是OpenAI的主要投资者，提供资金和能力来支持他们的进步，但这种关系主要集中在模型开发和部署，而不是基础数据基础设施。

相比之下，Meta的方法优先考虑控制所有AI开发的基础层。这种策略可能比专注于模型开发和部署的独家合作伙伴关系更为持久，因为后者面临着日益激烈的竞争压力和潜在的合作伙伴关系不稳定性。最近的报告表明，Microsoft正在开发自己的内部推理模型，以与OpenAI竞争，并且已经在测试来自Elon Musk的xAI、Meta和DeepSeek的模型，以在Copilot中替换ChatGPT，突出了大型科技公司的AI投资策略中的内在紧张关系。

AI基础设施的经济学

Scale AI去年的收入为870万美元，预计今年将达到2亿美元，表明专业AI数据服务的市场需求很大。该公司的估值轨迹——从大约70亿美元到最近的融资轮次中的138亿美元——反映了投资者对数据基础设施作为持久竞争优势的认识。

Meta的10亿美元投资将为Scale AI提供前所未有的资源，以扩大其全球业务并开发更复杂的数据处理能力。这种规模优势可能会产生网络效应，使竞争对手难以匹配Scale AI的质量和成本效率，特别是当AI基础设施投资在整个行业继续升级时。

这项投资标志着整个行业向AI基础设施垂直整合的演变。科技巨头不再仅仅依赖与专门的AI公司的合作，而是开始收购或大量投资于支撑AI开发的底层基础设施。

此举还凸显了数据质量和模型对齐服务在AI系统变得更加强大并被部署在更敏感的应用中时将变得更加关键的认识。Scale AI在强化学习从人类反馈（RLHF）和模型评估方面的专业知识为Meta提供了开发安全、可靠的AI系统所需的能力。

展望：数据战争开始

Meta在Scale AI的投资代表着可能成为”数据战争”的开端——一场争夺控制高质量、专业数据集的竞争，这些数据集将决定AI领导地位的未来十年。

这种战略转变承认，虽然当前的AI热潮始于像ChatGPT这样的突破性模型，但持续的竞争优势将来自于控制使持续模型改进成为可能的基础设施。随着行业超越初期的AI热潮，控制数据管道的公司可能会发现自己拥有比仅仅许可或合作伙伴关系来获取模型访问权限更持久的优势。

对于Meta来说，Scale AI的投资是一项经过计算的赌注，未来AI竞争的胜利将在数据预处理中心和注释工作流中取得——这些是大多数消费者从未见过的，但最终决定哪些AI系统在现实世界中成功的因素。如果这个论点被证明是正确的，Meta的10亿美元投资可能会被铭记为公司在AI革命下一阶段中确立其地位的时刻。