思想领袖

DeepSeek：效率提升，不是AI创新中的范式转变

发布于 2025年2月27日

更新于 2026年5月19日

作者

Dr. Ben Goertzel, 人工超智能（ASI）联盟首席执行官和SingularityNET创始人

最近围绕DeepSeek的兴奋是可以理解的，考虑到它在大语言模型（LLM）领域带来的显著效率提升。然而，一些对其发布的反应似乎误解了其影响的程度。DeepSeek代表着LLM开发预期轨迹上的一个飞跃，但它并不标志着向人工通用智能（AGI）的革命性转变，也不是AI创新中心的突然转变。

相反，DeepSeek的成就是沿着一条既定的道路上的自然进步——AI技术的指数增长。它不是一个颠覆性的范式转变，而是一个强有力的提醒，技术变革的步伐正在加快。

DeepSeek的效率提升：沿着预期轨迹的飞跃

围绕DeepSeek的兴奋核心在于其令人印象深刻的效率改进。其创新主要是关于使LLM更快、更便宜，这对AI模型的经济学和可及性有着重大影响。然而，尽管有这样的热潮，这些进步并不是根本新颖的，而是现有方法的改进。

在20世纪90年代，高端计算机图形渲染需要超级计算机。今天，智能手机就能完成同样的任务。同样，面部识别——曾经是一种小众、高成本的技术——现在已经成为智能手机中的一种普遍、开箱即用的功能。DeepSeek符合这种技术模式：对现有能力的优化，带来效率提升，但不是一个全新的、开创性的方法。

对于熟悉技术增长原理的人来说，这种快速进步并不是意外。技术奇点理论预测，随着我们接近奇点，关键领域如AI的进步将会加速。DeepSeek只是这一正在进行的趋势中的一个时刻，其作用是使现有的AI技术更加可及和高效，而不是代表着向新能力的突然飞跃。

DeepSeek的创新：架构调整，而非飞跃到AGI

DeepSeek的主要贡献在于优化大语言模型的效率，特别是通过其Mixture of Experts（MoE）架构。MoE是一种成熟的集成学习技术，多年来一直被用于AI研究。DeepSeek所做的特别之处是完善了这种技术，结合其他效率措施以最小化计算成本，使LLM更加经济实惠。

参数效率：DeepSeek的MoE设计仅在任何时候激活其671亿参数中的37亿，减少了传统LLM的计算需求，仅为1/18。
强化学习用于推理：DeepSeek的R1模型使用强化学习来增强链式思维推理，这是语言模型的一个重要方面。
多令牌训练：DeepSeek-V3能够同时预测多个文本片段，提高了训练的效率。

这些改进使DeepSeek模型在训练和运行成本方面比OpenAI或Anthropic等竞争对手明显降低。虽然这是LLM可及性的一个重大步骤，但它仍然是工程上的改进，而不是向AGI的概念突破。

开源AI的影响

DeepSeek的一个最值得注意的决定是使其模型开源，这明显不同于OpenAI、Anthropic和Google等公司的专有、封闭式方法。这种开源方法，由AI研究人员如Meta的Yann LeCun倡导，促进了一个更加去中心化的AI生态系统，在那里，创新可以通过集体开发而蓬勃发展。

DeepSeek开源决定背后的经济理由也很明确。开源AI不仅是一种哲学立场，也是一种商业策略。通过使其技术对广泛的研究人员和开发人员开放，DeepSeek将从服务、企业集成和可扩展托管中受益，而不是仅仅依赖于专有模型的销售。这种方法使全球AI社区能够获取竞争性工具，并减少了西方科技巨头对该领域的控制。

中国在AI竞赛中的日益增长的作用

对于很多人来说，DeepSeek的突破来自中国可能会令人惊讶。然而，这一发展不应被视为令人震惊或作为地缘政治竞争的一部分。多年来观察中国的AI格局，很明显该国已经在AI研究上进行了大量投资，形成了一个日益增长的人才和专家库。

而不是将这一发展视为对西方主导地位的挑战，它应该被视为AI研究日益全球化的标志。开放合作，而不是国家间的竞争，是实现AGI负责任和道德发展的最有前途的途径。一个去中心化的、全球分布的努力更有可能产生一个惠及所有人类的AGI，而不是服务于一个国家或公司的利益。

DeepSeek的更广泛影响：超越LLM

虽然围绕DeepSeek的兴奋主要集中在其在LLM领域的效率上，但退一步考虑这一发展的更广泛影响是至关重要的。

尽管其能力令人印象深刻，但基于变压器的模型，如LLM，仍然远远没有达到AGI。它们缺乏基本的品质，如基于基础的组合抽象和自我导向的推理，这些对于一般智能是必要的。虽然LLM可以自动化广泛的经济任务并集成到各个行业，但它们并不能代表AGI发展的核心。

如果AGI在接下来的十年内出现，很可能不会纯粹基于变压器架构。其他模型，如OpenCog Hyperon或神经形态计算，可能在实现真正的通用智能方面更为基础。

LLM的商品化将转移AI投资

DeepSeek的效率提升加速了LLM的商品化趋势。随着这些模型的成本继续下降，投资者可能开始寻找超越传统LLM架构的下一个重大AI突破。我们可能会看到资金转向AGI架构，超越变压器，以及投资于替代AI硬件，如神经形态芯片或关联处理单元。

去中心化将塑造AI的未来

随着DeepSeek的效率改进使得部署AI模型变得更容易，它们也为更广泛的去中心化AI架构趋势做出了贡献。通过关注隐私、互操作性和用户控制，去中心化AI将减少我们对大型集中式科技公司的依赖。这一趋势对于确保AI服务于全球人口的需求，而不是被少数强大的玩家控制，是至关重要的。

DeepSeek在AI寒武纪爆发中的位置

总之，虽然DeepSeek是LLM效率的一个重大里程碑，但它并不是AI格局中的革命性转变。相反，它加速了沿着既定轨迹的进步。DeepSeek的更广泛影响体现在几个领域：

对现有玩家的压力：DeepSeek挑战像OpenAI和Anthropic这样的公司重新思考他们的商业模式，找到新的竞争方式。
AI的可及性：通过使高质量模型更加经济实惠，DeepSeek使尖端技术民主化。
全球竞争：中国在AI开发中的日益增长的作用标志着创新日益全球化，而不是仅限于西方。
指数进步：DeepSeek是AI进步加速的明显例子。

最重要的是，DeepSeek提醒我们，虽然AI正在迅速进步，但真正的AGI可能会通过新的、基础的方法出现，而不是优化今天的模型。随着我们朝着奇点前进，确保AI开发保持去中心化、开放和协作至关重要。

DeepSeek不是AGI，但它代表着通往变革性AI的旅程中的一步重要进展。通过新、基础的方法，而不是优化今天的模型，我们朝着奇点前进时，确保AI开发保持去中心化、开放和协作至关重要。DeepSeek不是AGI，但它代表着向变革性AI迈出的一步重要进展。