思想领袖
DeepSeek:效率提升,不是AI创新中的范式转变
最近围绕DeepSeek的兴奋是可以理解的,考虑到它在大语言模型(LLM)领域带来的显著效率提升。然而,一些对其发布的反应似乎误解了其影响的程度。DeepSeek代表着LLM开发预期轨迹上的一个飞跃,但它并不标志着向人工通用智能(AGI)的革命性转变,也不是AI创新中心的突然转变。
相反,DeepSeek的成就是沿着一条既定的道路上的自然进步——AI技术的指数增长。它不是一个颠覆性的范式转变,而是一个强有力的提醒,技术变革的步伐正在加快。
DeepSeek的效率提升:沿着预期轨迹的飞跃
围绕DeepSeek的兴奋核心在于其令人印象深刻的效率改进。其创新主要是关于使LLM更快、更便宜,这对AI模型的经济学和可及性有着重大影响。然而,尽管有这样的热潮,这些进步并不是根本新颖的,而是现有方法的改进。
在20世纪90年代,高端计算机图形渲染需要超级计算机。今天,智能手机就能完成同样的任务。同样,面部识别——曾经是一种小众、高成本的技术——现在已经成为智能手机中的一种普遍、开箱即用的功能。DeepSeek符合这种技术模式:对现有能力的优化,带来效率提升,但不是一个全新的、开创性的方法。
对于熟悉技术增长原理的人来说,这种快速进步并不是意外。技术奇点理论预测,随着我们接近奇点,关键领域如AI的进步将会加速。DeepSeek只是这一正在进行的趋势中的一个时刻,其作用是使现有的AI技术更加可及和高效,而不是代表着向新能力的突然飞跃。
DeepSeek的创新:架构调整,而非飞跃到AGI
DeepSeek的主要贡献在于优化大语言模型的效率,特别是通过其Mixture of Experts(MoE)架构。MoE是一种成熟的集成学习技术,多年来一直被用于AI研究。DeepSeek所做的特别之处是完善了这种技术,结合其他效率措施以最小化计算成本,使LLM更加经济实惠。
- 参数效率:DeepSeek的MoE设计仅在任何时候激活其671亿参数中的37亿,减少了传统LLM的计算需求,仅为1/18。
- 强化学习用于推理:DeepSeek的R1模型使用强化学习来增强链式思维推理,这是语言模型的一个重要方面。
- 多令牌训练:DeepSeek-V3能够同时预测多个文本片段,提高了训练的效率。
这些改进使DeepSeek模型在训练和运行成本方面比OpenAI或Anthropic等竞争对手明显降低。虽然这是LLM可及性的一个重大步骤,但它仍然是工程上的改进,而不是向AGI的概念突破。
开源AI的影响
DeepSeek的一个最值得注意的决定是使其模型开源,这明显不同于OpenAI、Anthropic和Google等公司的专有、封闭式方法。这种开源方法,由AI研究人员如Meta的Yann LeCun倡导,促进了一个更加去中心化的AI生态系统,在那里,创新可以通过集体开发而蓬勃发展。
DeepSeek开源决定背后的经济理由也很明确。开源AI不仅是一种哲学立场,也是一种商业策略。通过使其技术对广泛的研究人员和开发人员开放,DeepSeek将从服务、企业集成和可扩展托管中受益,而不是仅仅依赖于专有模型的销售。这种方法使全球AI社区能够获取竞争性工具,并减少了西方科技巨头对该领域的控制。
中国在AI竞赛中的日益增长的作用
对于很多人来说,DeepSeek的突破来自中国可能会令人惊讶。然而,这一发展不应被视为令人震惊或作为地缘政治竞争的一部分。多年来观察中国的AI格局,很明显该国已经在AI研究上进行了大量投资,形成了一个日益增长的人才和专家库。
而不是将这一发展视为对西方主导地位的挑战,它应该被视为AI研究日益全球化的标志。开放合作,而不是国家间的竞争,是实现AGI负责任和道德发展的最有前途的途径。一个去中心化的、全球分布的努力更有可能产生一个惠及所有人类的AGI,而不是服务于一个国家或公司的利益。
DeepSeek的更广泛影响:超越LLM
虽然围绕DeepSeek的兴奋主要集中在其在LLM领域的效率上,但退一步考虑这一发展的更广泛影响是至关重要的。
尽管其能力令人印象深刻,但基于变压器的模型,如LLM,仍然远远没有达到AGI。它们缺乏基本的品质,如基于基础的组合抽象和自我导向的推理,这些对于一般智能是必要的。虽然LLM可以自动化广泛的经济任务并集成到各个行业,但它们并不能代表AGI发展的核心。
如果AGI在接下来的十年内出现,很可能不会纯粹基于变压器架构。其他模型,如OpenCog Hyperon或神经形态计算,可能在实现真正的通用智能方面更为基础。
LLM的商品化将转移AI投资
DeepSeek的效率提升加速了LLM的商品化趋势。随着这些模型的成本继续下降,投资者可能开始寻找超越传统LLM架构的下一个重大AI突破。我们可能会看到资金转向AGI架构,超越变压器,以及投资于替代AI硬件,如神经形态芯片或关联处理单元。
去中心化将塑造AI的未来
随着DeepSeek的效率改进使得部署AI模型变得更容易,它们也为更广泛的去中心化AI架构趋势做出了贡献。通过关注隐私、互操作性和用户控制,去中心化AI将减少我们对大型集中式科技公司的依赖。这一趋势对于确保AI服务于全球人口的需求,而不是被少数强大的玩家控制,是至关重要的。
DeepSeek在AI寒武纪爆发中的位置
总之,虽然DeepSeek是LLM效率的一个重大里程碑,但它并不是AI格局中的革命性转变。相反,它加速了沿着既定轨迹的进步。DeepSeek的更广泛影响体现在几个领域:
- 对现有玩家的压力:DeepSeek挑战像OpenAI和Anthropic这样的公司重新思考他们的商业模式,找到新的竞争方式。
- AI的可及性:通过使高质量模型更加经济实惠,DeepSeek使尖端技术民主化。
- 全球竞争:中国在AI开发中的日益增长的作用标志着创新日益全球化,而不是仅限于西方。
- 指数进步:DeepSeek是AI进步加速的明显例子。
最重要的是,DeepSeek提醒我们,虽然AI正在迅速进步,但真正的AGI可能会通过新的、基础的方法出现,而不是优化今天的模型。随着我们朝着奇点前进,确保AI开发保持去中心化、开放和协作至关重要。
DeepSeek不是AGI,但它代表着通往变革性AI的旅程中的一步重要进展。通过新、基础的方法,而不是优化今天的模型,我们朝着奇点前进时,确保AI开发保持去中心化、开放和协作至关重要。DeepSeek不是AGI,但它代表着向变革性AI迈出的一步重要进展。












