思想领袖
DeepSeek 能教会我们什么关于 AI 成本和效率的知识

凭借其可爱的鲸鱼标志,最近发布的 DeepSeek 可能只不过是 ChatGPT 的又一个山寨版。它之所以如此有新闻价值——以及让竞争对手的股票陷入混乱的原因——是它的开发成本非常低。它实际上颠覆了美国对训练一个高效大型语言模型 (LLM) 所需投资的认识。
据称,DeepSeek 仅花费 6 万美元来训练其 AI 模型。相比之下,OpenAI 据报道在 Chat GPT-80 上花费了 100 万至 4 亿美元,为 GPT-1 预留了 5 亿美元。DeepSeek 对这一投资水平提出了质疑,并让 Nvidia(其股票价值在一天内暴跌 600 亿美元)、台积电和微软等大公司对 AI 的长期财务可行性感到担忧。如果能够以比之前假设低得多的成本来训练 AI 模型,这对 AI 整体支出意味着什么?
尽管 DeepSeek 的颠覆性引起了重要的讨论,但一些关键点似乎在混乱中被忽略了。然而,这则新闻引发了人们对创新成本以及人工智能可能产生的经济影响的更多关注。以下是从这则新闻中得出的三个重要见解:
1. DeepSeek 6 万美元的标价具有误导性
公司需要了解其基础设施的总拥有成本 (TCO)。尽管 DeepSeek 6 万美元的价格已被广泛讨论,但这可能只是其预训练运行的成本,而不是其全部投资。总成本(不仅是运行成本,还包括构建和训练 DeepSeek)可能要高得多。行业分析公司 半分析 透露 DeepSeek 背后的公司花费了 1.6 亿美元购买硬件,以实现其 LLM 目标。因此,可能的成本介于两者之间。
无论实际成本是多少,DeepSeek 的出现让人们关注到具有成本效益的创新,这种创新可能会带来变革。创新往往受到限制的刺激,DeepSeek 的成功凸显了当工程团队在现实限制面前优化资源时,创新可以如何发生。
2. 推理才是人工智能的价值所在,而非训练
关注人工智能模型训练的成本很重要,但训练仅占构建和运行人工智能模型总成本的一小部分。 推理 — 人工智能以多种方式改变人们的工作、互动和生活方式 — 这是人工智能真正有价值的地方。
这引出了杰文斯悖论,这是一项经济理论,认为随着技术进步使资源的使用更加高效,该资源的总体消耗实际上可能会增加。换句话说,随着培训成本的下降,推理和代理消耗将会增加,总体支出也会随之增加。
事实上,人工智能效率可能会推动人工智能支出的上升,这将使所有公司受益,而不仅仅是中国公司。假设他们能乘上效率浪潮,OpenAI 和 Nvidia 等公司也将受益。
3. 不变的是,单位经济效益最重要
提高人工智能的效率不仅仅是为了降低成本,也是为了优化单位经济效益。Motley Fool 预测今年将是 人工智能效率之年如果他们是对的,那么企业就应该注意降低人工智能培训成本以及人工智能消费成本。
构建或使用 AI 的组织需要了解其单位经济效益,而不是单单列出 DeepSeek 6 万美元的培训成本等令人印象深刻的数字。真正的效率需要分配所有成本、跟踪 AI 驱动的需求并持续关注成本与价值。
云单位经济学 (CUE) 与衡量和最大化云带来的利润有关。CUE 将您的云成本与收入和需求指标进行比较,揭示您的云支出效率如何、随着时间的推移发生了怎样的变化,以及(如果您拥有合适的平台)提高效率的最佳方法。
了解 CUE 在 AI 环境中具有更大的实用性,因为它的使用成本本质上比超大规模企业销售的传统云服务更高。构建代理应用程序的公司可以计算每笔交易的成本(例如每张账单的成本、每次交付的成本、每笔交易的成本等),并以此来评估特定 AI 驱动服务、产品和功能的投资回报率。随着 AI 支出的增加,公司将被迫这样做;没有一家公司可以永远在实验性创新上投入无尽的资金。最终,它必须具有商业意义。
提高效率
无论 6 万美元这个数字有多大意义,DeepSeek 可能提供了一个分水岭,让科技行业意识到效率的必然重要性。希望这能为具有成本效益的训练、推理和代理应用打开闸门,释放人工智能的真正潜力和投资回报率。