思想领袖

巨型模型并不是计算危机的核心

mm

每当一个新的AI模型发布——GPT更新、DeepSeek、Gemini——人们都会对这些巨型模型的庞大规模、复杂性以及日益增长的计算需求感到惊讶。人们认为这些模型定义了AI革命的资源需求。

但是,这种假设是错误的。

是的,大的模型确实需要大量计算资源。但是,对AI基础设施的最大压力并不是来自少数巨型模型,而是来自各个行业中AI模型的无声蔓延,每个模型都针对特定的应用进行了微调,并以前所未有的规模消耗计算资源。

尽管LLM之间的竞争正在加剧,但AI领域并没有集中化——它正在变得更加分散。每个企业不仅仅是在使用AI——它们正在训练、定制和部署私有模型以满足自己的需求。这将会产生一种基础设施需求曲线,云服务提供商、企业和政府都无法应对。

我们以前也见过这种模式。云计算并没有整合IT工作负载——它创造了一个混合的生态系统。首先是服务器扩张,然后是虚拟机扩张。现在?AI扩张。每一波计算都导致了扩张,而不是简化。AI也不例外。

AI 扩张:为什么AI的未来是一百万个模型,而不是一个

金融、物流、网络安全、客户服务、研发——每个领域都有自己的AI模型,针对特定的功能进行优化。组织并不训练一个AI模型来统治整个运营。它们训练成千上万个模型。这意味着更多的训练周期、更多的计算需求、更多的存储需求和更多的基础设施扩张。

这不是理论。即使在传统上对技术采用较为谨慎的行业,AI投资也正在加速。2024年麦肯锡的一份报告发现,组织现在在平均三个业务功能中使用AI,制造业、供应链和产品开发领先(麦肯锡)。

医疗保健是一个典型的例子。Navina,一家将AI集成到电子健康记录中以提供临床洞察的初创公司,刚刚从高盛获得5500万美元的C轮融资(Business Insider)。能源行业也不例外——行业领袖已经推出了开放电力AI联盟,以将AI优化应用于电网和工厂运营(Axios)。

没有人在谈论的计算压力

AI已经打破了传统的基础设施模式。认为云可以无限扩展以支持AI增长的假设是错误的。AI不像传统工作负载那样扩展。需求曲线不是渐进的——它是指数级的,超大规模计算提供商无法跟上。

  • 电力约束:AI专用数据中心现在正在根据电力供应而不是网络骨干进行建设。
  • 网络瓶颈:混合IT环境正变得难以管理,而AI工作负载只会加剧这种情况。
  • 经济压力:AI工作负载可以在一个月内消耗数百万美元,造成财务不可预测性。

数据中心已经占全球电力消耗的1%。在爱尔兰,数据中心现在占全国电网的20%,预计到2030年这一比例将显著增加(IEA)。

此外,GPU的压力也在增大。贝恩公司最近警告说,AI增长可能会导致半导体短缺,驱动因素是对数据中心级芯片的需求爆发(贝恩)。

与此同时,AI的可持续性问题也在增长。2024年在《可持续城市和社会》杂志上发表的一项分析警告说,医疗保健领域广泛采用AI可能会显著增加该行业的能源消耗和碳排放,除非通过有针对性的效率措施进行抵消(ScienceDirect)。

AI 扩张比市场更大——它是国家权力的问题

如果你认为AI扩张只是一个企业问题,那么你就错了。AI碎片化的最大驱动力并不是私营部门——而是政府和军事国防机构,它们正在以超出任何超大规模计算提供商或企业的规模部署AI。

美国政府单独就已经在27个机构的700多个应用中部署了AI,涵盖情报分析、后勤等领域(FedTech Magazine)。

加拿大正在投资多达7亿美元以扩大国内AI计算能力,并推出了国家挑战以加强主权数据中心基础设施(加拿大创新、科学和经济发展部)。

人们正在呼吁启动“阿波罗计划”以发展AI基础设施——这凸显了AI从商业优势转变为国家迫切需要的过程(MIT Technology Review)。

军事AI不会高效、协调或优化成本——它将由国家安全命令、地缘政治紧迫性和对封闭、主权AI系统的需求驱动。即使企业控制AI扩张,谁会告诉政府放慢脚步?

因为当国家安全问题出现时,没人会停下来问电网是否能承受得住。

Herb Hogue 是全球系统集成商 Myriad360 的首席技术官,拥有超过 25 年的战略规划、技术集成、创新和全球领导经验。Herb 的专业知识涵盖金融、医疗保健、媒体、咨询、抵押贷款行业和解决方案集成商。在 Myriad360,他领导解决方案产品、合作伙伴关系,并管理云计算、人工智能、网络、安全和基础设施的专业服务。他的前任职位在 Insight 和 PCM凸显了他在云服务和数据中心解决方案方面推动显著增长的能力。他拥有亚利桑那大学的网络和数据安全学士学位。