思想领袖

人工智能对电力的日益增长的需求:数据中心是否能够跟上?

mm

随着人工智能(AI)的快速发展,其能耗需求正在给数据中心带来巨大的压力。下一代人工智能技术,如生成式人工智能(genAI),不仅正在改变各个行业,其能耗也影响到了几乎每个数据服务器组件,从CPU和内存到加速器和网络。

genAI应用,包括Microsoft的Copilot和OpenAI的ChatGPT,需要比以往更多的能量。到2027年,仅训练和维护这些人工智能系统就可能消耗足够的电力来为一个小国提供一年所需的电力。这种趋势并没有减缓:过去十年中,CPU、内存和网络等组件的功耗预计到2030年将增加160%,根据高盛的一份报告。

大型语言模型的使用也消耗了能量。例如,一个ChatGPT查询消耗了大约十倍于传统的谷歌搜索的能量。考虑到人工智能的巨大能耗需求,行业的快速进步是否可以被可持续地管理,还是会进一步导致全球能耗的增加?麦肯锡最近的研究显示,大约70%的数据中心市场需求增长是针对能够处理高级人工智能工作负载的设施。这一转变从根本上改变了数据中心的建设和运行方式,因为它们适应了这些高功率genAI任务的独特要求。

“传统数据中心通常使用老旧的、能耗高的设备和固定容量,难以适应不断变化的工作负载,导致了大量的能耗浪费,”Aethir的首席战略官和联合创始人Mark Rydon告诉我。“集中式运营通常会在资源可用性和消耗需求之间产生不平衡,导致行业面临一个关键的十字路口,即进步可能会危及环境目标,因为人工智能驱动的需求正在增长。”

行业领袖现在正面对这一挑战,投资于更绿色的设计和能效更高的数据中心架构。这些努力包括采用可再生能源、创建更高效的冷却系统,以抵消genAI工作负载产生的巨大热量。

为更绿色的未来革新数据中心

联想最近推出了ThinkSystem N1380 Neptune,这是数据中心液体冷却技术的一个飞跃。该公司声称,这项创新已经使组织能够以显著降低能耗(最高可达40%)部署高功率计算以处理genAI工作负载。N1380 Neptune利用了NVIDIA的最新硬件,包括Blackwell和GB200 GPU,使得在紧凑的设置中可以处理万亿参数的AI模型。联想表示,它旨在为不需要专用空调的100KW+服务器机架的数据中心铺平道路。

“我们发现当前的消费者有一个显著的需求:数据中心在处理人工智能工作负载时会消耗更多的电力,因为冷却架构和传统结构框架已经过时,”联想全球人工智能总监Robert Daigle告诉我。“为了更好地理解这一点,我们与一家高性能计算(HPC)客户合作,分析了他们的功耗,这导致我们得出结论:我们可以将能耗降低40%。”他补充说,该公司考虑了风扇功耗、冷却单元的功耗等因素,并将其与联想的数据中心评估服务中可用的标准系统进行比较,以开发新的数据中心架构,并与NVIDIA合作。

英国信息技术咨询公司AVEVA表示,它正在使用预测分析来识别数据中心压缩机、电机、HVAC设备、空气处理器等问题。

“我们发现,生成式人工智能的预训练是消耗大量电力的,”AVEVA的人工智能和高级分析负责人Jim Chappell告诉我。“通过我们的预测人工智能驱动系统,我们旨在在任何SCADA或控制系统之前找到问题,允许数据中心运营商在问题变得严重之前解决设备问题。此外,我们有一个Vision AI助手,它可以与我们的控制系统本地集成,以帮助找到其他类型的异常,包括当使用热成像相机时的温度热点。”

同时,通过GPU在云上进行人工智能训练和开发的去中心化计算正在作为一种替代方案出现。Aethir的Rydon解释说,通过将计算任务分配到更广泛、更适应性的网络中,可以优化能耗,通过将资源需求与可用性相匹配,从而大大减少浪费。“与其依赖大型集中式数据中心,我们的‘边缘’基础设施将计算任务分散到离数据源更近的节点,这大大减少了数据传输的能耗并降低了延迟,”他说。“Aethir Edge网络最小化了对恒定高功率冷却的需求,因为工作负载分散在各个环境中,而不是集中在一个位置,从而避免了典型的集中式数据中心中能耗高的冷却系统。”

同样,包括亚马逊和谷歌在内的公司正在尝试使用可再生能源来管理其数据中心日益增长的电力需求。微软正在大量投资可再生能源和提高效率的技术,以降低其数据中心的能耗。谷歌也采取了措施转向碳自由能源,并探索最小化数据中心电力使用的冷却系统。“核能可能是实现碳自由数据中心的最快途径。像微软、亚马逊和谷歌这样的主要数据中心提供商现在正在大量投资这种类型的发电,”AVEVA的Chappell补充说。“小型模块化反应堆(SMR)具有灵活性和生产时间,使其成为实现净零的更可行的选择。”

人工智能和数据中心可持续性能否共存?

MinIO人工智能基础设施平台的CTOUgur Tigli表示,虽然我们希望未来人工智能能够在不大幅增加能耗的情况下发展,但在短期内这并不现实。“长期影响更难预测,”他告诉我:“但我们将看到工作力的转变,人工智能将在整体上改善能耗,尤其是在其他领域变得更加高效时。”Tigli认为,随着能效成为市场的优先事项,我们将看到计算能力的增长和其他领域能耗的下降,特别是在这些领域变得更加高效时。

他还指出,消费者对更绿色的人工智能解决方案的兴趣日益增长。“想象一个以90%的效率运行但只使用一半电力的AI应用——这就是可能真正起飞的创新,”他补充说。很明显,人工智能的未来不仅仅是关于创新——它还关乎数据中心的可持续性。无论是开发更高效的硬件还是更智能地使用资源,我们如何管理人工智能的能耗都将极大地影响数据中心的设计和运营。

Rydon强调了行业范围内专注于可持续数据中心设计、能效人工智能工作负载和开放资源共享的举措的重要性。“这些都是朝着更绿色的运营迈出的至关重要的步骤,”他说。“使用人工智能的企业应该与科技公司合作,创造出降低环境影响的解决方案。通过共同努力,我们可以引导人工智能朝着更可持续的未来发展。”

Victor Dey 是一名技术编辑和作家,报道人工智能、加密货币、数据科学、元宇宙和网络安全等领域。 他拥有半十年的媒体和人工智能经验,曾在 VentureBeat、Metaverse Post、Observer 等知名媒体机构工作。 Victor 曾在牛津大学和南加州大学等顶尖大学的加速器项目中指导学生创业者,并拥有数据科学和分析的硕士学位。