思想领袖

人工智能可能感觉是数字化的,但其核心是由钢铁和电力驱动的

mm

当我们大多数人想到人工智能(AI)时,我们会想到算法、学习循环和在云中优化自身的庞大数据模型。但是,这些数字抽象背后是一个非常物理的基础:全球数据中心网络,它们推动了AI的快速演进。

这些设施依赖于大量的电力、工业冷却液和水流,以及泵、涡轮机和电力分配系统。如果这些组件中的任何一个出现故障,即使是最先进的AI模型也可能完全停止。

现代AI背后的工业规模需求

AI的崛起推动了对基础设施的前所未有的投资——这是现代技术史上最大的和最快的扩张之一。主要的科技提供商正在大量投资建设和维护数据中心,其规模与国家基础设施相媲美。

最近的一份路透社报告认为,AI的投资(其中基础设施是最大的支出),不仅超过了其他最近的技术热潮的投资,而且超过了像曼哈顿计划和阿波罗计划这样的政府主导的计划。2024年,137个新的超大规模数据中心上线,2025年的数量预计将类似。根据麦肯锡的估计,“计算能力价值链上的公司需要在2030年之前投资5.2万亿美元到数据中心,以满足全球对AI的需求。”

尽管数据中心具有未来主义的气息,但它们的功能与任何工业工厂类似, 将原材料转化为有价值的商品。只是,在这种情况下,处理、转化和交付的不是原材料,而是高价值的数据洞察,供个人、组织和政府使用。

为了保持数据中心的连续运行,底层的运营技术(OT)系统——温度调节、电力分配、水管理和广泛的机械控制——必须始终被监控和保护。一次网络攻击或其他事件可能会在几分钟内关闭整个设施,造成巨大的经济损失和对现场人员的潜在安全风险。

AI数据中心是新的关键基础设施

社会长期以来一直认识到保护电网、水利、交通系统的重要性。AI数据中心现在同样被认为是关键基础设施。每个临床诊断模型、自动驾驶导航系统、供应链规划器和实时分析平台都依赖于其不间断的运行——这种依赖性只会越来越强。

随着AI工作负载跨越大陆, 每个数据中心的可靠性变得更加重要。许多AI模型现在在分布式环境中运行,训练、存储和推理是在多个站点上处理的。一次停机可能会中断这些工作流程,减慢开发周期,并破坏数百万人每天依赖的服务。

这种相互关联意味着一个设施的弱点可能会在其物理位置以外产生涟漪效应。因此,加强数据中心级别的安全性不仅仅是关于保护一个单独的站点——它是关于支持整个AI生态系统的恢复力。

当一个AI数据中心出现故障时,中断会在各个行业中传播。客户服务平台停滞,医疗保健系统失去实时洞察,数字生产力工具降级或完全断开。AI的物理基础设施的安全性和可靠性对国家、经济和运营都有直接的影响。

这些设施还严重依赖远程工程师、承包商和供应商。许多数据中心位于农村地区,远离人口中心,由远程专家维护和修复设备或执行其他重要任务。这种远程连接提高了效率,减少了停机时间,但也为恶意行为者扩大了攻击面。因此,每个数据中心的远程连接都必须经过身份验证、监控和严格控制——就像电网或水处理厂一样。

现在的问题不再是是否应该将AI数据中心视为关键基础设施,而是我们是否能承担将其视为其他东西的后果。

技术与工业的交汇:核心OT安全实践

由于AI的正常运行对这么多东西至关重要,数据中心必须一致且严格地应用OT远程访问安全最佳实践。

关键原则包括:

  1. 执行零信任访问: 零信任安全模型基于“永远不要信任,始终验证”的原则。当涉及数据中心访问时,每个身份——无论是远程技术人员还是内部自动化工作负载——都应经过身份验证,然后仅被授予执行其工作所需的资源访问权限。这限制了横向移动,防止未经授权访问关键的工业控制系统。
  2. 在所有地方应用多因素身份验证(MFA): MFA是防止未经授权访问的最有效防御之一。通过要求两个或多个独立的验证因素——例如生物识别身份验证、一次性令牌或物理安全密钥——MFA加强了身份验证,并强化了更广泛的零信任战略。为了获得最全面的保护,组织应该寻找能够在不中断操作的情况下为传统的OT系统提供MFA支持的解决方案。
  3. 采用监督和日志记录功能: 传统的远程访问工具,如VPN和跳转服务器,专注于保护初始访问点,但在连接建立后提供的可见性不够。更现代的安全远程访问(SRA)解决方案包括监督功能,允许更大的控制和问责。受监督的访问、即时访问、会话记录和详细的会话日志记录显著降低了风险,并有助于满足合规性要求。

这些措施共同加强了数字和物理系统的安全性,这些系统使数据中心和其中的AI基础设施能够在24小时内平稳运行。

保护AI的工业心跳

随着AI越来越深入地嵌入企业、政府和关键服务的运营中,其底层基础设施的可靠性变得具有新的战略重要性。数据中心运营商必须优先考虑基于身份的访问控制和现代的OT安全实践,否则将面临重大运营中断的风险。

通过保护使设施运行的物理系统——冷却器、涡轮机、变电站和机械控制系统——以及保护用于维护和服务它们的远程连接,运营商可以确保AI仍然是创新加速器,而不是新的漏洞点。

Almog Apirion 是 Cyolo 的 CEO 和联合创始人。他是一位经验丰富的技术高管,曾是一名 "恢复中的 CISO",也是以色列海军网络单位的创始人。Almog 有着长期领导网络安全和 IT 技术领域的历史,他的背景包括在大型组织中建设和保护关键基础设施,以及带领团队走向成功。