关注我们.

人工智能

Enfabrica 推出基于以太网的内存结构,可大规模重新定义 AI 推理

mm

发布时间

 on

恩法布里卡总部位于硅谷、由英伟达 (Nvidia) 支持的初创公司 EMFASYS 发布了一款突破性产品,该产品或将显著重塑大规模 AI 工作负载的部署和扩展方式。该公司全新推出的弹性内存结构系统 (EMFASYS) 是首个基于以太网的商用内存结构,专为解决生成式 AI 推理的核心瓶颈——内存访问而设计。

在人工智能模型变得越来越复杂、具有情境感知能力和持久性(每个用户会话需要大量内存)的时代,EMFASYS 提供了一种将内存与计算分离的新方法,使人工智能数据中心能够显著提高性能、降低成本并提高其最昂贵资源的利用率:GPU。

什么是记忆织物?它为何重要?

传统上,数据中心内的内存与其所在的服务器或节点紧密绑定。每个 GPU 或 CPU 只能访问与其直接连接的高带宽内存——通常,GPU 为 HBM,CPU 为 DRAM。这种架构在工作负载较小且可预测时效果良好。但生成式 AI 改变了游戏规则。LLM 需要访问大型上下文窗口、用户历史记录和多智能体内存——所有这些都必须快速且无延迟地处理。这些内存需求通常超出本地内存的可用容量,从而造成瓶颈,导致 GPU 核心无法运行,并增加基础设施成本。

A 记忆面料 通过将内存转换为共享的分布式资源(一种网络附加内存池)来解决这个问题,集群中的任何 GPU 或 CPU 都可以访问这种内存池。可以将其视为在数据中心机架内创建一个“内存云”。无需跨服务器复制内存或使昂贵的 HBM 过载,Fabric 允许通过高速网络按需聚合、分解和访问内存。这使得 AI 推理工作负载能够更高效地扩展,而不受任何单个节点物理内存限制的束缚。

Enfabrica 的方法:以太网和 CXL 终于融合在一起

EMFASYS 通过结合两种强大的技术实现了这种机架规模的内存架构:以太网上的 RDMA 和 Compute Express Link(CXL)前者支持跨标准以太网的超低延迟、高吞吐量数据传输。后者允许将内存从 CPU 和 GPU 中分离出来,并集中到共享资源中,可通过高速 CXL 链路访问。

EMFASYS 的核心是 Enfabrica 的 ACF-S 芯片,这是一款 3.2 Tbps 的“超级网卡”,将网络和内存控制融合到单个设备中。该芯片允许服务器与分布在整个机架上的大量商用 DDR5 DRAM 池(每个节点高达 18 TB)进行连接。至关重要的是,它使用标准以太网端口实现连接,使运营商能够利用其现有的数据中心基础设施,而无需投资专有互连。

EMFASYS 尤其引人注目之处在于,它能够动态地将内存受限的工作负载从昂贵的 GPU 连接 HBM 迁移到价格低廉得多的 DRAM 上,同时保持微秒级的访问延迟。EMFASYS 背后的软件堆栈包含智能缓存和负载平衡机制,这些机制可以隐藏延迟并以对系统上运行的 LLM 透明的方式协调内存移动。

对人工智能行业的影响

这不仅仅是一个巧妙的硬件解决方案,它代表了人工智能基础设施构建和扩展方式的理念转变。随着生成式人工智能从新奇事物逐渐成为必需品,每天要处理数十亿用户查询,服务这些模型的成本对于许多公司来说已变得难以承受。GPU 的利用率往往不高,并非因为计算能力不足,而是因为它们闲置等待内存。EMFASYS 直接解决了这种不平衡问题。

Enfabrica 支持通过以太网访问的池化光纤连接内存,为数据中心运营商提供了一种可扩展的替代方案,无需不断购买更多 GPU 或 HBM。他们可以使用现成的 DRAM 和智能网络,以模块化方式增加内存容量,从而减少整体占用空间并提高 AI 推理的经济性。

其影响远不止于直接的成本节约。这种分解式架构为“内存即服务”模型铺平了道路,在这种模型中,上下文、历史记录和代理状态可以持久保存在单个会话或服务器之外,从而为更智能、更个性化的人工智能系统打开了大门。它还为更具弹性的人工智能云奠定了基础,在这种云中,工作负载可以弹性地分布在机架或整个数据中心,而不受严格的内存限制。

展望未来

Enfabrica的 EMFASYS 目前正在向部分客户进行样品测试,虽然该公司尚未透露这些合作伙伴是谁, 路透社报道 主要的AI云提供商已开始试用该系统。这使得Enfabrica不仅成为组件供应商,更将成为下一代AI基础设施的关键推动者。

通过将内存与计算分离并使其在高速商用以太网网络上可用,Enfabrica 为 AI 架构的新时代奠定了基础——在这个新时代,推理可以不受损害地扩展,资源不再滞留,部署大型语言模型的经济效益终于开始变得合理。

在一个日益由情境丰富的多智能体人工智能系统定义的世界里,记忆不再是配角,而是舞台。Enfabrica 坚信,谁能搭建出最好的舞台,谁就能决定未来几年人工智能的表现。

Antoine 是一位富有远见的领导者,也是 Unite.AI 的创始合伙人,他对塑造和推动人工智能和机器人技术的未来有着坚定不移的热情。作为一名连续创业者,他相信人工智能将像电力一样颠覆社会,并经常对颠覆性技术和 AGI 的潜力赞不绝口。

作为一个 未来学家他致力于探索这些创新将如何塑造我们的世界。此外,他还是 证券一个专注于投资重新定义未来和重塑整个行业的尖端技术的平台。