Connect with us

思想领袖

即将到来的 AI 基础设施转变:硅光子技术的可编程性

mm

当整个世界都越来越迷恋 AI 和其应用时,存在一些非常真实的障碍,阻碍了其完全成功。例如,AI 数据中心基础设施面临着显著的可靠性挑战、性能瓶颈和日益增长的功耗限制,这些限制了 AI 系统在实践中的扩展程度。确实,AI 的不断变化的工作负载需要进入 OCS 开发的下一个阶段——可编程硅光子 OCS,这使得网络的灵活性达到前所未有的水平。

我们如何走到这里:OCS 发展的历史

光学电路交换(OCS)源自 19 世纪末和 20 世纪初的电话历史,当时语音通信依赖于电路交换——物理交换电缆以建立两个方之间的电话连接。1960 年代引入了分组交换,这是一种更好地利用共享基础设施的方式。它涉及将数据分成小的“分组”,以便多个传输可以通过任何路由网络传输。在 1970 年代,这些分组被进一步定义,以便在异构系统中进行寻址、路由和传递。1980 年代,这个定义——传输控制协议/互联网协议(TCP/IP)——成为互联网标准,允许以前不兼容的网络在共同框架下进行通信。随着 1990 年代网络和可扩展性需求的增长,引入了电气分组交换(EPS)。结合 TCP/IP,EPS 支撑了互联网的增长,并将数百万用户连接到全球。同时,光纤开始在全球网络中取代铜缆,提供更高的容量、更长的距离和支持多特比特速度的能力。

动态 AI 环境

但到 21 世纪初,AI 工作负载对当前的电子网络造成了巨大的压力,促使开发了第一个商业化的 MEMS 基础光学电路交换(OCS)数据中心架构。光学 MEMS 开关是全光开关设备,使用微小的可移动镜子在输入和输出光纤之间重定向光,而无需将信号转换为电信号。这些 MEMS 基础 OCS 支持大型端口数,这对于光连接远程服务器以克服数据中心中的铜缆限制是理想的。然而,重新配置速度、每端口成本和形状因素的限制已经变得明显。这些限制阻止了 MEMS 基础 OCS 解决网络实时重新配置的需求,特别是在数据中心计算引擎的核心——规模网络中——尤其是在面对 AI 工作负载时。

确实,今天,MEMS 基础 OCS 和 AI 数据中心的限制变得更加明显,多亏了 AI 每年或每六个月——如果不是每个季度——引入的巨大、非线性和不可预测的变化。AI 数据中心生态系统参与者现在被要求快速适应和应对不断变化的 AI 景观。网络设计师被迫重新配置或重新编程他们的 AI 数据中心网络,以便在网络中规避问题或管理新的 AI 工作负载,需要优化性能。

可编程硅光子技术:超越“冻结”网络

可编程 硅光子(SiPh)OCS 是 OCS 发展的下一步。低成本、紧凑、由软件驱动,这些光子芯片可以瞬间重新编程,以适应网络的实时重新配置。与 MEMS 相比,可编程 SiPh OCS 是固态技术,这消除了许多可靠性风险,因为没有移动部件。固态、CMOS 兼容技术还意味着它可以匹配最佳 GPU 集群目标成本——每根辐射线 100 美元。

可编程 SiPh OCS 以两种关键方式增强 AI 数据中心架构。首先,它使得 GPU 互连的快速重新配置成为可能,因此工作负载可以更高效地执行并更快地完成。随着 AI 训练的演变,通信拓扑必须动态地改变——甚至在训练作业内——而无需数据包丢失。这需要极快的重新配置时间,这是 SiPh OCS 可扩展性的一个基本优势,支持比 MEMS 技术快几个数量级的重新配置和转换时间。

其次,SiPh OCS 的可编程性允许直接将其他功能集成到交换结构中,而无需扩大形状因素。例如,通过 SiGe 集成光探测器的实时遥测和链路放大可以被纳入,以提高可观察性和增强故障恢复能力。虽然 MEMS 基础 OCS 通常引入 2-3 dB 的光损失,但 SiPh OCS 实现可以被设计为有效地无损,这提高了整个系统的灵活性和效率。

展望未来

由于历史上的数据中心网络是僵化的,无法跟上 AI 数据中心不断变化的需求,因此,可编程 SiPh 技术的市场呈现出数十亿美元的机会。随着这一巨大的增长而来的是,处于这一新技术核心的企业之间的合作和协作的需求。为此,存在一个 OCP 标准化机构——包括 Google、Microsoft、Lumentum 和其他创新者——旨在使使用 OCS 的网络管理器的软件接口尽可能标准化和易于使用。这些公司希望分享他们的观点并创建标准,以推动技术的发展并加速采用。

当 AI 驱动我们世界的演变时,AI 数据中心网络也必须演变并成为未来-proof,以支持它。可编程 SiPh OCS 使公司能够站在创新巅峰,实现新的和令人兴奋的机会,造福所有人,并创建标准以推动技术的发展和加速采用。nd 创建标准以推动技术的发展和加速采用。随着 AI 驱动我们世界的演变,AI 数据中心网络也必须演变并成为未来-proof,以支持它。可编程 SiPh OCS 使公司能够站在创新巅峰,实现新的和令人兴奋的机会,造福所有人。

Christian Dupont 是 iPronics 的 CEO,在那里他为公司在 AI 数据中心的光开关领域筹集了数千万美元。作为一名具有杰出职业生涯的 EPFL 工程师,Dupont 先生曾在 Texas Instruments 担任高管职务,并在光 MEMS 领域担任 Varioptic 和 PoLight 的 CEO,后来又担任 CEO-CF、Dolphin Integration 和 Riber 的 CEO。