人工智能
Lumai 推出光学 AI 服务器,引领下一代推理时代

Lumai 宣布了一项重大突破:一种能够实时运行十亿参数大型语言模型的光学计算系统。该系统被称为 Iris Nova,标志着人工智能基础设施从传统的硅基处理向光学处理的转变。
该宣布是在人工智能行业迅速从模型训练转向大规模部署的时期,现有的计算基础设施面临着前所未有的压力。
超越硅基限制
多年来,人工智能的进步在很大程度上依赖于硅芯片的进步,特别是 GPU。但是,这种模式开始显示出紧张的迹象。功耗迅速增加,性能的提高变得越来越困难,而不增加显著的成本和能耗。
Lumai 的方法用光子取代了电子。其系统使用光来处理数据,而不是通过电信号进行计算。这使得大规模并行成为可能,数百万个操作可以同时在三维空间中进行,而不是在平面的硅表面上。
根据公司的说法,这种架构可以提供显著更高的吞吐量,同时将能耗降低多达 90%,相比传统系统。
数据中心日益增长的压力
此次发布反映了更广泛的行业挑战。人工智能工作负载正在迅速扩展,特别是在 推理 阶段,这涉及在实际应用中运行训练好的模型。
数据中心的电力供应日益受到限制。预计全球数据中心的能耗将在十年末 翻倍,迫使运营商探索非传统解决方案,例如专用发电和替代能源源。
同时,传统硬件的扩展变得效率较低。每一代新的硅芯片都提供了增量式的改进,但往往需要不成比例地更多的能量和冷却。
Lumai 将光学计算定位为一种绕过这些限制的方法,而不是逐步改进它们。
Iris Nova 的工作原理
Iris Nova 系统采用混合架构,结合光学和数字组件。光学引擎处理人工智能模型的核心数学运算,而传统的数字系统管理软件和控制功能。
这种设计允许系统在不需要完全更改基础设施的情况下集成到现有的数据中心环境中。
系统在“预填充”阶段尤其优化,在此阶段,模型处理大量输入数据,然后生成响应。通过加速这一阶段,系统旨在提高整体吞吐量和效率。
Lumai 报告称,Iris Nova 可以实时运行 Llama 8B 和 70B 模型,表明它能够处理生产级工作负载,而不仅仅是实验用例。
向推理时代转变
此次发布反映了人工智能优先事项的更广泛转变。虽然训练越来越大的模型一直占据着头条,但人工智能的实际影响现在正被推理定义——即这些模型可以多么高效地部署和扩展。
这种转变暴露了在训练阶段不太明显的瓶颈。推理工作负载是连续的、延迟敏感的和能耗密集的,使得效率成为一个关键因素。
Lumai 的系统专门为这一阶段设计,关注每瓦特的吞吐量,而不仅仅是原始计算能力。
早期访问和行业影响
Iris Nova 服务器 现已可供超大规模企业、企业和研究机构进行评估。Iris 系列中的其他系统,包括 Aura 和 Tetra,预计将在未来推出,扩展性能和部署选项。
如果 光学计算 能够在规模上兑现其承诺,它可能会重塑人工智能基础设施的经济。降低能耗和提高效率不仅可以降低运营成本,还可以解决人工智能日益增长的环境影响问题。
虽然尚不清楚该技术将被多快采用,但 Lumai 的 宣布 突出了一个明确的方向:人工智能计算的未来可能不仅仅建立在硅上。












