访谈
Phillip Burr,Lumai 产品负责人 – 采访系列

Phillip Burr 是 Lumai 的产品负责人,拥有超过 25 年的全球产品管理、上市和领导经验,曾在领先的半导体和技术公司担任过多个职位,并拥有成功打造和扩展产品和服务的经验。
Lumai 是一家位于英国的深科技公司,正在开发 3D 光学计算处理器,以加速人工智能工作负载。通过使用三维光束进行矩阵向量乘法,Lumai 的技术相比传统的基于硅的加速器提供了最高 50 倍的性能和 90% 的功耗降低。这使得它特别适合人工智能推理任务,包括大型语言模型,同时显著降低了能耗和环境影响。
是什么启发了 Lumai 的创立,它的想法是如何从牛津大学的研究演变成了一家商业公司的?
最初的火花是在 Lumai 的创始人之一 Dr. Xianxin Guo 获得牛津大学 1851 研究奖学金时点燃的。采访者们了解了光学计算的潜力,并询问 Xianxin 是否会考虑专利和创业,如果他的研究成功的话。这激发了 Xianxin 的创造力,当他和 Lumai 的另一位联合创始人 Dr. James Spall 证明了使用光来执行人工智能核心计算可以大幅提高人工智能性能和降低能耗时,他们知道他们可以创建一个客户想要的产品。他们将这个想法带给了一些风险投资者,后者支持他们成立了 Lumai。Lumai最近完成了第二轮融资,筹集了超过1000万美元,并吸引了新的投资者,他们也相信光学计算可以继续扩展和满足日益增长的人工智能性能需求,而不增加功耗。
您拥有令人印象深刻的职业生涯,曾在 Arm、indie Semiconductor 等公司任职——是什么吸引您在这个阶段加入 Lumai?
简短的答案是团队和技术。Lumai 拥有一个令人印象深刻的光学、机器学习和数据中心专家团队,汇集了来自 Meta、Intel、Altera、Maxeler、Seagate 和 IBM(以及我在 Arm、indie、Mentor Graphics 和 Motorola 的经验)。我知道一个由如此多杰出的人才组成的团队,专注于解决人工智能推理成本的大幅降低,可以做出令人惊叹的事情。
我坚信人工智能的未来需要新的、创新的计算突破。能够提供 50 倍的人工智能计算性能和将人工智能推理成本降低到目前解决方案的 1/10 的承诺,对我来说是一个不能错过的机会。
您的创始团队在从研究突破到产品就绪公司的过程中面临的一些早期技术或商业挑战是什么?
研究突破证明了光学可以用于快速、高效的矩阵向量乘法。尽管取得了技术突破,但最大的挑战是说服人们 Lumai 可以在其他光学计算初创公司失败的地方成功。我们不得不花时间解释 Lumai 的方法与众不同,我们使用 3D 光学来达到规模和效率的水平,而不是依赖单个 2D 芯片。从实验室研究到可以在数据中心大规模部署的技术,需要很多步骤。我们很早就认识到成功的关键是吸引有在高体积和数据中心开发产品经验的工程师。另一个领域是软件——对于 Lumai 的处理器,标准的人工智能框架和模型必须能够受益,并且我们必须提供工具和框架,使其对人工智能软件工程师来说尽可能无缝。
Lumai 的技术被称为使用 3D 光学矩阵向量乘法。您能用简单的语言解释一下吗?
人工智能系统需要执行大量的数学计算,称为矩阵向量乘法。这些计算是人工智能响应的引擎。Lumai 使用光而不是电来执行此操作。以下是其工作原理:
- 我们将信息编码到光束中
- 这些光束通过 3D 空间传播
- 光与镜头和特殊材料相互作用
- 这些相互作用完成数学运算
通过使用空间的三个维度,我们可以用每个光束处理更多信息。这使我们的方法非常高效——降低了运行人工智能系统所需的能量、时间和成本。
光学计算相比传统的基于硅的 GPU 和光子学有什么主要优势?
由于硅技术的进步速度已经大大放缓,每一步提高硅只 AI 处理器(如 GPU)的性能都会导致功耗大幅增加。硅只解决方案消耗大量功耗,并且变得非常复杂和昂贵。使用光学的优势在于,一旦进入光学领域,几乎没有功耗。能量用于进入光学领域,但例如,在 Lumai 的处理器中,我们可以在每个光束的每个周期内执行超过 1,000 次计算操作,使其非常高效。这种可扩展性无法使用集成光子学来实现,因为它受到物理尺寸约束和信号噪声的限制,硅光子解决方案的计算操作数量仅为 Lumai 当前的 1/8。
Lumai 的处理器如何实现近零延迟推理,以及为什么这是现代人工智能工作负载的关键因素?
虽然我们不会声称 Lumai 处理器提供零延迟,但它可以在单个周期内执行一个非常大的(1024 x 1024)矩阵向量操作。硅只解决方案通常将矩阵分成较小的矩阵,逐步处理,然后将结果组合起来。这需要时间,并且需要更多内存和能量。降低人工智能处理的时间、能量和成本对于使更多企业能够从人工智能中受益以及以最可持续的方式实现高级人工智能至关重要。
您能否带我们了解一下您的 PCIe 兼容形态如何与现有的数据中心基础设施集成?
Lumai 处理器使用 PCIe 卡和标准 CPU,均位于标准 4U 机架中。我们正在与多家数据中心机架设备供应商合作,以便 Lumai 处理器与他们的设备集成。我们使用标准网络接口、标准软件等,因此从外部来看,Lumai 处理器看起来就像数据中心中的任何其他处理器一样。
数据中心的能耗是一个日益增长的全球问题。Lumai 如何将自己定位为人工智能计算的可持续解决方案?
数据中心的能耗正在以惊人的速度增长。根据劳伦斯伯克利国家实验室的一份报告,美国的数据中心电力消耗预计到 2028 年将增加两倍,占该国电力的 12%。一些数据中心运营商正在考虑安装核电站来提供所需的能量。该行业需要探索人工智能的不同方法,我们相信光学是解决这一能耗危机的答案。
您能否解释一下 Lumai 的架构如何避免当前硅和光子方法的可扩展性瓶颈?
Lumai 处理器的初始性能只是我们可以实现的开始。我们预计我们的解决方案将继续提供巨大的性能提升:通过增加光学时钟速度和向量宽度,所有这些都不会增加能耗。没有其他解决方案可以实现这一点。标准的数字硅只方法将继续消耗更多的能量和成本来提高性能。硅光子学无法实现所需的向量宽度,因此,曾经考虑集成光子学用于数据中心计算的公司已经转向解决数据中心的其他部分,例如光学互联或光学交换。
您认为光学计算在人工智能的未来以及整个计算领域将发挥什么作用?
光学作为一个整体,将在未来数据中心中发挥巨大的作用——从光学互联、光学网络、光学交换到光学人工智能处理。人工智能对数据中心的需求是推动这一转向光学的关键驱动因素。光学互联将实现人工智能处理器之间更快的连接,这对于大型人工智能模型至关重要。光学交换将实现更高效的网络,而光学计算将实现更快、更节能、更低成本的人工智能处理。集体而言,它们将有助于实现更先进的人工智能,克服硅在计算侧的缩放放缓和铜在互联侧的速度限制的挑战。感谢这次精彩的采访,希望了解更多的读者可以访问 Lumai。












