存根 Cerebras CS-1 系统集成到 Lassen 超级计算机 - Unite.AI
关注我们.

量子计算

Cerebras CS-1 系统集成到 Lassen 超级计算机中

发布时间

 on

一项新的案例研究由 大脑 在合作伙伴关系 劳伦斯利弗莫尔国家实验室 (LLNL) 详细介绍了如何将 Cerebras CS-1 系统集成到 LLNL 的 Lassen 超级计算机中,以实现核聚变模拟的进步。 

LLNL 是位于加利福尼亚州利弗莫尔的联邦研究机构,主要由美国能源部国家核安全管理局 (NNSA) 资助。 LLNL 表示,其使命是通过开发和应用世界一流的科学、技术和工程来加强美国的安全。 

该实验室拥有国家点火装置(NIF),利用世界上最强大的激光进行核聚变研究。 尽管如此,一些主要障碍包括昂贵且耗时的惯性约束实验,因此实验室在拉森超级计算机上使用名为 HYDRA 的多物理软件包进行模拟实验。 HYDRA 模型通过 NIF 的真实数据进行验证,这使得模型能够更准确地预测真实实验的结果。 

HYDRA 的一部分模拟原子动力学和辐射,这部分称为 CRETIN。 它预测原子在特定条件下的行为,CRETIN 可以代表 HYDRA 总计算负载的百分之几十。

通过用深度神经网络模型 (DNN) 或 CRETIN 替代物替换 CRETIN,LLNL 研究人员可以降低计算强度。 

Cerebras CS-1 系统

LLNL 选择 Cerebras CS-1 系统来执行其 CRETIN 代理推理。 该系统与拉森超级计算机集成,安装时间不到20小时。 Cerebras 技术人员还安装了“冷却壳”以及机械支撑导轨和硬件。 

机器学习软件工程师与 LLNL 同事合作编写了一个 C++ API,允许 HYDRA 代码调用 CRETIN 代理模型。该模型依靠自动编码器将输入数据压缩为较低维的表示形式,然后由使用 DJINN(一种新颖的深度神经网络算法)构建的预测模型进行处理。该算法会自动为给定数据选择合适的神经网络架构,并且不需要用户手动调整设置。

案例研究的结果

早期结果表明,Lassen 系统与 Cerebras 加速器的结合非常高效。 通过将 CS-1 系统插入 Lassen 的 InfiniBand 网络,CS-1.2 系统可以获得每秒 1 太比特的带宽。

由于其 19GB SRAM 内存与 400,000 个 AI 计算核心相结合,CS-1 系统能够并行运行相对紧凑的 DNN 模型的许多实例。 通过带宽和马力的结合,HYDRA 能够每秒对 18 万个样本进行推理。 

所有这一切意味着 LLNL 现在可以运行以前用 Cerebras 系统在计算上难以处理的实验,并且只涉及简单的集成和一小部分成本。 

该研究现在的重点是引导模拟并在模拟运行时提供对模拟的深入了解,这使得研究人员能够在模拟运行不佳时监控并停止运行。 每次运行的结果都会成为模型训练集的一部分,因此可以持续训练。 可以创建一个“主动学习”模型,它可以通过为下一个实验选择参数和初始边界条件来优化未来的运行。  

Alex McFarland 是一位人工智能记者和作家,致力于探索人工智能的最新发展。他与全球众多人工智能初创公司和出版物合作。