书评

书评:思维机器:黄仁勋、NVIDIA和世界上最抢手的微芯片

mm

思维机器:黄仁勋、NVIDIA和世界上最抢手的微芯片 与大多数关于人工智能的书籍不同,因为它从一个很多技术熟练的读者(包括我)以前经常忽视的角度来看待这个主题。

像很多跟踪人工智能多年的人一样,我对这个领域的理解是由熟悉的里程碑塑造的。这个故事通常从 1956 年的达特茅斯工作坊 开始,经过早期的符号系统,然后跳转到重要时刻,如 IBM 的 深蓝击败卡斯帕罗夫深思熟虑掌握围棋 ,以及最近 OpenAI 演示大型语言模型可以在复杂的多人环境中协调策略。这些时刻在智力上很令人满意,很容易记住,因为它们集中在可见的胜利上。

斯蒂芬·维特的书做得非常好的是挑战这种框架。与其关注人工智能给世界留下深刻印象的时刻, 思维机器 关注的是那些成就下面不太可见的层。它令人信服地认为,现代人工智能时代并不是主要由聪明的想法解锁的,而是计算本身的基本转变。

通过以 NVIDIA (NVDA -1.9%) 和其联合创始人黄仁勋为中心,维特将人工智能革命重构为一个关于计算架构、开发者生态系统和长期信念的故事。结果不仅是一部企业传记,也是人工智能历史上缺失的一章。

从视频游戏到新的计算范式

NVIDIA 的起点与现在与人工智能相关的宏伟目标相去甚远。该公司 于 1993 年出现 ,最初是一家图形芯片制造商,专注于渲染越来越逼真的视频游戏世界。当时的挑战不是智能,而是速度。游戏需要大量计算来模拟光、运动和深度。

NVIDIA 采用的解决方案是 并行计算 。并行计算意味着同时执行多个计算,而不是按顺序执行。与依赖单个强大的核心按顺序处理一个指令不同,GPU 使用成千上万个较小的核心同时处理类似的数学运算。这种方法对于涉及在大型数据集上重复相同计算的工作负载尤其强大。

最初,这种架构是为图形而设计的。然而,维特展示了这一决定如何在几十年后为神经网络创造了理想的基础。训练现代人工智能模型涉及在大量数据上应用大量相同的数学运算。GPU 已经针对这种工作进行了优化。

使这部分书如此引人入胜的是维特如何清晰地将技术设计选择与生存联系起来。NVIDIA 没有选择并行计算,因为它预见到了人工智能。它选择并行计算,因为这是在实时图形中竞争的唯一方法。这种必要性迫使该公司掌握一种后来被证明具有变革性的计算模型,远远超出了游戏领域。

黄仁勋和系统思维,而非产品思维

这个故事的中心人物是黄仁勋,他被描绘成一个不拘泥于传统的执行者,而是一个始终从系统角度思考的人。维特将黄仁勋描绘成一个要求高、强度大、往往很难相处的人,但他在看待技术的方式上却出奇地一致。

虽然竞争对手将 GPU 视为与游戏周期相关的可丢弃组件,但黄仁勋却将其视为更广泛的计算平台的基础。这种区别至关重要。产品会被取代。平台会积累价值。

在内部,NVIDIA 体现了这种思维方式。工程师被鼓励去思考未来几年。软件被视为与硅片一样具有战略重要性。工具和开发者支持的投资在需求明显之前就已经进行了。这些选择在当时看来过度或不必要,但它们创造了一个护城河,竞争对手难以跨越。

维特明确指出,NVIDIA 的崛起并非不可避免。该公司曾多次濒临失败。是什么让它继续前进的,不是某个突破性的创新,而是一种持续的信念,即加速计算最终将在其最初用途之外产生重要影响。

CUDA 和人工智能起源故事

《思维机器》的一个最重要贡献是,它重新定义了 CUDA 在人工智能历史中的地位。

在读这本书之前,很容易认为 CUDA 只是一个成功的开发者工具。维特展示了为什么它值得更多关注。CUDA 是为使并行计算在图形以外的领域可用而创建的。在 CUDA 之前,使用 GPU 进行通用计算需要将问题强制通过图形特定的接口。这很脆弱,效率低下,仅限于专家。

CUDA 改变了这一点,允许开发人员使用熟悉的编程模型来编程 GPU。成千上万个计算核心成为了一种通用资源。这降低了进入高性能计算的门槛,以一种在当时很少有人完全欣赏的方式。

这与我自己的经历产生了共鸣,我学习了人工智能的历史。吸收的叙述重点是模型和算法。《思维机器》阐明了这些想法如何在实际上变得可行,只有当研究人员能够在规模上训练它们时。

人工智能研究人员很快意识到,神经网络几乎是为并行计算而设计的。训练涉及在大量数据上重复相同的操作,随着时间的推移调整数百万或数十亿个参数。CUDA 允许这个过程比 CPU 快、便宜、更可靠地发生。

当深度学习加速和后来基于变换器的模型出现时,这尤其重要。变换器在规模上蓬勃发展。没有 GPU 加速,今天人工智能景观中定义的许多模型将仍然停留在理论阶段或成本过高。CUDA 没有发明这些架构,但它使它们的快速演变成为可能。

维特捕捉到了一个特别有趣的方面,即这种结果并不是完全计划好的。CUDA 是为科学计算而构建的。人工智能研究人员发现了它的力量,并将 NVIDIA 推到了人工智能竞争的中心。

基础设施优于算法

这本书最有价值的见解之一是,人工智能的进步受到基础设施的限制和想法的限制一样多。许多流行的描述都关注算法、训练技巧和数据集。《思维机器》提醒读者,没有足够的计算能力,这些都无关紧要。

从这个角度来看, 现代人工智能热潮 看起来不那么突然,更加延迟。神经网络已经存在了几十年。发生变化的是能够以有意义的规模训练它们的硬件的可用性。

NVIDIA 不仅提供了更快的芯片。它建立了一个由硬件、软件库和开发工具组成的生态系统,这些元素随着时间的推移相互强化。随着研究人员为 NVIDIA 平台优化他们的工作,NVIDIA 精炼了其产品以更好地服务于人工智能工作负载。这种反馈循环创建了一个持久的优势,这种优势远远超出了原始性能。

这本书低调地强调了一个日益明显的现实:人工智能领域的领导力是由供应链、制造能力、软件生态系统和平台控制决定的,而不仅仅是研究卓越。

愿景、风险和复合后果

维特没有回避 NVIDIA 主导地位的影响。随着该公司成为全球人工智能基础设施的基础,其影响力也随之增长。黄仁勋相信加速计算将定义下一代技术进步的信念贯穿整个书籍。

与其说教,不如说《思维机器》关注的是如何通过持续的工程和战略决策来实现复合效应。NVIDIA 没有通过追逐潮流来获胜。它通过早期致力于并行计算、忍受反复的市场周期、并无情地投资于使其硬件不可或缺的工具来获胜。

对于希望了解人工智能如何真正扩展的读者

对于已经知道人工智能历史的头条事件的读者来说,这本书填补了他们下面缺失的层。它解释了为什么这些突破能够在当时扩大规模,以及为什么NVIDIA在此过程中成为如此核心的力量。

这是一本书,适合那些希望将人工智能理解为一个工业系统,而不是一个聪明的模型集合的读者。它将与那些对芯片、数据中心以及经常看不见的工程决策感兴趣的人产生共鸣,这些决策在幕后塑造了技术力量。

思维机器 成功是因为它从底层重新构建了人工智能的故事,展示了如何通过并行计算、开发者平台和长期愿景构建了现代人工智能现在所站的基础。

安托万是一位具有远见的领导者和Unite.AI的创始合伙人,他被对塑造和推广AI和机器人人的未来充满不动摇的热情所驱动。作为一位连续创业者,他相信AI将对社会产生与电力一样的颠覆性影响,他经常被听到对颠覆性技术和AGI的潜力大加赞赏。

作为一位未来学家,他致力于探索这些创新将如何塑造我们的世界。另外,他也是Securities.io的创始人,这是一个专注于投资于重新定义未来和重塑整个行业的尖端技术的平台。