书评:《思考机器:黄仁勋、NVIDIA与全球最受追捧的微芯片》作者:斯蒂芬·威特
《思考机器:黄仁勋、NVIDIA与全球最受追捧的微芯片》之所以有别于大多数关于人工智能的著作,是因为它从一个方向切入主题,而这个方向是许多具备技术素养的读者(包括我自己)历来重视不足的。和许多关注人工智能多年的人一样,我对这个领域的理解是由那些熟悉的里程碑事件塑造的。故事通常始于1956年的达特茅斯研讨会,历经早期的符号系统,然后跳跃到一些标志性时刻,例如IBM的深蓝击败加里·卡斯帕罗夫、DeepMind掌握围棋,以及最近OpenAI展示大型语言模型能在复杂的多人游戏环境中协调策略。这些时刻在智力上令人满足且易于记忆,因为它们都围绕着可见的胜利。斯蒂芬·威特这本书做得特别出色的一点,就是挑战了这种叙事框架。《思考机器》没有聚焦于人工智能令世界惊叹的时刻,而是关注这些成就之下不那么显眼的层面。它令人信服地论证道,现代人工智能时代的开启,主要并非仅仅依靠聪明的想法,而是源于计算本身执行方式的根本性转变。通过将叙事核心放在NVIDIA 及其联合创始人黄仁勋身上,威特将人工智能革命重新定义为关于计算架构、开发者生态系统和长期信念的故事。其结果不仅仅是一部企业传记,更是更广泛人工智能历史中缺失的一章。从电子游戏到新的计算范式NVIDIA的起点与如今人工智能所关联的崇高抱负相去甚远。该公司成立于1993年,是一家图形芯片制造商,专注于渲染日益逼真的电子游戏世界。当时的挑战并非智能,而是速度。游戏需要瞬间执行海量计算,以模拟光线、运动和深度。NVIDIA追求的解决方案是并行计算。并行计算意味着同时执行许多计算,而非顺序执行。GPU不是依赖一个强大的核心逐个执行指令,而是使用数千个较小的核心,同时对相似的数学运算进行处理。这种方法对于涉及跨大型数据集重复相同计算的工作负载尤其强大。最初,这种架构是为图形处理而构建的。然而,威特展示了这一决策如何悄无声息地为数十年后的神经网络奠定了理想的基础。训练现代人工智能模型涉及对海量数据应用大量相同的数学运算。GPU早已为这类工作进行了优化。书中这部分引人入胜之处在于,威特清晰地将技术设计选择与生存联系了起来。NVIDIA选择并行计算并非因为它预见到了人工智能,而是因为这是在实时图形领域竞争的唯一途径。这种必要性迫使公司掌握了一种后来被证明远超越游戏领域、具有变革性的计算模型。黄仁勋与系统思维,而非产品思维这个故事的核心是黄仁勋,他被描绘成一位非传统的管理者,一个始终从系统而非单个产品角度思考的人。威特笔下的黄仁勋要求严苛、作风强硬、常常难以相处,但在如何看待长期技术发展方面却表现出惊人的一致性。当竞争对手将GPU视为与游戏周期绑定的可替换组件时,黄仁勋将其视为更广泛计算平台的基础。这一区别变得至关重要。产品会被取代。平台则会积累。在内部,NVIDIA体现了这种思维方式。工程师被鼓励进行超前数年的思考。软件被视为与硅芯片同等重要的战略资产。在明确需求出现之前,公司就已在工具和开发者支持方面进行了投资。当时,许多这样的选择显得过度或不必要。但事后看来,它们构筑了一道竞争对手难以逾越的护城河。威特明确指出,NVIDIA的崛起并非必然。公司曾多次濒临失败。支撑其前进的并非单一突破,而是一种持续的信念,即加速计算最终将远远超越其最初的用例范围。CUDA与许多人所错过的人工智能起源故事《思考机器》最重要的贡献之一,是它如何重新定义了CUDA在人工智能历史中的角色。在阅读本书之前,很容易将CUDA仅仅视为一个成功的开发者工具。威特展示了为何它值得更多关注。CUDA的创建是为了让并行计算能在图形处理之外得以应用。在CUDA之前,将GPU用于通用计算需要将问题强行塞进图形专用接口。这种方式脆弱、低效,且仅限于专家使用。CUDA通过允许开发者使用熟悉的编程模型对GPU进行编程,改变了这一切。数千个计算核心作为一种通用资源变得可访问。这在当时很少有人充分认识到,它降低了高性能计算的入门门槛。这正是本书与我自身学习人工智能历史的经历产生强烈共鸣之处。我所吸收的叙事高度集中于模型和算法。《思考机器》清楚地表明,许多这些想法只有在研究人员能够真正大规模训练它们时才变得切实可行。人工智能研究人员很快认识到,神经网络与并行计算近乎完美匹配。训练涉及跨大型数据集重复相同操作,随时间调整数百万乃至数十亿个参数。CUDA使得这一过程比CPU更快、更便宜、更可靠。随着深度学习加速以及后来基于Transformer的模型出现,这一点变得尤为重要。Transformer模型依赖规模。没有GPU加速,许多定义当今人工智能格局的模型可能仍停留在理论阶段,或者成本高昂到令人望而却步。CUDA并未发明这些架构,但它使得它们的快速演进成为可能。威特捕捉得特别好的一点是,这个结果并非完全计划之中。CUDA是为科学计算而构建的。人工智能研究人员发现了它的威力,并将NVIDIA拉入了人工智能竞赛的中心。基础设施重于算法本书最有价值的见解之一是,人工智能的进步既受限于想法,也同样受限于基础设施。许多流行的记述聚焦于算法、训练技巧和数据集。《思考机器》提醒读者,没有足够的算力,这些都无关紧要。从这个角度看,现代人工智能热潮显得不那么突然,而更像是延迟发生。神经网络已存在数十年。改变的是具备了能够以有意义规模训练它们的硬件。NVIDIA不仅仅提供了更快的芯片。它构建了一个硬件、软件库和开发者工具相互促进的生态系统。随着研究人员为NVIDIA平台优化他们的工作,NVIDIA也改进其产品以更好地服务于人工智能工作负载。这种反馈循环创造了一种超越原始性能的持久优势。本书悄然强调了一个在今天日益明显的事实:人工智能的领导地位是由供应链、制造能力、软件生态系统和平台控制所塑造的,而不仅仅是研究上的卓越。远见、风险与复合效应威特并未回避NVIDIA主导地位所带来的影响。随着该公司成为全球人工智能基础设施的基础,其影响力也相应增长。黄仁勋关于加速计算将定义技术发展下一阶段的信念贯穿全书。《思考机器》没有进行道德说教,而是聚焦于一致的工程和战略决策如何随时间产生复合效应。NVIDIA并非通过追逐潮流而获胜。它通过早期投身并行计算、经受反复的市场周期、并持续投资于使其硬件不可或缺的工具而获胜。致希望理解人工智能如何真正实现规模化的读者对于已经了解人工智能历史头条事件的读者,本书填补了其下的缺失层面。它解释了为何那些突破能在当时实现规模化,以及为何NVIDIA在这个过程中成为如此核心的力量。这本书适合那些希望将人工智能理解为一个工业系统,而非一系列聪明模型的读者。它将与那些对芯片、数据中心以及那些常常无形中塑造技术实力的工程决策感兴趣的读者产生强烈共鸣。《思考机器》之所以成功,是因为它从根本上重构了人工智能的故事,展示了并行计算、开发者平台和长期愿景如何构建了现代人工智能如今所立足的基础。