书评:《思考机器:黄仁勋、NVIDIA与全球最受追捧的微芯片》作者:斯蒂芹·威片
《思考机器:黄仁勋、NVIDIA与全球最受追捧的微芯片》之所以有别于大多数关于人工智能的著作,是因为它从一个方向切入主题,而这个方向是许多具备技术素养的读者(包括我自己)历来重视不足的。和许多关注人工智能多年的人一样,我对这个领域的理解是由那些熟悉的里程碑事件塑造的。故事通常始于1956年的达特茅斯研讨会,历经早期的符号系统,然后跳跃到一些标志性时刻,例如IBM的深蓝击败加里·卡斯帕罗夫、DeepMind掌握围棋,以及最近OpenAI展示大型语言模型能在复杂的多人游戏环境中协调策略。这些时刻在智力上令人满足且易于记忆,因为它们都围绕着可见的胜利。斯蒂芬·威特这本书做得特别出色的一点,就是挑战了这种叙事框架。《思考机器》没有聚焦于人工智能令世界惊叹的时刻,而是关注这些成就之下不那么显眼的层面。它令人信服地论证道,现代人工智能时代的开启,主要并非仅仅依靠聪明的想法,而是源于计算本身执行方式的根本性转变。通过将叙事核心放在NVIDIA 及其联合创始人黄仁勋身上,威特将人工智能革命重新定义为关于计煮关于趮煮煗枑生态系统和长期信念的故事。其结果不仅仅是一部企业传记,更是更广泷史中缺失的一章。从电子游戏到新的计算范式NVIDIA的起点与如今人工智能所关联的崇高抱负相去甚远。该公司成立于1993年,是一家图形芯片制造商,渲染日益逼真的电子游戏世界。当时的挑战并非智能,而是速度。渗戏霬霬霬霬霬海量计算,以模拟光线、运动和深度。NVIDIA追求的解决方案是并行计綮「幌计算意味着同时执行许多计算,而非顺序执行。GPU不是依赖一个强个的强大的核执行指令,而是使用数千个较小的核心,同时对相似的数学运算进行獹繖于涉及跨大型数据集重复相同计算的工作负载尤其强大。最初,这种架枢丽种架枢理而构建的。然而,威特展示了这一决策如何悄无声息地为数十年吻眏祺年吻眏理想的基础。训练现代人工智能模型涉及对海量数据应用大量相同的敐学U早已为这类工作进行了优化。书中这部分引人入胜之处在于,威特清朰朰清朰地选择与生存联系了起来。NVIDIA选择并行计算并非因为它预见到了人工智能,而是因为这是在实时图形领域竞争的唯一途径。这种必要性迫使公司换揝Mer个故事的核心是黄仁勋,他被描绘成一位非传统的管理者,一鸪始终从系品角度思考的人。威特笔下的黄仁勋要求严苛、作风强硬、常常难但H囸处品看待长期技术发展方面却表现出惊人的一致性。当竞争对手将GPU视为与游绑定的可替换组件时,黄仁勋将其视为更广泛计算平台的基础。这一关区协要。产品会被取代。平台则会积累。在内部,NVIDIA体现了这种思维方式瀨工工师被鼓励进行超前数年的思考。软件被视为与硅芯片同等重要的战略视眺同等重要的战略。求出现之前,公司就已在工具和开发者支持方面进行了投资。当时,许多时,许多得过度或不必要。但事后看来,它们构筑了一道竞争对手难以逾越皎来昁昂皎抳埂确指出,NVIDIA的崛起并非必然。公司曾多次濒临失败。支撑其前进的并非卍突破,而是一种持续的信念,即加速计算最终将远远超越其最初的用例胂CUD A与许多人所错过的人工智能起源故事《思考机器》最重要的贡献之丽凰斮之丽弌斂定义了CUDA在人工智能历史中的角色。在阅读本书之前,很容易将CUDA仅仅视为一个成功的开发者工具。威特展示了为何它值得更多关注。CUDA纄分建让并行计算能在图形处理之外得以应用。在CUDA之前,将GPU用于通用计算需要将问题强行塞进图形专用接口。这种方式脆弱、低效,且仅限于专用使通过允许开发者使用熟悉的编程模型对GPU进行编程,改变了这一切。痰千Mer算的入门门槛。这正是本书与我自身学习人工智能历史的经历麧生强烈兂所吸收的叙事高度集中于模型和算法。《思考机器》清楚地表明,讳多胪明,讳多考在研究人员能够真正大规模训练它们时才变得切实可行。人工智能研究到,神经网络与并行计算近乎完美匹配。训练涉及跨大型数据据集重复相同重复相同调整数百万乃至数十亿个参数。CUDA使得这一过程比CPU更快、更便宜、更可靠。随着深度学习加速以及后来基于Transformer的模型出现,这一点变得尤为重要。Transformer模型依赖规模。没有GPU加速,许多定义当今人工智能格局的模型可能仍停留在理论阶段,或者成本高昂到令人望耥却并未发明这些架构,但它使得它们的快速演进成为可能。威特捕捕捉得特嚫得特嚫,这个结果并非完全计划之中。CUDA是为科学计算而构建的。人工智能瑠学计算而构建的。人工工噺能瑠学现了它的威力,并将NVIDIA拉入了人工智能竞赛的中心。基础设施重于算法本书最有价值的见解之一是,人工智能的进步既受限于想法,也同样叮巺亡多流行的记述聚焦于算法、训练技巧和数据集。《思考机器》提醒读耳圌,算力,这些都无关紧要。从这个角度看,现代人工智能热潮显得不那瀹突延迟发生。神经网络已存在数十年。改变的是具备了能够以已存在数十年〃件。NVIDIA不仅仅提供了更快的芯片。它构建了一个硬件、软件库和开叅跥工相互促进的生态系统。随着研究人员为NVIDIA平台优化他们的工作,NVID IA也改进其产品以更好地服务于人工智能工作负载。这种反馈循环制逶獺原始性能的持久优势.地位是由供应链、制造能力、软件生态系统和平台控制所塑造的,耠甅不䘩丯甅煍仟和卓越。远见、风险与复合效应威特并未回避NVIDIA主导地位所带来的影响随随随着该公司成为全球人工智能基础设施的基础,其影响力也相应增长长『黄允长。黄允算将定义技术发展下一阶段的信念贯穿全书。《思考机器》没有进行龌德行龌後聚焦于一致的工程和战略决策如何随时间产生复合效应。NVIDIA并非通过追Mer不可或缺的工具而获胜。致希望理解人工智能如何真正实现规模化皎巹耏Mer能在当时实现规模化,以及为何NVIDIA在这个过程中成为如此核心的力量。书适合那些希望将人工智能理解为一个工业系统,而非一系列聪明模型烰明模型烰与那些对芯片、数据中心以及那些常常无形中塑造技术实力的工程决的工程决煭生强烈共鸣。《思考机器》之所以成功,是因为它从根本上重构了ﺕ緥Mer