书评:斯蒂芬·拉伊马克尔斯的《大型语言模型》
作者 Antoine Tardif, Unite.AI 首席执行官兼创始人 作为麻省理工学院出版社必备知识系列的十五多卷书籍的拥有者,我以既有兴趣又有警惕的态度对待每一本新书的发布:该系列书籍通常提供深思熟虑、易于理解的概述——但并不总是以我期望的风格或深度呈现。然而,在斯蒂芬·拉伊马克尔斯的《大型语言模型》一书中,作者却做到了令人难以置信的事情:他写了一本内容丰富、信息量大、批判性平衡的书,这本书理所当然地跻身于我最推荐的AI书籍之列。*>]:pointer-events-auto scroll-mt-[calc(var(–header-height)+min(200px,max(70px,20svh)))]” dir=”auto” tabindex=”-1″ data-turn-id=”request-WEB:5be4fe75-da35-44b9-9e57-a44c1f4d527a-5″ data-testid=”conversation-turn-10″ data-scroll-anchor=”true” data-turn=”assistant”> 语言的重新构想:从人类艺术到计算 大型语言模型的一大优点是,它重新定义了“语言”的概念。与其仅仅关注哲学或文学观点,这本书将语言视为一种计算现象——一种结构、统计模式和生成潜力的系统,这些系统可以被现代神经网络利用。这种重新定义并非毫无根据:拉伊马克尔斯引导读者了解大规模神经网络如何在统计规律的基础上对文本进行编码、解析和生成。这种转变并不明显,但却很强大。通过这种计算视角,语言不再神秘或模糊,而是可以被机器建模的东西。这种框架使得LLM的工作原理变得清晰。拉伊马克尔斯展示了LLM如何近似语言:预测下一个标记,统计建模语法和语义,根据学习到的分布生成合理的语言输出。在其他words中——它们不像人类一样“思考”;它们计算,统计。对于许多读者来说——尤其是那些没有深厚的数学或认知科学背景的人——这种观点是明确和健康的。通过这种方式,这本书将LLM的神秘感转变为更为扎实和可理解的东西。从数据到行为:LLM如何学习——以及如何对齐在确定了语言的定义(计算)之后,这本书继续讨论模型的学习过程。拉伊马克尔斯以易于理解的方式解释了当代LLM的构建(深度神经网络、注意力机制、变换器风格的架构)以及它们如何从简单的模式匹配机器演变为更为对齐和可用的工具。人类反馈的使用是这种演变的关键部分,通过使用来自人类反馈的强化学习(RLHF)——一种技术,LLM的输出由人类评估或排名,然后模型被微调以偏爱更有用、更安全或与人类价值观一致的输出。书中对这种区别的阐述(隐含和明确)至关重要:区分了预训练阶段(在大量文本上学习统计规律)和对齐阶段(人类判断塑造模型的行为)。这种区别非常重要:预训练使LLM具有流畅性和通用知识;RLHF(或基于反馈的微调)引导它朝着理想的行为发展。通过这种方式,拉伊马克尔斯并没有回避复杂性或风险。他承认人类反馈和基于奖励的对齐是有缺陷的:反馈中的偏见、人类判断的不一致、过拟合到奖励模型、以及在新环境中的不可预测行为——所有这些都是合理的限制。通过拒绝理想化RLHF,这本书保持了可信度。LLM能做什么和不能做什么拉伊马克尔斯在阐述LLM的优势和局限性方面表现出色。从积极的方面来看:现代LLM具有惊人的多功能性。它们可以翻译语言、总结文本、生成代码、产生创造性写作、起草文章、回答问题,并在许多领域提供帮助——本质上,任何可以归结为“文本输入→文本输出”的任务。给予足够的规模和数据,它们的生成流畅性往往令人印象深刻,甚至令人惊讶。同时,这本书并没有回避它们的基本局限性。LLM仍然是统计模式匹配器,而不是真正的思考者:它们可以产生虚假信息、复制训练数据中的偏见和刻板印象,并在需要现实世界理解、常识推理或长期连贯性的情况下失败。拉伊马克尔斯对这些缺陷的处理是清醒的——不耸人听闻,而是现实的——强调了LLM的强大和局限性。这种平衡的方法是有价值的——它避免了炒作和悲观主义的陷阱。读者带着对LLM的清晰理解离开:知道它们擅长什么和不能做什么。机会和责任:社会承诺和风险许多技术入门书在讨论架构或用例后就停止了,而《大型语言模型》却更进一步——深入到社会、政治和伦理影响中。在《实践机会》和《社会风险和问题》等章节中,拉伊马克尔斯邀请读者思考LLM可能如何重塑创造力、生产力、人类交流、媒体和机构。从机会的角度来看:潜力是巨大的。LLM可以使写作、翻译、编程更加民主化。它们可以加速研究、教育和创造性表达。它们可以帮助那些在语言或写作方面挣扎的人。它们可以改变媒体的制作和消费方式。在一个面临大量信息过载的世界中,LLM可能有助于弥合差距——如果使用得当的话。但是拉伊马克尔斯并没有避开黑暗面。他提出了警告:关于虚假信息和“幻觉真相”,关于固有的偏见,关于人类判断力的侵蚀,关于对有缺陷的模型的过度依赖——所有这些风险都已在更广泛的AI伦理学中得到记录。通过这种方式,这本书不仅对工程师和研究人员有价值,也对政策制定者、教育工作者和任何有思想的公民都有价值。它将LLM根植于现实世界的背景中,而不是抽象的炒作。接下来会发生什么——以及警惕的呼唤最后一章《接下来会发生什么?》并没有假装当前的LLM是最后的话。相反,拉伊马克尔斯鼓励读者采取前瞻性视角:LLM如何演变?如何改进对齐、透明度、公平性?哪些治理、监管和设计原则将保护社会,当这些模型变得普遍时?对于我来说——作为必备知识目录中的一名深度参与者,意识到有些卷可能会令人失望——这本书理所当然地跻身于最好的书籍之列。它的清晰度、平衡性、技术基础和社会意识使其脱颖而出。它在易于理解的解释和严肃的批判之间取得了罕见的平衡。因此,我敦促所有构建、部署或与LLM交互的人——开发人员、组织、政策制定者和日常用户——要保持警惕、批判和明智的态度。要求透明度。推动多样化、代表性的训练数据。坚持严格的评估。质疑输出。不要把LLM当作神谕,而是把它们当作强大的工具——需要谨慎、责任感和人类判断力的工具。最终判决《大型语言模型》不仅仅是一本技术入门书——它是一本及时、敏锐、深思熟虑的指南,介绍了我们这个时代最有影响力的技术之一。它将易于理解的解释与清醒的反思、技术细节与社会意识相结合;对潜力的钦佩与对风险的谨慎态度。对于任何人——工程师、研究人员、学生、政策制定者、好奇的公民——寻求了解LLM是什么、它们能做什么和不能做什么,以及它们可能对我们的未来意味着什么——斯蒂芬·拉伊马克尔斯的《大型语言模型》是一本必读书籍。