关注我们.

书评

书评:《大型语言模型》,作者:Stephan Raaijmakers

mm

作为一个拥有超过十五卷本作品的人, 麻省理工学院出版社基础知识系列我对每一本新书都抱有兴趣和谨慎的态度:该系列丛书经常提供深思熟虑、易于理解的概述——但并不总是以我所期望的风格或深度呈现。

在案件 Stephan Raaijmakers 的大型语言模型然而,作者做到了一件难得的事情:写了一本条理清晰、内容丰富、批判性平衡的书,这本书跻身我最推荐的人工智能书籍之列。

语言的重新定义:从人类艺术到计算

其中最 大型语言模型的显著优势 这本书重新定义了“语言”。它并非仅仅着眼于哲学或文学视角,而是将语言视为一种…… 计算现象 ——现代神经网络架构可以利用的结构、统计模式和生成潜能系统。这种重新定义并非无端:拉伊马克尔斯引导读者了解大规模神经网络如何在底层基于海量文本数据集中的统计规律对文本进行编码、解析和生成——这是一种微妙而强大的转变,改变了读者对这些系统的理解。本书使读者能够轻松理解,从计算的角度来看,语言不再是神秘或晦涩难懂的东西,而是机器可以建模的对象。

这种框架揭示了语言学习模型(LLM)的运作原理。拉伊马克斯并没有将它们描绘成神秘的“意义理解者”,而是展示了它们如何近似地表达语言:预测下一个词元,对句法和语义进行统计建模,并基于学习到的分布重建合理的语言输出。换句话说——它们并非以人类的方式“思考”;它们进行的是统计计算。对于许多读者——尤其是那些缺乏深厚数学或认知科学背景的读者——来说,这是一个清晰且有益的观点。因此,本书将围绕语言学习模型的普遍神秘感转化为更务实、更易于理解的内容。

从数据到行为:LLM 如何学习——以及它们如何协调一致

在阐明语言的计算本质之后,本书转而探讨模型的学习方式。Raaijmakers 以通俗易懂的语言解释了当代语言学习模型(LLM)的构建方式(深度神经网络、注意力机制、Transformer 式架构),以及它们如何从简单的模式匹配机器演变为更智能、更实用的工具。

这一演变过程中一个关键的部分是利用人类反馈。 来自人类反馈的强化学习 (RLHF) ——这是一种由人类对语言学习模型(LLM)的输出进行评估或排序的技术,并据此对模型进行微调,使其更倾向于那些被认为更有帮助、更安全或更符合人类价值观的输出。本书(或隐含或明确地)区分了基础阶段(即在大量文本上进行预训练以学习统计规律)和调整阶段(即由人类判断塑造模型行为)。这种区分至关重要:预训练赋予LLM流畅性和通用知识;而基于反馈的微调(RLHF)则引导模型朝着理想的行为发展。

这样做,拉伊马克斯并没有回避复杂性或风险。他承认,人类的反馈和基于奖励的协调机制并不完美:反馈中存在偏见,人类判断存在差异, 过度拟合 对奖励模型而言,以及在新情境下不可预测的行为——这些都是合理的局限性。本书拒绝将RLHF理想化,从而保持了其可信度。

法学硕士能做什么和不能做什么

Raaijmakers 擅长阐述法学硕士的优势和局限性。优势在于:现代法学硕士课程用途广泛,令人惊叹。它们可以 翻译语言概括文本, 生成代码他们可以进行创意写作、撰写文章、回答问题,并在诸多领域提供协助——基本上任何可以简化为“文本输入→文本输出”的任务都能胜任。在规模和数据量足够大的情况下,他们的生成能力往往令人印象深刻,有时甚至匪夷所思。

与此同时,本书也毫不回避他们的根本局限性。法学硕士仍然是统计模式匹配者,而非真正的思考者:他们可以 幻觉的它们自信地输出看似合理但却错误的信息,复制训练数据中存在的偏见和刻板印象,并在需要现实世界理解、常识推理或长期逻辑思维的情境中表现不佳。Raaijmakers 对这些缺陷的处理是冷静的——并非危言耸听,而是务实的——这强调了逻辑学习模型虽然功能强大,但并非万能。

这种平衡的方法很有价值——它避免了过度炒作和悲观主义这两种陷阱。读者读完后,能够更清楚地了解法学硕士的优势和劣势。

机遇与责任:社会前景与风险

许多技术入门读物止步于架构或用例,而《大型语言模型》则更进一步,深入探讨了这项技术的社会、政治和伦理影响。在诸如以下章节中,作者详细阐述了这些影响: “实际机会”“社会风险与担忧”Raaijmakers 邀请读者思考 LLM(法学硕士)如何重塑创造力、生产力、人际沟通、媒体和机构。

从机遇的角度来看:其潜力巨大。法学硕士(LLM)可以使写作、翻译和编程等技能普及化。它可以加速研究、教育和创意表达。它可以帮助那些在语言或写作方面有困难的人。它可以改变媒体的生产和消费方式。在一个信息过载的世界里,如果运用得当,法学硕士或许能够帮助弥合各种鸿沟。

但拉伊马克尔斯并没有回避阴暗面。他发出警告:关于错误信息和“幻觉般的真相”,关于根深蒂固的…… 偏见这关乎人类判断力的衰退,关乎对有缺陷模型的过度依赖——所有这些风险都已在更广泛的研究中得到记录。 人工智能伦理 话语。

至关重要的是,这种社会视角使得本书不仅对工程师和研究人员有价值,而且对政策制定者、教育工作者以及任何有思考能力的公民也同样有价值。它将法学硕士课程置于现实世界的背景中,而非抽象的炒作。

接下来会发生什么——以及保持警惕的呼吁

最后一章, “接下来是什么?”并不认为当前的LLM(法学硕士)就是最终版本。相反,Raaijmakers鼓励人们以前瞻性的视角看待问题:LLM会如何发展?我们如何才能提高其协调性、透明度和公平性?随着这些模式的普及,哪些治理、监管和设计原则能够保护社会?

对我而言——作为一个对Essential Knowledge系列丛书投入颇深,也深知其中一些卷册令人失望的人——这本书绝对堪称最佳之作。它的清晰易懂、平衡全面、技术基础扎实,以及对社会问题的关注,都使其脱颖而出。它在通俗易懂的解释和严肃的批判之间达到了难得的平衡。

因此,我呼吁所有构建、部署或使用学习领导力模型(LLM)的人员——包括开发者、组织、政策制定者和普通用户——保持警惕、批判和知情的态度。要求透明度。争取获取多样化、具有代表性的训练数据。坚持严格的评估。质疑输出结果。不要将学习领导力模型视为神谕,而应将其视为强大的工具——这些工具的强大力量必须与谨慎、责任和人为判断相匹配。

最终裁决

《大型语言模型》并非又一本技术入门读物,而是一部及时、精辟且深思熟虑的指南,深入剖析了当今时代最具影响力的技术之一。它将通俗易懂的解释与冷静的思考相结合;既有清晰的技术细节,又兼具广阔的社会视野;既赞赏其潜力,又对风险保持谨慎的现实态度。

对于任何想要了解法学硕士(LLM)是什么、其作用和局限性以及其对我们未来可能意味着什么的人——工程师、研究人员、学生、政策制定者、好奇的公民——这本书 Stephan Raaijmakers 的大型语言模型 是必读之作。

Antoine 是一位富有远见的领导者,也是 Unite.AI 的创始合伙人,他对塑造和推动人工智能和机器人技术的未来有着坚定不移的热情。作为一名连续创业者,他相信人工智能将像电力一样颠覆社会,并经常对颠覆性技术和 AGI 的潜力赞不绝口。

作为一个 未来学家他致力于探索这些创新将如何塑造我们的世界。此外,他还是 证券一个专注于投资重新定义未来和重塑整个行业的尖端技术的平台。