เชื่อมต่อกับเรา

รีวิวหนังสือ: แบบจำลองภาษาขนาดใหญ่ โดย สเตฟาน ราไอจ์มาเคอร์ส

รีวิวหนังสือ

รีวิวหนังสือ: แบบจำลองภาษาขนาดใหญ่ โดย สเตฟาน ราไอจ์มาเคอร์ส

mm

ในฐานะคนที่ครอบครองหนังสือจากสำนักพิมพ์นี้มากกว่าสิบห้าเล่ม ชุดหนังสือความรู้ที่จำเป็นจากสำนักพิมพ์ MIT Pressผมติดตามหนังสือเล่มใหม่แต่ละเล่มด้วยความสนใจและความระมัดระวัง: ซีรีส์นี้มักนำเสนอภาพรวมที่รอบคอบและเข้าใจง่าย แต่ก็ไม่ได้มีสไตล์หรือความลึกซึ้งอย่างที่ผมคาดหวังเสมอไป

ในกรณีที่ แบบจำลองภาษาขนาดใหญ่ โดย สเตฟาน ราไอจ์เมเกอร์สอย่างไรก็ตาม ผู้เขียนได้สร้างสิ่งที่หาได้ยาก นั่นคือ หนังสือเล่มนี้กระชับ ครบถ้วนด้วยข้อมูล และมีความสมดุลเชิงวิพากษ์ ซึ่งทำให้หนังสือเล่มนี้ติดอันดับหนังสือเกี่ยวกับ AI ที่ผมแนะนำมากที่สุด

แนวคิดใหม่เกี่ยวกับภาษา: จากศิลปะของมนุษย์สู่การคำนวณ

หนึ่งในที่สุด จุดแข็งที่โดดเด่นของแบบจำลองภาษาขนาดใหญ่ จุดเด่นของหนังสือเล่มนี้คือการปรับมุมมองใหม่เกี่ยวกับ “ภาษา” แทนที่จะเน้นเฉพาะมุมมองทางปรัชญาหรือวรรณกรรม หนังสือเล่มนี้มองภาษาในฐานะ... ปรากฏการณ์การคำนวณ — ระบบโครงสร้าง รูปแบบทางสถิติ และศักยภาพในการสร้างสรรค์ที่สถาปัตยกรรมประสาทสมัยใหม่สามารถนำมาใช้ประโยชน์ได้ การปรับกรอบความคิดนี้ไม่ใช่เรื่องบังเอิญ: ราไอจ์เมเกอร์สได้นำผู้อ่านไปสู่ขั้นตอนการทำงานภายในของเครือข่ายประสาทขนาดใหญ่ในการเข้ารหัส วิเคราะห์ และสร้างข้อความโดยอาศัยความสม่ำเสมอทางสถิติในชุดข้อมูลข้อความขนาดใหญ่ ซึ่งเป็นการเปลี่ยนแปลงที่ละเอียดอ่อนแต่ทรงพลังในวิธีที่ผู้อ่านเข้าใจระบบเหล่านี้ หนังสือเล่มนี้ทำให้เข้าใจได้ง่ายว่า ภาษาเมื่อมองผ่านเลนส์การคำนวณนี้ จะกลายเป็นสิ่งที่เครื่องจักรสามารถจำลองได้ แทนที่จะเป็นสิ่งลึกลับหรือเข้าใจยาก

การนำเสนอแบบนี้ช่วยคลายความลึกลับเกี่ยวกับสิ่งที่ LLM กำลังทำ แทนที่จะมองว่าพวกมันเป็น “ผู้เข้าใจ” ความหมายที่ลึกลับ Raaijmakers กลับแสดงให้เห็นว่าพวกมันประมาณค่าภาษาอย่างไร: การทำนายโทเค็นถัดไป การสร้างแบบจำลองไวยากรณ์และความหมายทางสถิติ และการสร้างผลลัพธ์ทางภาษาที่สมเหตุสมผลโดยอิงจากแบบจำลองที่เรียนรู้มา กล่าวอีกนัยหนึ่งคือ พวกมันไม่ได้ “คิด” ในแง่ของมนุษย์ แต่พวกมันคำนวณทางสถิติ สำหรับผู้อ่านหลายคน โดยเฉพาะอย่างยิ่งผู้ที่ไม่มีพื้นฐานทางคณิตศาสตร์หรือวิทยาศาสตร์ทางปัญญาอย่างลึกซึ้ง นี่เป็นมุมมองที่ชัดเจนและเป็นประโยชน์ หนังสือเล่มนี้จึงเปลี่ยนความลึกลับที่แพร่หลายเกี่ยวกับ LLM ให้กลายเป็นสิ่งที่จับต้องได้และเข้าใจง่ายขึ้น

จากข้อมูลสู่พฤติกรรม: LLM เรียนรู้อย่างไร และสอดคล้องกันอย่างไร

หลังจากที่ได้อธิบายไปแล้วว่าภาษาคืออะไร (ในเชิงการคำนวณ) หนังสือเล่มนี้ก็จะกล่าวถึงวิธีการเรียนรู้ของแบบจำลอง ราไอจ์เมเกอร์อธิบายด้วยภาษาที่เข้าใจง่ายว่าแบบจำลองภาษาสมัยใหม่ (LLM) ถูกสร้างขึ้นมาอย่างไร (เช่น โครงข่ายประสาทเทียมเชิงลึก กลไกความสนใจ สถาปัตยกรรมแบบทรานส์ฟอร์เมอร์) และแบบจำลองเหล่านี้พัฒนาจากเครื่องมือจับคู่รูปแบบธรรมดาไปสู่เครื่องมือที่ใช้งานได้จริงและมีประสิทธิภาพมากขึ้นได้อย่างไร

ส่วนสำคัญของการวิวัฒนาการนั้นคือการใช้ข้อเสนอแนะจากมนุษย์โดยการใช้ การเรียนรู้การเสริมแรงจากคำติชมของมนุษย์ (RLHF) — เทคนิคที่มนุษย์ประเมินหรือจัดอันดับผลลัพธ์ของ LLM และปรับแต่งโมเดลเพื่อเลือกผลลัพธ์ที่ถือว่ามีประโยชน์ ปลอดภัย หรือสอดคล้องกับค่านิยมของมนุษย์มากกว่า หนังสือเล่มนี้ได้แยกแยะความแตกต่าง (ทั้งโดยนัยและโดยชัดแจ้ง) ระหว่างขั้นตอนพื้นฐาน — การฝึกฝนเบื้องต้นด้วยข้อความจำนวนมหาศาลเพื่อเรียนรู้ความสม่ำเสมอทางสถิติ — และขั้นตอนการปรับแต่ง ซึ่งการตัดสินของมนุษย์เป็นตัวกำหนดพฤติกรรมของโมเดล ความแตกต่างนี้มีความสำคัญอย่างยิ่ง: การฝึกฝนเบื้องต้นทำให้ LLM มีความคล่องแคล่วและความรู้ทั่วไป ในขณะที่ RLHF (หรือการปรับแต่งตามผลตอบรับ) จะนำทางโมเดลไปสู่พฤติกรรมที่พึงประสงค์

ในการทำเช่นนั้น ราไอจ์มาเคอร์ไม่ได้มองข้ามความซับซ้อนหรือความเสี่ยง เขายอมรับว่าการตอบรับจากมนุษย์และการจัดสรรรางวัลนั้นไม่สมบูรณ์แบบ: มีอคติในการตอบรับ การตัดสินของมนุษย์ที่ไม่สม่ำเสมอ ฟิตเกินไป ข้อจำกัดต่างๆ เช่น รูปแบบการให้รางวัล และพฤติกรรมที่คาดเดาไม่ได้ในบริบทใหม่ๆ ล้วนเป็นสิ่งที่ยอมรับได้ การที่หนังสือเล่มนี้ไม่ยกย่อง RLHF ในอุดมคติ ทำให้หนังสือเล่มนี้ยังคงความน่าเชื่อถือไว้ได้

สิ่งที่ LLM สามารถทำได้และทำไม่ได้

ราไอจ์มาเกอร์สมีความเชี่ยวชาญในการอธิบายทั้งจุดแข็งและข้อจำกัดของหลักสูตร LLM ในด้านบวก: หลักสูตร LLM สมัยใหม่มีความหลากหลายอย่างน่าทึ่ง สามารถนำไปใช้ได้หลากหลายรูปแบบ แปลภาษาสรุปเนื้อหา สร้างรหัสพวกเขาสร้างสรรค์งานเขียน ร่างเรียงความ ตอบคำถาม และให้ความช่วยเหลือในหลายๆ ด้าน กล่าวคือ งานใดๆ ก็ตามที่สามารถลดทอนให้เหลือเพียง "การป้อนข้อความ → การส่งออกข้อความ" เมื่อมีขนาดและข้อมูลที่เพียงพอ ความสามารถในการสร้างสรรค์ของพวกเขามักจะน่าประทับใจ บางครั้งก็เหลือเชื่อ

ในขณะเดียวกัน หนังสือเล่มนี้ก็ไม่ได้หลีกเลี่ยงข้อจำกัดพื้นฐานของพวกเขา LLM ยังคงเป็นเพียงผู้จับคู่รูปแบบทางสถิติ ไม่ใช่นักคิดที่แท้จริง: พวกเขาสามารถ ภาพหลอนโมเดลเหล่านี้มักให้ข้อมูลที่ดูน่าเชื่อถือแต่เป็นเท็จอย่างมั่นใจ เลียนแบบอคติและแบบแผนที่ปรากฏในข้อมูลฝึกฝน และล้มเหลวในบริบทที่ต้องการความเข้าใจในโลกแห่งความเป็นจริง การใช้เหตุผลอย่างมีสามัญสำนึก หรือความสอดคล้องในระยะยาว การวิเคราะห์ความล้มเหลวเหล่านี้ของ Raaijmakers นั้นเป็นไปอย่างสุขุมรอบคอบ ไม่ใช่การทำให้เกิดความตื่นตระหนก แต่เป็นไปอย่างสมจริง ตอกย้ำว่าแม้โมเดล LLM จะทรงพลัง แต่ก็ไม่ใช่เวทมนตร์

แนวทางที่สมดุลนี้มีคุณค่าอย่างยิ่ง เพราะช่วยหลีกเลี่ยงกับดักสองประการ ได้แก่ การโฆษณาเกินจริงและการมองโลกในแง่ร้าย ผู้อ่านจะได้รับความเข้าใจที่ชัดเจนว่าหลักสูตรปริญญาโทด้านกฎหมายมีประโยชน์อย่างไร และสิ่งใดที่ไม่น่าเชื่อถือ

โอกาสและความรับผิดชอบ: คำมั่นสัญญาและความเสี่ยงทางสังคม

ในขณะที่หนังสือแนะนำทางเทคนิคหลายเล่มจบลงที่สถาปัตยกรรมหรือกรณีการใช้งาน หนังสือ Large Language Models กลับไปไกลกว่านั้น — เจาะลึกไปถึงผลกระทบทางสังคม การเมือง และจริยธรรมของเทคโนโลยีนี้ ในบทต่างๆ เช่น “โอกาสเชิงปฏิบัติ” และ “ความเสี่ยงและความกังวลทางสังคม”Raaijmakers เชิญชวนผู้อ่านให้พิจารณาว่าหลักสูตรปริญญาโทด้านกฎหมาย (LLM) อาจเปลี่ยนแปลงความคิดสร้างสรรค์ ผลผลิต การสื่อสารของมนุษย์ สื่อ และสถาบันต่างๆ ได้อย่างไร

ในด้านโอกาสนั้น ศักยภาพมีมหาศาล หลักสูตรปริญญาโทด้านกฎหมาย (LLM) สามารถทำให้การเข้าถึงการเขียน การแปล และการเขียนโปรแกรมเป็นไปอย่างเท่าเทียมกันมากขึ้น สามารถเร่งการวิจัย การศึกษา และการแสดงออกอย่างสร้างสรรค์ สามารถช่วยเหลือผู้ที่มีปัญหาด้านภาษาหรือการเขียน และสามารถเปลี่ยนแปลงวิธีการผลิตและบริโภคสื่อได้ ในโลกที่เผชิญกับข้อมูลล้นเกิน หลักสูตรปริญญาโทด้านกฎหมายอาจช่วยเชื่อมช่องว่างได้ หากนำไปใช้อย่างรอบคอบ

แต่ราไอจ์มาเคอร์สก็ไม่ได้หลีกเลี่ยงด้านมืด เขายกประเด็นเตือนภัยเกี่ยวกับข้อมูลที่ผิดพลาดและ “ความจริงที่บิดเบือน” รวมถึงเรื่องที่ฝังรากลึก อคติเกี่ยวกับการเสื่อมถอยของวิจารณญาณของมนุษย์ เกี่ยวกับการพึ่งพาแบบจำลองที่บกพร่องมากเกินไป ซึ่งทั้งหมดนี้เป็นความเสี่ยงที่ได้รับการบันทึกไว้แล้วในวงกว้าง จรรยาบรรณเอไอ วาทกรรม.

ที่สำคัญ มุมมองทางสังคมนี้ทำให้หนังสือเล่มนี้มีคุณค่าไม่เพียงแต่สำหรับวิศวกรและนักวิจัยเท่านั้น แต่ยังรวมถึงผู้กำหนดนโยบาย นักการศึกษา และพลเมืองที่มีวิจารณญาณทุกคนด้วย หนังสือเล่มนี้เชื่อมโยงหลักสูตรปริญญาโทด้านกฎหมายเข้ากับบริบทในโลกแห่งความเป็นจริง ไม่ใช่แค่กระแสความนิยมที่เป็นนามธรรม

สิ่งที่จะเกิดขึ้นต่อไป — และการเรียกร้องให้เฝ้าระวัง

บทสุดท้าย “ต่อไปจะเป็นอย่างไร?”ไม่ได้อ้างว่ารูปแบบกฎหมายลี้ภัยในปัจจุบันเป็นคำตอบสุดท้าย แต่ Raaijmakers สนับสนุนมุมมองที่มองไปข้างหน้า: รูปแบบกฎหมายลี้ภัยอาจพัฒนาไปอย่างไร? เราจะปรับปรุงความสอดคล้อง ความโปร่งใส และความเป็นธรรมได้อย่างไร? หลักการกำกับดูแล กฎระเบียบ และการออกแบบใดที่จะปกป้องสังคมเมื่อรูปแบบเหล่านี้แพร่หลายมากขึ้น?

สำหรับผม ในฐานะผู้ที่ติดตามแคตตาล็อกความรู้สำคัญอย่างเหนียวแน่น และตระหนักดีว่าบางเล่มอาจไม่น่าประทับใจเท่าที่ควร หนังสือเล่มนี้สมควรได้รับการจัดอันดับอยู่ในกลุ่มหนังสือที่ดีที่สุด ความชัดเจน ความสมดุล พื้นฐานทางเทคนิค และความตระหนักรู้ทางสังคม ทำให้หนังสือเล่มนี้โดดเด่น มันสร้างสมดุลที่หาได้ยากระหว่างคำอธิบายที่เข้าใจง่ายและการวิพากษ์วิจารณ์อย่างจริงจัง

ดังนั้น ผมจึงขอเรียกร้องให้ทุกคนที่สร้าง ใช้งาน หรือมีปฏิสัมพันธ์กับ LLMs ไม่ว่าจะเป็นนักพัฒนา องค์กร ผู้กำหนดนโยบาย และผู้ใช้งานทั่วไป คอยจับตาดูอย่างรอบคอบ มีวิจารณญาณ และรอบรู้ เรียกร้องความโปร่งใส ผลักดันข้อมูลการฝึกอบรมที่หลากหลายและเป็นตัวแทน ยืนกรานในการประเมินผลอย่างเข้มงวด ตั้งคำถามกับผลลัพธ์ อย่ามอง LLMs เป็นเหมือนผู้พยากรณ์ แต่จงมองเป็นเครื่องมือทรงพลัง ซึ่งพลังของมันต้องมาพร้อมกับความเอาใจใส่ ความรับผิดชอบ และวิจารณญาณของมนุษย์

คำตัดสินรอบชิงชนะเลิศ

หนังสือ Large Language Models ไม่ใช่แค่คู่มือทางเทคนิคทั่วไป แต่เป็นคู่มือที่ทันสมัย ​​เฉียบคม และลึกซึ้งเกี่ยวกับเทคโนโลยีที่มีความสำคัญที่สุดอย่างหนึ่งในยุคของเรา หนังสือเล่มนี้ผสมผสานคำอธิบายที่เข้าใจง่ายเข้ากับการไตร่ตรองอย่างรอบคอบ รายละเอียดทางเทคนิคที่ชัดเจนเข้ากับความตระหนักรู้ทางสังคมในวงกว้าง การชื่นชมศักยภาพเข้ากับความเป็นจริงที่ระมัดระวังเกี่ยวกับความเสี่ยง

สำหรับทุกคน ไม่ว่าจะเป็นวิศวกร นักวิจัย นักศึกษา ผู้กำหนดนโยบาย หรือประชาชนทั่วไปที่อยากเข้าใจว่า LLM คืออะไร ทำอะไรได้บ้าง ทำอะไรไม่ได้บ้าง และอาจมีความหมายอย่างไรต่ออนาคตของเรา หนังสือเล่มนี้คือคำตอบ แบบจำลองภาษาขนาดใหญ่ โดย สเตฟาน ราไอจ์เมเกอร์ส เป็นหนังสือที่ควรค่าแก่การอ่าน

อองตวนเป็นผู้นำที่มีวิสัยทัศน์และหุ้นส่วนผู้ก่อตั้ง Unite.AI ผู้เปี่ยมด้วยความมุ่งมั่นอย่างไม่ลดละในการกำหนดและส่งเสริมอนาคตของ AI และหุ่นยนต์ เขาเป็นผู้ประกอบการต่อเนื่องที่เชื่อว่า AI จะสร้างการเปลี่ยนแปลงครั้งใหญ่ให้กับสังคมเช่นเดียวกับพลังงานไฟฟ้า และมักถูกพูดถึงอย่างออกรสออกชาติเกี่ยวกับศักยภาพของเทคโนโลยีที่พลิกโฉมและ AGI

ในฐานะที่เป็น ผู้เป็นเจ้ายังมาไม่ถึงเขาอุทิศตนเพื่อสำรวจว่านวัตกรรมเหล่านี้จะกำหนดโลกของเราอย่างไร นอกจากนี้ เขายังเป็นผู้ก่อตั้ง หลักทรัพย์.ioแพลตฟอร์มที่มุ่งเน้นการลงทุนในเทคโนโลยีล้ำสมัยที่กำลังกำหนดอนาคตใหม่และปรับเปลี่ยนรูปแบบภาคส่วนต่างๆ ทั้งหมด