ปัญญาประดิษฐ์
วิธีการที่ LLMs กำลังบังคับให้เราต้องกำหนดความหมายของปัญญาใหม่

มีคำพูดเก่าแก่ว่า: ถ้ามัน看เหมือนเป็นเป็ด ว่ายน้ำเหมือนเป็ด และคุยเหมือนเป็ด แล้วมันคงเป็ด วิธีการให้เหตุผลแบบง่ายๆ นี้ ซึ่งมักจะเชื่อมโยงกับกวี James Whitcomb Riley จาก Indiana ได้กำหนดวิธีการที่เราคิดเกี่ยวกับปัญญาประดิษฐ์มาเป็นเวลาหลายทศวรรษ ความคิดที่ว่าพฤติกรรมเพียงพอในการระบุปัญญาได้สร้างแรงบันดาลใจให้กับเกมเลียนแบบที่มีชื่อเสียงของ Alan Turing ซึ่งตอนนี้เรียกว่า ทัวริงทест
ทัวริงแนะนำว่าหากมนุษย์ไม่สามารถบอกได้ว่าพวกเขากำลังคุยอยู่กับเครื่องจักรหรือมนุษย์อีกคนหนึ่ง แล้วเครื่องจักรนั้นก็สามารถถือว่าเป็นปัญญาได้ ทั้งทัวริงทестและทดสอบเป็ดมีความหมายเหมือนกันว่าสิ่งที่สำคัญไม่ใช่สิ่งที่อยู่ภายในระบบ แต่เป็นพฤติกรรมของมัน ทดสอบนี้ได้กำหนดความก้าวหน้าในด้าน AI มาเป็นเวลาหลายทศวรรษ แต่ด้วยการมาถึงของโมเดลภาษาขนาดใหญ่ (LLMs) สถานการณ์ได้เปลี่ยนไปแล้ว ระบบเหล่านี้สามารถเขียนข้อความที่คล่องแคล่ว คุยและแก้ปัญหาได้ด้วยวิธีที่รู้สึกเหมือนมนุษย์ คำถามไม่ใช่แค่ว่าเครื่องจักรสามารถเลียนแบบการคุยของมนุษย์ได้หรือไม่ แต่ว่าการเลียนแบบนี้เป็นปัญญาจริงๆ หรือไม่ หากระบบหนึ่งสามารถเขียนเหมือนเรา คิดเหมือนเรา และสร้างสรรค์เหมือนเรา เราควรเรียกมันว่าปัญญาหรือไม่ หรือว่าพฤติกรรมเพียงอย่างเดียวไม่เพียงพอในการวัดปัญญาแล้ว
วิวัฒนาการของปัญญาเครื่องจักร
โมเดลภาษาขนาดใหญ่ได้เปลี่ยนแปลงวิธีการที่เราคิดเกี่ยวกับ AI ระบบเหล่านี้ซึ่งเคยจำกัดอยู่ที่การสร้างข้อความพื้นฐาน สามารถแก้ปัญหาที่เกี่ยวข้องกับตรรกะ เขียนโค้ดคอมพิวเตอร์ สร้างเรื่องราว และช่วยเหลือในงานสร้างสรรค์ เช่น การเขียนบทภาพยนตร์ หนึ่งในความก้าวหน้าที่สำคัญคือความสามารถในการแก้ปัญหาที่ซับซ้อนโดยใช้การให้เหตุผลแบบทีละขั้นตอน ซึ่งเรียกว่า การให้เหตุผลแบบทีละขั้นตอน โดยการแบ่งปัญหาออกเป็นชิ้นเล็กๆ ระบบ LLM สามารถแก้ปัญหาที่ซับซ้อนหรือปริศนาเชิงตรรกะได้ด้วยวิธีที่คล้ายกับการแก้ปัญหา củaมนุษย์ ความสามารถนี้ทำให้พวกมันสามารถเทียบหรือเหนือกว่าผลการทำงานของมนุษย์ในมาตรฐานที่ซับซ้อน เช่น MATH หรือ GSM8K ในปัจจุบัน LLMs ยังมีความสามารถ หลายรูปแบบ พวกมันสามารถทำงานกับภาพ ตีความการสแกนทางการแพทย์ อธิบายปริศนาเชิงภาพ และอธิบายแผนภาพที่ซับซ้อน ด้วยความก้าวหน้าเหล่านี้ คำถามไม่ใช่ว่า LLMs สามารถเลียนแบบพฤติกรรมของมนุษย์ได้หรือไม่ แต่ว่าการเลียนแบบนี้สะท้อนถึงความเข้าใจที่แท้จริงหรือไม่
รอยของการคิดเหมือนมนุษย์
ความสำเร็จของ LLMs กำลังเปลี่ยนแปลงวิธีที่เราคิดเกี่ยวกับปัญญา จุดสนใจกำลังเปลี่ยนจากการให้พฤติกรรมของ AI สอดคล้องกับมนุษย์ตามที่ทัวริงทดสอบแนะนำ ไปสู่การสำรวจว่า LLMs สะท้อนการคิดของมนุษย์ในการประมวลผลข้อมูล (เช่น การคิดเหมือนมนุษย์จริงๆ) ตัวอย่างเช่น ใน การศึกษาล่าสุด นักวิจัยได้เปรียบเทียบการทำงานภายในของโมเดล AI กับกิจกรรมของสมองมนุษย์ การศึกษาพบว่า LLMs ที่มีพารามิเตอร์มากกว่า 70 พันล้าน ไม่เพียงแต่บรรลุความแม่นยำระดับมนุษย์ แต่ยังจัดระเบียบข้อมูลภายในด้วยวิธีที่สอดคล้องกับรูปแบบกิจกรรมของสมองมนุษย์
เมื่อทั้งมนุษย์และโมเดล AI ทำงานเกี่ยวกับการรู้จำรูปแบบ กิจกรรมของสมองแสดงรูปแบบการทำงานที่คล้ายกันในผู้เข้าร่วมทดลองและรูปแบบการคำนวณที่สอดคล้องกันในโมเดล AI โมเดลเหล่านี้จัดระเบียบแนวคิดที่เป็นนามธรรมในชั้นภายในด้วยวิธีที่ตรงกับรูปแบบกิจกรรมของคลื่นสมองมนุษย์ ซึ่งบ่งชี้ว่าการให้เหตุผลที่ประสบความสำเร็จอาจต้องมีโครงสร้างที่คล้ายกัน ไม่ว่าจะเป็นในระบบทางชีววิทยาหรือระบบประดิษฐ์
อย่างไรก็ตาม นักวิจัยต้องระมัดระวังในการเน้นย้ำถึงข้อจำกัดของงานวิจัยนี้ การศึกษานี้มีผู้เข้าร่วมทดลองมนุษย์จำนวนไม่มาก และมนุษย์และเครื่องจักรเข้าใกล้ภารกิจด้วยวิธีที่แตกต่างกัน มนุษย์ทำงานกับรูปแบบที่มองเห็นได้ ในขณะที่โมเดล AI ประมวลผลคำอธิบายข้อความ รูปแบบที่สอดคล้องกันระหว่างการประมวลผลของมนุษย์และเครื่องจักรนี้น่าสนใจ แต่ไม่ได้พิสูจน์ว่าเครื่องจักรเข้าใจแนวคิดในแบบเดียวกับมนุษย์
มีความแตกต่างที่ชัดเจนในเรื่องของประสิทธิภาพ แม้ว่าโมเดล AI ที่ดีที่สุดจะเข้าใกล้ความแม่นยำระดับมนุษย์ในรูปแบบที่ง่าย แต่พวกมันก็แสดงการลดลงของประสิทธิภาพที่มากขึ้นในภารกิจที่ซับซ้อนที่สุดเมื่อเทียบกับผู้เข้าร่วมทดลองมนุษย์ ซึ่งบ่งชี้ว่าแม้จะมีลักษณะที่คล้ายคลึงกันในการจัดระเบียบ แต่อาจยังมีความแตกต่างพื้นฐานใน cáchที่มนุษย์และเครื่องจักรประมวลผลแนวคิดที่เป็นนามธรรมที่ยาก
มุมมองของคนขี้ระแวง
尽管มีผลการวิจัยที่น่าประทับใจ แต่มีแง่มุมที่แข็งแกร่งที่ชี้ว่า LLMs ไม่ใช่อื่นใดนอกจากเลียนแบบที่มีทักษะสูง มุมมองนี้มาจากการทดลองความคิดของนักปรัชญา John Searle เรียกว่า “ห้องจีน” ซึ่งอธิบายว่าทำไมพฤติกรรมอาจไม่เท่ากับการเข้าใจ
ในคำถามนี้ Searle ขอให้เราคิดถึงคนคนหนึ่งที่ถูกขังในห้องและพูดได้เฉพาะภาษาอังกฤษ คนๆ นั้นได้รับอักขระจีนและใช้หนังสือคำศัพท์ภาษาอังกฤษเพื่อจัดการกับอักขระเหล่านั้นและสร้างคำตอบ จากภายนอกห้อง คำตอบของเขาดูเหมือนกับของคนจีนพื้นเมือง Searle แย้งว่าคนๆ นั้นไม่เข้าใจอะไรเกี่ยวกับภาษาจีนเลย เขาแค่ติดตามกฎโดยไม่มีความเข้าใจที่แท้จริง
นักวิจารณ์ใช้ตรรกะเดียวกันกับ LLMs พวกเขาอ้างว่าระบบเหล่านี้เป็น “นกแก้วแบบสุ่ม” ที่สร้างคำตอบตามรูปแบบทางสถิติในข้อมูลการฝึกอบรม ไม่ใช่ความเข้าใจที่แท้จริง คำว่า “สุ่ม” หมายถึงธรรมชาติที่เป็นไปได้ของพวกมัน ในขณะที่ “นกแก้ว” เน้นย้ำถึงพฤติกรรมเลียนแบบโดยไม่มีความเข้าใจที่แท้จริง
ข้อจำกัดทางเทคนิคของ LLMs ยังสนับสนุนข้อโต้แย้งนี้ LLMs มักจะสร้าง “ภาพหลอน” ซึ่งเป็นคำตอบที่ดูเป็นไปได้แต่ไม่ถูกต้องและไม่มีเหตุผล ซึ่งเกิดขึ้นเพราะพวกมันเลือกคำที่เป็นไปได้ทางสถิติแทนการอ้างอิงฐานความรู้ภายในหรือการเข้าใจความจริงและความเท็จ ระบบเหล่านี้ยังทำซ้ำข้อผิดพลาดและอคติของมนุษย์ พวกมันสับสนกับข้อมูลที่ไม่เกี่ยวข้องซึ่งมนุษย์จะเพิกเฉยได้ง่ายๆ พวกมันแสดงอคติทางเชื้อชาติและเพศเพราะพวกมันเรียนรู้จากข้อมูลที่มีอคติเหล่านี้ อีกข้อจำกัดที่เปิดเผยคือ “อคติของตำแหน่ง” โดยที่โมเดลเหล่านี้เน้นข้อมูลที่อยู่ที่ต้นหรือท้ายของเอกสารยาวๆ ในขณะที่เพิกเฉยต่อเนื้อหาที่อยู่ตรงกลาง ซึ่งแสดงให้เห็นว่าระบบเหล่านี้ประมวลผลข้อมูลในแบบที่แตกต่างจากมนุษย์ ซึ่งสามารถรักษาความสนใจตลอดทั้งเอกสาร
ข้อจำกัดเหล่านี้เน้นย้ำถึงความท้าทายหลักว่า LLMs excels ในการรู้จำและทำซ้ำรูปแบบภาษา แต่นี่ไม่ได้หมายความว่าพวกมันเข้าใจความหมายหรือบริบทของโลกแห่งความเป็นจริง พวกมันทำงานได้ดีในการจัดการไวยากรณ์ แต่ยังคงมีข้อจำกัดเมื่อพูดถึงความหมาย
อะไรที่นับเป็นปัญญา?
การถกเถียงกันสุดท้ายมาถึงคำถามว่าเรากำหนดปัญญาได้อย่างไร หากปัญญาเป็นความสามารถในการสร้างภาษาที่สอดคล้อง แก้ปัญหา และปรับตัวเข้ากับสถานการณ์ใหม่ๆ แล้ว LLMs ก็บรรลุมาตรฐานนี้แล้ว อย่างไรก็ตาม หากปัญญาต้องมีการตระหนักรู้ตัวเอง ความเข้าใจที่แท้จริง หรือประสบการณ์เชิงอัตวิสัย ระบบเหล่านี้ยังคงไม่เพียงพอ
ความยากคือเราไม่มีวิธีการวัดคุณสมบัติเช่นความเข้าใจหรือความตระหนักรู้ที่ชัดเจนหรือเป็นกลาง ในทั้งมนุษย์และเครื่องจักร เราอนุมานสิ่งเหล่านี้จากพฤติกรรม ทัวริงทดสอบและทดสอบเป็ดเคยให้คำตอบที่ง่ายแก่เรา แต่ในยุคของ LLMs อาจไม่เพียงพอแล้ว ความสามารถของพวกมันบังคับให้เราต้องคิดใหม่ว่าอะไรที่แท้จริงนับเป็นปัญญา และว่าคำจำกัดความดั้งเดิมของเรากำลังตามทันความเป็นจริงทางเทคโนโลยีหรือไม่
สรุป
โมเดลภาษาขนาดใหญ่กำลังท้าทายวิธีการที่เรากำหนดปัญญา AI พวกมันสามารถเลียนแบบการให้เหตุผล สร้างความคิด และทำภารกิจที่เคยถูกมองว่าเป็นเอกสิทธิ์ของมนุษย์ แต่พวกมันขาดการตระหนักรู้และพื้นฐานที่กำหนดการคิดเหมือนมนุษย์ที่แท้จริง การเพิ่มขึ้นของพวกมันบังคับให้เราต้องถามไม่เพียงแต่ว่าเครื่องจักรทำงานอย่างฉลาดเท่านั้น แต่ยังถามว่าปัญญาเองหมายถึงอะไรจริงๆ












