ปัญญาประดิษฐ์

วิธีการที่ LLMs กำลังบังคับให้เราต้องกำหนดความหมายของปัญญาใหม่

mm

มีคำพูดเก่าแก่ว่า: ถ้ามัน看เหมือนเป็นเป็ด ว่ายน้ำเหมือนเป็ด และคุยเหมือนเป็ด แล้วมันคงเป็ด วิธีการให้เหตุผลแบบง่ายๆ นี้ ซึ่งมักจะเชื่อมโยงกับกวี James Whitcomb Riley จาก Indiana ได้กำหนดวิธีการที่เราคิดเกี่ยวกับปัญญาประดิษฐ์มาเป็นเวลาหลายทศวรรษ ความคิดที่ว่าพฤติกรรมเพียงพอในการระบุปัญญาได้สร้างแรงบันดาลใจให้กับเกมเลียนแบบที่มีชื่อเสียงของ Alan Turing ซึ่งตอนนี้เรียกว่า ทัวริงทест

ทัวริงแนะนำว่าหากมนุษย์ไม่สามารถบอกได้ว่าพวกเขากำลังคุยอยู่กับเครื่องจักรหรือมนุษย์อีกคนหนึ่ง แล้วเครื่องจักรนั้นก็สามารถถือว่าเป็นปัญญาได้ ทั้งทัวริงทестและทดสอบเป็ดมีความหมายเหมือนกันว่าสิ่งที่สำคัญไม่ใช่สิ่งที่อยู่ภายในระบบ แต่เป็นพฤติกรรมของมัน ทดสอบนี้ได้กำหนดความก้าวหน้าในด้าน AI มาเป็นเวลาหลายทศวรรษ แต่ด้วยการมาถึงของโมเดลภาษาขนาดใหญ่ (LLMs) สถานการณ์ได้เปลี่ยนไปแล้ว ระบบเหล่านี้สามารถเขียนข้อความที่คล่องแคล่ว คุยและแก้ปัญหาได้ด้วยวิธีที่รู้สึกเหมือนมนุษย์ คำถามไม่ใช่แค่ว่าเครื่องจักรสามารถเลียนแบบการคุยของมนุษย์ได้หรือไม่ แต่ว่าการเลียนแบบนี้เป็นปัญญาจริงๆ หรือไม่ หากระบบหนึ่งสามารถเขียนเหมือนเรา คิดเหมือนเรา และสร้างสรรค์เหมือนเรา เราควรเรียกมันว่าปัญญาหรือไม่ หรือว่าพฤติกรรมเพียงอย่างเดียวไม่เพียงพอในการวัดปัญญาแล้ว

วิวัฒนาการของปัญญาเครื่องจักร

โมเดลภาษาขนาดใหญ่ได้เปลี่ยนแปลงวิธีการที่เราคิดเกี่ยวกับ AI ระบบเหล่านี้ซึ่งเคยจำกัดอยู่ที่การสร้างข้อความพื้นฐาน สามารถแก้ปัญหาที่เกี่ยวข้องกับตรรกะ เขียนโค้ดคอมพิวเตอร์ สร้างเรื่องราว และช่วยเหลือในงานสร้างสรรค์ เช่น การเขียนบทภาพยนตร์ หนึ่งในความก้าวหน้าที่สำคัญคือความสามารถในการแก้ปัญหาที่ซับซ้อนโดยใช้การให้เหตุผลแบบทีละขั้นตอน ซึ่งเรียกว่า การให้เหตุผลแบบทีละขั้นตอน โดยการแบ่งปัญหาออกเป็นชิ้นเล็กๆ ระบบ LLM สามารถแก้ปัญหาที่ซับซ้อนหรือปริศนาเชิงตรรกะได้ด้วยวิธีที่คล้ายกับการแก้ปัญหา củaมนุษย์ ความสามารถนี้ทำให้พวกมันสามารถเทียบหรือเหนือกว่าผลการทำงานของมนุษย์ในมาตรฐานที่ซับซ้อน เช่น MATH หรือ GSM8K ในปัจจุบัน LLMs ยังมีความสามารถ หลายรูปแบบ พวกมันสามารถทำงานกับภาพ ตีความการสแกนทางการแพทย์ อธิบายปริศนาเชิงภาพ และอธิบายแผนภาพที่ซับซ้อน ด้วยความก้าวหน้าเหล่านี้ คำถามไม่ใช่ว่า LLMs สามารถเลียนแบบพฤติกรรมของมนุษย์ได้หรือไม่ แต่ว่าการเลียนแบบนี้สะท้อนถึงความเข้าใจที่แท้จริงหรือไม่

รอยของการคิดเหมือนมนุษย์

ความสำเร็จของ LLMs กำลังเปลี่ยนแปลงวิธีที่เราคิดเกี่ยวกับปัญญา จุดสนใจกำลังเปลี่ยนจากการให้พฤติกรรมของ AI สอดคล้องกับมนุษย์ตามที่ทัวริงทดสอบแนะนำ ไปสู่การสำรวจว่า LLMs สะท้อนการคิดของมนุษย์ในการประมวลผลข้อมูล (เช่น การคิดเหมือนมนุษย์จริงๆ) ตัวอย่างเช่น ใน การศึกษาล่าสุด นักวิจัยได้เปรียบเทียบการทำงานภายในของโมเดล AI กับกิจกรรมของสมองมนุษย์ การศึกษาพบว่า LLMs ที่มีพารามิเตอร์มากกว่า 70 พันล้าน ไม่เพียงแต่บรรลุความแม่นยำระดับมนุษย์ แต่ยังจัดระเบียบข้อมูลภายในด้วยวิธีที่สอดคล้องกับรูปแบบกิจกรรมของสมองมนุษย์

เมื่อทั้งมนุษย์และโมเดล AI ทำงานเกี่ยวกับการรู้จำรูปแบบ กิจกรรมของสมองแสดงรูปแบบการทำงานที่คล้ายกันในผู้เข้าร่วมทดลองและรูปแบบการคำนวณที่สอดคล้องกันในโมเดล AI โมเดลเหล่านี้จัดระเบียบแนวคิดที่เป็นนามธรรมในชั้นภายในด้วยวิธีที่ตรงกับรูปแบบกิจกรรมของคลื่นสมองมนุษย์ ซึ่งบ่งชี้ว่าการให้เหตุผลที่ประสบความสำเร็จอาจต้องมีโครงสร้างที่คล้ายกัน ไม่ว่าจะเป็นในระบบทางชีววิทยาหรือระบบประดิษฐ์

อย่างไรก็ตาม นักวิจัยต้องระมัดระวังในการเน้นย้ำถึงข้อจำกัดของงานวิจัยนี้ การศึกษานี้มีผู้เข้าร่วมทดลองมนุษย์จำนวนไม่มาก และมนุษย์และเครื่องจักรเข้าใกล้ภารกิจด้วยวิธีที่แตกต่างกัน มนุษย์ทำงานกับรูปแบบที่มองเห็นได้ ในขณะที่โมเดล AI ประมวลผลคำอธิบายข้อความ รูปแบบที่สอดคล้องกันระหว่างการประมวลผลของมนุษย์และเครื่องจักรนี้น่าสนใจ แต่ไม่ได้พิสูจน์ว่าเครื่องจักรเข้าใจแนวคิดในแบบเดียวกับมนุษย์

มีความแตกต่างที่ชัดเจนในเรื่องของประสิทธิภาพ แม้ว่าโมเดล AI ที่ดีที่สุดจะเข้าใกล้ความแม่นยำระดับมนุษย์ในรูปแบบที่ง่าย แต่พวกมันก็แสดงการลดลงของประสิทธิภาพที่มากขึ้นในภารกิจที่ซับซ้อนที่สุดเมื่อเทียบกับผู้เข้าร่วมทดลองมนุษย์ ซึ่งบ่งชี้ว่าแม้จะมีลักษณะที่คล้ายคลึงกันในการจัดระเบียบ แต่อาจยังมีความแตกต่างพื้นฐานใน cáchที่มนุษย์และเครื่องจักรประมวลผลแนวคิดที่เป็นนามธรรมที่ยาก

มุมมองของคนขี้ระแวง

尽管มีผลการวิจัยที่น่าประทับใจ แต่มีแง่มุมที่แข็งแกร่งที่ชี้ว่า LLMs ไม่ใช่อื่นใดนอกจากเลียนแบบที่มีทักษะสูง มุมมองนี้มาจากการทดลองความคิดของนักปรัชญา John Searle เรียกว่า “ห้องจีน” ซึ่งอธิบายว่าทำไมพฤติกรรมอาจไม่เท่ากับการเข้าใจ

ในคำถามนี้ Searle ขอให้เราคิดถึงคนคนหนึ่งที่ถูกขังในห้องและพูดได้เฉพาะภาษาอังกฤษ คนๆ นั้นได้รับอักขระจีนและใช้หนังสือคำศัพท์ภาษาอังกฤษเพื่อจัดการกับอักขระเหล่านั้นและสร้างคำตอบ จากภายนอกห้อง คำตอบของเขาดูเหมือนกับของคนจีนพื้นเมือง Searle แย้งว่าคนๆ นั้นไม่เข้าใจอะไรเกี่ยวกับภาษาจีนเลย เขาแค่ติดตามกฎโดยไม่มีความเข้าใจที่แท้จริง

นักวิจารณ์ใช้ตรรกะเดียวกันกับ LLMs พวกเขาอ้างว่าระบบเหล่านี้เป็น “นกแก้วแบบสุ่ม” ที่สร้างคำตอบตามรูปแบบทางสถิติในข้อมูลการฝึกอบรม ไม่ใช่ความเข้าใจที่แท้จริง คำว่า “สุ่ม” หมายถึงธรรมชาติที่เป็นไปได้ของพวกมัน ในขณะที่ “นกแก้ว” เน้นย้ำถึงพฤติกรรมเลียนแบบโดยไม่มีความเข้าใจที่แท้จริง

ข้อจำกัดทางเทคนิคของ LLMs ยังสนับสนุนข้อโต้แย้งนี้ LLMs มักจะสร้าง “ภาพหลอน” ซึ่งเป็นคำตอบที่ดูเป็นไปได้แต่ไม่ถูกต้องและไม่มีเหตุผล ซึ่งเกิดขึ้นเพราะพวกมันเลือกคำที่เป็นไปได้ทางสถิติแทนการอ้างอิงฐานความรู้ภายในหรือการเข้าใจความจริงและความเท็จ ระบบเหล่านี้ยังทำซ้ำข้อผิดพลาดและอคติของมนุษย์ พวกมันสับสนกับข้อมูลที่ไม่เกี่ยวข้องซึ่งมนุษย์จะเพิกเฉยได้ง่ายๆ พวกมันแสดงอคติทางเชื้อชาติและเพศเพราะพวกมันเรียนรู้จากข้อมูลที่มีอคติเหล่านี้ อีกข้อจำกัดที่เปิดเผยคือ “อคติของตำแหน่ง” โดยที่โมเดลเหล่านี้เน้นข้อมูลที่อยู่ที่ต้นหรือท้ายของเอกสารยาวๆ ในขณะที่เพิกเฉยต่อเนื้อหาที่อยู่ตรงกลาง ซึ่งแสดงให้เห็นว่าระบบเหล่านี้ประมวลผลข้อมูลในแบบที่แตกต่างจากมนุษย์ ซึ่งสามารถรักษาความสนใจตลอดทั้งเอกสาร

ข้อจำกัดเหล่านี้เน้นย้ำถึงความท้าทายหลักว่า LLMs excels ในการรู้จำและทำซ้ำรูปแบบภาษา แต่นี่ไม่ได้หมายความว่าพวกมันเข้าใจความหมายหรือบริบทของโลกแห่งความเป็นจริง พวกมันทำงานได้ดีในการจัดการไวยากรณ์ แต่ยังคงมีข้อจำกัดเมื่อพูดถึงความหมาย

อะไรที่นับเป็นปัญญา?

การถกเถียงกันสุดท้ายมาถึงคำถามว่าเรากำหนดปัญญาได้อย่างไร หากปัญญาเป็นความสามารถในการสร้างภาษาที่สอดคล้อง แก้ปัญหา และปรับตัวเข้ากับสถานการณ์ใหม่ๆ แล้ว LLMs ก็บรรลุมาตรฐานนี้แล้ว อย่างไรก็ตาม หากปัญญาต้องมีการตระหนักรู้ตัวเอง ความเข้าใจที่แท้จริง หรือประสบการณ์เชิงอัตวิสัย ระบบเหล่านี้ยังคงไม่เพียงพอ

ความยากคือเราไม่มีวิธีการวัดคุณสมบัติเช่นความเข้าใจหรือความตระหนักรู้ที่ชัดเจนหรือเป็นกลาง ในทั้งมนุษย์และเครื่องจักร เราอนุมานสิ่งเหล่านี้จากพฤติกรรม ทัวริงทดสอบและทดสอบเป็ดเคยให้คำตอบที่ง่ายแก่เรา แต่ในยุคของ LLMs อาจไม่เพียงพอแล้ว ความสามารถของพวกมันบังคับให้เราต้องคิดใหม่ว่าอะไรที่แท้จริงนับเป็นปัญญา และว่าคำจำกัดความดั้งเดิมของเรากำลังตามทันความเป็นจริงทางเทคโนโลยีหรือไม่

สรุป

โมเดลภาษาขนาดใหญ่กำลังท้าทายวิธีการที่เรากำหนดปัญญา AI พวกมันสามารถเลียนแบบการให้เหตุผล สร้างความคิด และทำภารกิจที่เคยถูกมองว่าเป็นเอกสิทธิ์ของมนุษย์ แต่พวกมันขาดการตระหนักรู้และพื้นฐานที่กำหนดการคิดเหมือนมนุษย์ที่แท้จริง การเพิ่มขึ้นของพวกมันบังคับให้เราต้องถามไม่เพียงแต่ว่าเครื่องจักรทำงานอย่างฉลาดเท่านั้น แต่ยังถามว่าปัญญาเองหมายถึงอะไรจริงๆ

ดร. Tehseen Zia เป็น Professor ที่ COMSATS University Islamabad โดยได้รับ PhD ใน AI จาก Vienna University of Technology, Austria มีเชี่ยวชาญด้าน Artificial Intelligence, Machine Learning, Data Science, และ Computer Vision โดยมีส่วนร่วมที่สำคัญด้วยการเผยแพร่ในวารสารวิทยาศาสตร์ที่มีชื่อเสียง ดร. Tehseen ยังได้ดำเนินโครงการอุตสาหกรรมต่างๆ ในฐานะ Principal Investigator และให้บริการเป็นที่ปรึกษาด้าน AI