ปัญญาประดิษฐ์

ภาพลวงของการให้เหตุผล AI: ทำไม Chain-of-Thought อาจไม่ใช่สิ่งที่เราคิด

mm

โมเดลภาษาขนาดใหญ่ (LLMs) ได้ทำให้เราประทับใจด้วยความสามารถในการแก้ปัญหาเชิงซ้อนแบบขั้นตอนต่อขั้นตอน เมื่อเราขอให้ LLMs แก้ปัญหาเลขคณิต พวกมันจะแสดงขั้นตอนการทำงานแบบทีละขั้นตอนก่อนที่จะให้คำตอบ นี่คือวิธีการที่เรียกว่า Chain-of-Thought (CoT) reasoning ซึ่งทำให้ระบบ AI ดูเหมือนมีการคิดเชิงตรรกะมากขึ้น แต่สิ่งที่เกิดขึ้นถ้าความสามารถในการให้เหตุผลนี้เป็นเพียงภาพลวงเท่านั้น การวิจัยใหม่จาก Arizona State University เสนอว่าสิ่งที่ดูเหมือนเป็นการให้เหตุผลเชิงตรรกะอาจเป็นเพียงเทคนิคการค้นหาความสัมพันธ์แบบซับซ้อน ในบทความนี้ เราจะสำรวจการค้นพบและวิเคราะห์ผลกระทบต่อการออกแบบ การประเมิน และความเชื่อมั่นในระบบ AI

ปัญหากับการเข้าใจในปัจจุบัน

การให้เหตุผลแบบ Chain-of-Thought ได้กลายเป็นหนึ่งในความก้าวหน้าที่ได้รับการยอมรับมากที่สุดในด้านการให้เหตุผล AI มันทำให้โมเดลสามารถแก้ปัญหาได้ตั้งแต่ปัญหาเลขคณิตไปจนถึงปัญหาเชิงตรรกะโดยการแสดงขั้นตอนการทำงานแบบทีละขั้นตอน ความสามารถในการให้เหตุผลที่ดูเหมือนจริงนี้ทำให้หลายคนเชื่อว่าระบบ AI กำลังพัฒนาความสามารถในการให้เหตุผลเชิงตรรกะที่คล้ายกับการคิดของมนุษย์ อย่างไรก็ตาม นักวิจัยได้เริ่มที่จะสงสัยความเชื่อนี้

ในงานวิจัยล่าสุด พวกเขาได้สังเกตเห็นว่าเมื่อถูกถามคำถาม เช่น ว่าสหรัฐอเมริกาก่อตั้งขึ้นในปีศักราชที่เป็นปี闰หรือปีธรรมดา LLMs ให้คำตอบที่ไม่สอดคล้องกัน แม้ว่าพวกเขาจะระบุเหตุผลที่ 1776 หารด้วย 4 ลงตัวและระบุว่าเป็นปี闰 แต่โมเดลเหล่านั้นก็ยังคงสรุปว่าสหรัฐอเมริกาก่อตั้งขึ้นในปีธรรมดา ในกรณีนี้ โมเดลแสดงให้เห็นถึงความรู้เกี่ยวกับกฎและแสดงขั้นตอนการทำงานเชิงตรรกะ แต่ไปถึงข้อสรุปที่ขัดแย้งกัน

ตัวอย่างเหล่านี้ชี้ให้เห็นว่าอาจมีช่องว่างพื้นฐานระหว่างสิ่งที่ดูเหมือนจะเป็นการให้เหตุผลและความสามารถในการให้เหตุผลเชิงตรรกะที่แท้จริง

มุมมองใหม่ในการเข้าใจการให้เหตุผล AI

นวัตกรรมหลักของการวิจัยนี้คือการนำ “เลนส์การกระจายข้อมูล” มาใช้เพื่อตรวจสอบการให้เหตุผลแบบ Chain-of-Thought นักวิจัยได้สมมติฐานว่าการให้เหตุผลแบบ CoT เป็นเทคนิคการค้นหาความสัมพันธ์แบบซับซอนที่ทำงานบนความสัมพันธ์ทางสถิติในข้อมูลการฝึกอบรม มากกว่าการให้เหตุผลเชิงตรรกะที่แท้จริง โมเดลจะสร้างเส้นทางการให้เหตุผลที่ใกล้เคียงกับสิ่งที่เคยเห็นมาก่อน มากกว่าการดำเนินการเชิงตรรกะ

เพื่อทดสอบสมมติฐานนี้ นักวิจัยได้สร้าง DataAlchemy ซึ่งเป็นสภาพแวดล้อมการทดลองที่ควบคุมได้ แทนที่จะทดสอบ LLMs ที่มีประวัติการฝึกอบรมที่ซับซ้อน พวกเขาฝึกโมเดลที่เล็กกว่าจากศูนย์บนงานที่ออกแบบอย่างรอบคอบ วิธีการนี้จะกำจัดความซับซ้อนของการฝึกอบรมขนาดใหญ่และทำให้สามารถทดสอบการทำงานของโมเดลได้อย่างเป็นระบบ

นักวิจัยได้เน้นไปที่งานที่เกี่ยวข้องกับการเปลี่ยนแปลงลำดับของตัวอักษร ตัวอย่างเช่น พวกเขาได้สอนโมเดลให้ใช้การดำเนินการ เช่น การหมุนตัวอักษรในตัวอักษร (A กลายเป็น N, B กลายเป็น O) หรือการเปลี่ยนตำแหน่งในลำดับ (APPLE กลายเป็น EAPPL) โดยการรวมการดำเนินการเหล่านี้ นักวิจัยได้สร้างเส้นทางการให้เหตุผลที่มีความซับซ้อนต่างๆ นี่ทำให้พวกเขาได้รับประโยชน์จากความแม่นยำ พวกเขาสามารถควบคุมสิ่งที่โมเดลได้เรียนรู้ระหว่างการฝึกอบรมและทดสอบว่าพวกมันสามารถทั่วไปได้ดีเพียงใดในสถานการณ์ใหม่

เมื่อการให้เหตุผล AI ล้มเหลว

นักวิจัยได้ทดสอบการให้เหตุผลแบบ CoT ในสามมิติที่สำคัญที่สุด ซึ่งอาจแตกต่างจากข้อมูลการฝึกอบรม

การทั่วไปของงาน ตรวจสอบว่าโมเดลสามารถจัดการกับปัญหาใหม่ที่ไม่เคยพบมาก่อน เมื่อทดสอบการแปลงที่เหมือนกับข้อมูลการฝึกอบรม โมเดลบรรลุผลการทำงานที่สมบูรณ์แบบ อย่างไรก็ตาม การเปลี่ยนแปลงเล็กน้อยทำให้ความสามารถในการให้เหตุผลล้มเหลวอย่างมาก แม้ว่างานใหม่จะเป็นการรวมการดำเนินการแบบที่คุ้นเคย โมเดลก็ล้มเหลวในการใช้แบบแผนที่ได้เรียนรู้อย่างถูกต้อง

ข้อค้นพบที่น่ากังวลที่สุดคือว่าโมเดลมักจะสร้างขั้นตอนการให้เหตุผลที่มีรูปแบบที่สมบูรณ์แบบและดูเหมือนเชิงตรรกะ แต่นำไปสู่คำตอบที่ไม่ถูกต้อง ในบางกรณี พวกมันสร้างคำตอบที่ถูกต้องโดยบังเอิญในขณะที่ติดตามเส้นทางการให้เหตุผลที่ไม่ถูกต้อง สิ่งเหล่านี้ชี้ให้เห็นว่าโมเดลจับคู่รูปแบบพื้นผิวมากกว่าการเข้าใจตรรกะที่แท้จริง

การขยายความยาว ทดสอบว่าโมเดลสามารถจัดการกับเส้นทางการให้เหตุผลที่ยาวหรือสั้นกว่าที่พบในข้อมูลการฝึกอบรมได้หรือไม่ นักวิจัยพบว่าโมเดลที่ฝึกอบรมด้วยความยาว 4 ล้มเหลวอย่างสมบูรณ์เมื่อทดสอบด้วยความยาว 3 หรือ 5 แม้ว่าจะเป็นการเปลี่ยนแปลงเล็กน้อยก็ตาม นอกจากนี้ โมเดลจะพยายามบังคับให้การให้เหตุผลของตนเองเข้ากับรูปแบบความยาวที่คุ้นเคยโดยการเพิ่มหรือลบขั้นตอนอย่างไม่เหมาะสม

การขยายรูปแบบ ประเมินความไวต่อการเปลี่ยนแปลงพื้นผิวของปัญหา แม้ว่าการเปลี่ยนแปลงเล็กน้อย เช่น การแทรกโทเค็นเสียงหรือการปรับเปลี่ยนโครงสร้างคำถามก็ทำให้ประสิทธิภาพลดลงอย่างมาก สิ่งนี้เปิดเผยว่าโมเดลขึ้นอยู่กับรูปแบบการฝึกอบรมอย่างไร

ปัญหาแห่งความเปราะบาง

ทั่วทั้งสามมิติ การวิจัยได้แสดงรูปแบบที่สอดคล้องกัน: การให้เหตุผลแบบ CoT ทำงานได้ดีเมื่อนำไปใช้กับข้อมูลที่คล้ายกับข้อมูลการฝึกอบรม แต่จะล้มเหลวและเสี่ยงต่อการล้มเหลวเมื่อเผชิญกับการเปลี่ยนแปลงการกระจายที่เหมาะสม ความสามารถในการให้เหตุผลที่ดูเหมือนจริงนี้เป็น “ภาพลวงที่เปราะบาง” ที่หายไปเมื่อโมเดลพบกับสภาพแวดล้อมที่ไม่คุ้นเคย

ความเปราะบางนี้สามารถแสดงออกมาได้หลายรูปแบบ โมเดลสามารถสร้างเส้นทางการให้เหตุผลที่ดูเหมือนจริงและถูกต้อง แต่ผิดพลาด โมเดลอาจติดตามรูปแบบเชิงตรรกะที่สมบูรณ์แบบในขณะที่พลาดการเชื่อมต่อเชิงตรรกะพื้นฐาน บางครั้งพวกมันสร้างคำตอบที่ถูกต้องโดยบังเอิญในขณะที่แสดงกระบวนการให้เหตุผลที่มีข้อบกพร่อง

การวิจัยยังแสดงให้เห็นว่าการฝึกอบรมแบบกำกับบนข้อมูลใหม่ในปริมาณเล็กน้อยสามารถฟื้นฟูประสิทธิภาพได้อย่างรวดเร็ว แต่นี่เพียงเพิ่มความสามารถในการจับคู่รูปแบบของโมเดลเท่านั้น ไม่ได้พัฒนาความสามารถในการให้เหตุผลที่แท้จริง

ผลกระทบในโลกแห่งความเป็นจริง

การค้นพบเหล่านี้อาจมีผลกระทบอย่างรุนแรงต่อวิธีการที่เรานำระบบ AI ไปใช้และไว้วางใจ ในโดเมนที่มีความเสี่ยงสูง เช่น การแพทย์ การเงิน หรือการวิเคราะห์ทางกฎหมาย ความสามารถในการสร้างการให้เหตุผลที่ดูเหมือนจริงแต่ผิดพลาดอาจเป็นอันตรายมากกว่าคำตอบที่ไม่ถูกต้องทั่วไป การมาถึงของการคิดเชิงตรรกะอาจทำให้ผู้ใช้วางใจในข้อสรุปของ AI มากเกินไป

การวิจัยนี้แนะนำแนวทางสำคัญสำหรับผู้ปฏิบัติงาน AI อันดับแรก องค์กรไม่ควรปฏิบัติต่อ CoT เป็นวิธีแก้ปัญหาแบบสากล วิธีการทดสอบมาตรฐานที่ใช้ข้อมูลที่คล้ายกับข้อมูลการฝึกอบรมไม่เพียงพอสำหรับการประเมินความสามารถในการให้เหตุผลที่แท้จริง แทนที่จะทดสอบการกระจายที่เหมาะสมเพื่อทำความเข้าใจข้อจำกัดของโมเดล

ที่สอง การมีแนวโน้มของโมเดลในการสร้าง “ความไร้สาระที่ดูเหมือนจริง” ต้องการการดูแลอย่างรอบคอบโดยมนุษย์ โดยเฉพาะอย่างยิ่งในแอปพลิเคชันที่สำคัญ โครงสร้างที่สอดคล้องกันของเส้นทางการให้เหตุผลที่ AI สร้างขึ้นอาจซ่อนข้อผิดพลาดเชิงตรรกะพื้นฐานที่อาจไม่เห็นได้ทันที

มองไปไกลกว่าการค้นหาความสัมพันธ์

อาจเป็นสิ่งสำคัญที่สุด การวิจัยนี้ท้าทายชุมชน AI ให้พัฒนาไปไกลกว่าการปรับปรุงพื้นผิวและพัฒนาระบบที่มีความสามารถในการให้เหตุผลที่แท้จริง วิธีการปัจจุบันที่พึ่งพาการขยายข้อมูลและพารามิเตอร์อาจถูกจำกัดโดยพื้นฐานหากเป็นเพียงระบบการค้นหาความสัมพันธ์ที่ซับซ้อน

งานนี้ไม่ลดความมีประโยชน์เชิงปฏิบัติของระบบ AI ปัจจุบัน การค้นหาความสัมพันธ์ขนาดใหญ่สามารถมีประสิทธิภาพมากสำหรับหลายแอปพลิเคชัน อย่างไรก็ตาม มันเน้นย้ำถึงความสำคัญของการเข้าใจธรรมชาติที่แท้จริงของความสามารถเหล่านี้ มากกว่าการให้เครดิตการให้เหตุผลเชิงมนุษย์โดยไม่มีเหตุผล

เส้นทางไปข้างหน้า

การวิจัยนี้เปิดคำถามสำคัญเกี่ยวกับอนาคตของการให้เหตุผล AI หากวิธีการปัจจุบันถูกจำกัดโดยพื้นฐานโดยการกระจายข้อมูลฝึกอบรม วิธีการทางเลือกใดที่อาจนำไปสู่ความสามารถในการให้เหตุผลที่มีประสิทธิภาพมากขึ้นได้บ้าง เราจะพัฒนาวิธีการประเมินที่แยกแยะระหว่างการค้นหาความสัมพันธ์และการให้เหตุผลเชิงตรรกะที่แท้จริงได้อย่างไร

การค้นพบเหล่านี้ยังเน้นย้ำถึงความสำคัญของความโปร่งใสและประเมินที่เหมาะสมในการพัฒนา AI เมื่อระบบเหล่านี้กลายเป็นระบบที่ซับซ้อนและผลลัพธ์ที่น่าเชื่อถือมากขึ้น ช่องว่างระหว่างความสามารถที่ดูเหมือนจริงและความสามารถที่แท้จริงอาจกลายเป็นอันตรายมากขึ้นหากไม่เข้าใจอย่างถูกต้อง

สรุป

การให้เหตุผลแบบ Chain-of-Thought ใน LLMs มักสะท้อนให้เห็นถึงการค้นหาความสัมพันธ์มากกว่าการให้เหตุผลเชิงตรรกะที่แท้จริง ในขณะที่ผลลัพธ์อาจดูเหมือนน่าเชื่อถือ แต่ก็สามารถล้มเหลวได้ภายใต้สภาพแวดล้อมใหม่ ทำให้เกิดความกังวลในด้านสำคัญ เช่น การแพทย์ กฎหมาย และวิทยาศาสตร์ การวิจัยนี้เน้นย้ำถึงความจำเป็นในการทดสอบที่ดีขึ้นและวิธีการที่เชื่อถือได้มากขึ้นในการให้เหตุผล AI

ดร. Tehseen Zia เป็น Professor ที่ COMSATS University Islamabad โดยได้รับ PhD ใน AI จาก Vienna University of Technology, Austria มีเชี่ยวชาญด้าน Artificial Intelligence, Machine Learning, Data Science, และ Computer Vision โดยมีส่วนร่วมที่สำคัญด้วยการเผยแพร่ในวารสารวิทยาศาสตร์ที่มีชื่อเสียง ดร. Tehseen ยังได้ดำเนินโครงการอุตสาหกรรมต่างๆ ในฐานะ Principal Investigator และให้บริการเป็นที่ปรึกษาด้าน AI