ปัญญาประดิษฐ์

นักวิจัยมองหาสัตว์เพื่อให้ระบบการเรียนรู้แบบเสริมแรงมีสามัญสำนึก

Published October 26, 2020

Updated April 28, 2026

Daniel Nelson

นักวิจัยด้านปัญญาประดิษฐ์จากสถาบันเช่น Imperial College London, University of Cambridge และ Google DeepMind กำลังมองหาสัตว์เป็นแรงบันดาลใจในการปรับปรุงประสิทธิภาพของระบบการเรียนรู้แบบเสริมแรง ในบทความร่วม ที่เผยแพร่ใน CellPress Reviews เรื่อง “ปัญญาประดิษฐ์และสามัญสำนึกของสัตว์” นักวิจัยแย้งว่าความเข้าใจของสัตว์ให้มาเป็นมาตรฐานและวิธีการประเมินที่มีประโยชน์สำหรับตัวแทนการเรียนรู้แบบเสริมแรง และยังสามารถบอกแนวทางในการออกแบบงานและสภาพแวดล้อมได้

นักวิจัยและวิศวกรด้านปัญญาประดิษฐ์มองหาสัญญาณทางชีววิทยาจากเครือข่ายประสาทเพื่อสร้างอัลกอริทึม โดยใช้หลักการจากวิทยาศาสตร์พฤติกรรมและประสาทวิทยาศาสตร์ในการกำหนดโครงสร้างของอัลกอริทึม ยังคงมีการใช้สัญญาณจากสาขาประสาทวิทยาศาสตร์และพฤติกรรมวิทยามากจากมนุษย์ โดยมีการมุ่งเน้นไปที่เด็กเล็กและทารก นักวิจัยด้านปัญญาประดิษฐ์ยังไม่ได้รับแรงบันดาลใจจากแบบจำลองสัตว์มากนัก แต่ความเข้าใจของสัตว์เป็นทรัพยากรที่ยังไม่ได้ถูกใช้ซึ่งมีศักยภาพที่จะนำไปสู่การทำความเข้าใจที่สำคัญในพื้นที่การเรียนรู้แบบเสริมแรง

ระบบการเรียนรู้แบบเสริมแรงที่ลึกถูกฝึกผ่านกระบวนการลองผิดลองถูก โดยมีการเสริมแรงด้วยรางวัลเมื่อตัวแทนการเรียนรู้แบบเสริมแรงเข้าใกล้ในการทำเป้าหมายที่ต้องการ ซึ่งคล้ายกับการสอนสัตว์ให้ทำตามที่ต้องการโดยใช้อาหารเป็นรางวัล นักชีววิทยาและผู้เชี่ยวชาญด้านความเข้าใจของสัตว์ได้ทำการทดลองมากมาย ในการประเมินความสามารถทางปัญญา ของสัตว์ต่างๆ รวมถึงสุนัข หมี สัตว์ป่า หมู นกกา ปลโลมา แมว หนู ช้าง และปลาหมึก มีสัตว์หลายชนิดที่แสดงให้เห็นถึงความฉลาดที่น่าประทับใจ และสัตว์บางชนิด เช่น ช้างและปลโลมา อาจมีทฤษฎีของจิตใจ

การดูกลุ่มงานวิจัยที่ทำเกี่ยวกับความเข้าใจของสัตว์อาจสร้างแรงบันดาลใจให้นักวิจัยด้านปัญญาประดิษฐ์พิจารณาปัญหาจากมุมมองที่แตกต่าง เมื่อการเรียนรู้แบบเสริมแรงที่ลึกกลายเป็นพลังงานและซับซ้อนมากขึ้น นักวิจัยด้านปัญญาประดิษฐ์ที่เชี่ยวชาญในสาขานี้กำลังมองหาวิธีการทดสอบความสามารถทางปัญญาของตัวแทนการเรียนรู้แบบเสริมแรง ในบทความวิจัย ทีมวิจัยอ้างถึงประเภทของการทดลองที่ทำกับลิงและนก โดยกล่าวว่าพวกเขาตั้งเป้าที่จะออกแบบระบบที่สามารถทำได้เหมือนกับงานเหล่านั้น โดยให้ปัญญาประดิษฐ์มี “สามัญสำนึก” ชนิดหนึ่ง ตามที่ผู้เขียนบทความวิจัยระบุว่า “พวกเขาเสนอแนวทางในการที่ตัวแทนการเรียนรู้แบบเสริมแรง โดยอาจมีสถาปัตยกรรมที่ยังไม่ได้พัฒนา จะได้รับสิ่งที่จำเป็นผ่านการโต้ตอบที่ยาวนานกับสภาพแวดล้อมเสมือนจริงที่มีรายละเอียด”

ตามที่ VentureBeat รายงาน นักวิจัยด้านปัญญาประดิษฐ์แย้งว่าสามัญสำนึกไม่ใช่ลักษณะเฉพาะของมนุษย์ และขึ้นอยู่กับการเข้าใจคุณสมบัติพื้นฐานของโลกทางกายภาพ เช่น วัตถุอยู่ที่ไหนและพื้นที่ใด ไร้ข้อจำกัดในการเคลื่อนไหวของวัตถุ และการประเมินผลกระทบ สัตว์แสดงลักษณะเหล่านี้ในการศึกษาทางห้องปฏิบัติการ ตัวอย่างเช่น นกกาเข้าใจว่าวัตถุเป็นของถาวร เพราะพวกมันสามารถหามะเขือได้แม้ว่ามันจะถูกปิดบังด้วยวัตถุอื่น

เพื่อให้ระบบการเรียนรู้แบบเสริมแรงมีคุณสมบัติเหล่านี้ นักวิจัยแย้งว่าพวกเขาจะต้องสร้างงานที่เมื่อรวมกับสถาปัตยกรรมที่เหมาะสม จะสร้างตัวแทนการเรียนรู้ที่สามารถถ่ายทอดหลักการเรียนรู้ไปยังงานอื่นได้ นักวิจัยแย้งว่าการฝึกอบรมสำหรับแบบจำลองดังกล่าวควรใช้เทคนิคที่ต้องการให้ตัวแทนการเรียนรู้เข้าใจแนวคิดหลังจากได้รับเพียงไม่กี่ตัวอย่าง ซึ่งเรียกว่าการฝึกอบรมแบบไม่กี่ช็อต ซึ่งตรงกันข้ามกับการทดสอบแบบคลาสสิกที่ต้องใช้หลายร้อยหรือหลายพันครั้งในการฝึกอบรมตัวแทนการเรียนรู้แบบเสริมแรง

ทีมวิจัยอธิบายต่อไปว่าในขณะที่ตัวแทนการเรียนรู้แบบเสริมแรงสมัยใหม่บางตัวสามารถเรียนรู้เพื่อแก้ปัญหาหลายอย่าง บางอย่างต้องใช้การถ่ายทอดหลักการเรียนรู้ แต่ก็ไม่ชัดเจนว่าตัวแทนการเรียนรู้แบบเสริมแรงสามารถเรียนรู้แนวคิดที่เป็นนามธรรม เช่น “สามัญสำนึก” ได้หรือไม่ หากมีตัวแทนการเรียนรู้ที่อาจเรียนรู้แนวคิดดังกล่าวได้ พวกเขาจะต้องมีการทดสอบที่สามารถระบุได้ว่าตัวแทนการเรียนรู้แบบเสริมแรงเข้าใจแนวคิดเรื่องภาชนะหรือไม่

DeepMind โดยเฉพาะอย่างยิ่ง ตื่นเต้นที่จะเข้าร่วมในการพัฒนาวิธีการทดสอบตัวแทนการเรียนรู้แบบเสริมแรงที่หลากหลายและแตกต่าง ในการประชุม Stanford HAI ที่จัดขึ้นเมื่อต้นเดือนตุลาคมที่ผ่านมา Matthew Botvinick หัวหน้าฝ่ายวิจัยด้านประสาทวิทยาศาสตร์ของ DeepMind ขอร้องให้นักวิจัยและวิศวกรด้านการเรียนรู้ของเครื่องจักรทำงานร่วมกันมากขึ้นในด้านวิทยาศาสตร์อื่นๆ Botvinick เน้นย้ำถึงความสำคัญของการทำงานร่วมกันระหว่างสาขาวิชาต่างๆ กับนักจิตวิทยาและประสาทวิทยาศาสตร์สำหรับสาขาปัญญาประดิษฐ์ ในการบรรยายเรื่อง “Triangulating Intelligence: Melding Neuroscience, Psychology, and AI”

Daniel Nelson

นักบล็อกและโปรแกรมเมอร์ที่มีความเชี่ยวชาญใน Machine Learning และ Deep Learning หัวข้อ Daniel หวังที่จะช่วยให้ผู้อื่นใช้พลังของ AI สำหรับสิ่งที่ดี

Unite.AI

นักวิจัยมองหาสัตว์เพื่อให้ระบบการเรียนรู้แบบเสริมแรงมีสามัญสำนึก

You may like