AI 101

Meta-Learning āļ„āļ·āļ­āļ­āļ°āđ„āļĢ?

mm

Meta-Learning คืออะไร?

หนึ่งในพื้นที่การวิจัยที่เติบโตเร็วที่สุดในด้านการเรียนรู้ของเครื่องจักร คือ พื้นที่ของ การเรียนรู้ระดับเมต้า การเรียนรู้ระดับเมต้า ในบริบทของการเรียนรู้ของเครื่องจักร คือ การใช้แอลกอริทึมการเรียนรู้ของเครื่องจักรเพื่อช่วยในการฝึกอบรมและปรับให้เหมาะสมของแบบจำลองการเรียนรู้ของเครื่องจักรอื่น ๆ เมื่อการเรียนรู้ระดับเมต้ากำลังได้รับความนิยมมากขึ้นและเทคนิคการเรียนรู้ระดับเมต้ากำลังถูกพัฒนามากขึ้น จึงมีประโยชน์ที่จะมีความเข้าใจเกี่ยวกับสิ่งที่การเรียนรู้ระดับเมต้าเป็นและจะมีความรู้สึกเกี่ยวกับวิธีการใช้งานที่หลากหลาย มาทำความเข้าใจกับแนวคิดเบื้องหลังการเรียนรู้ระดับเมต้า ประเภทของการเรียนรู้ระดับเมต้า เช่นเดียวกับวิธีการใช้งานการเรียนรู้ระดับเมต้าบางอย่าง

คำว่าการเรียนรู้ระดับเมต้าถูกสร้างขึ้นโดย Donald Maudsley เพื่ออธิบายกระบวนการที่ผู้คนเริ่มกำหนดสิ่งที่พวกเขาเรียนรู้ โดยกลายเป็น “การควบคุมที่เพิ่มขึ้นของนิสัยการรับรู้ การสืบค้น การเรียนรู้ และการเติบโตที่พวกเขาได้ทำการฝังไว้” ต่อมานักวิทยาศาสตร์ทางจิตวิทยาและนักจิตวิทยาได้อธิบายการเรียนรู้ระดับเมต้าว่าเป็น “การเรียนรู้วิธีการเรียนรู้”

สำหรับการเรียนรู้ของเครื่องจักรแบบเมต้า แนวคิดทั่วไปของ “การเรียนรู้วิธีการเรียนรู้” ถูกนำไปใช้กับระบบ AI ระบบ AI มักจะต้องได้รับการฝึกอบรมเพื่อทำภารกิจผ่านการทำภารกิจย่อย ๆ จำนวนมาก การฝึกอบรมนี้อาจใช้เวลานาน และตัวแทน AI ไม่สามารถถ่ายทอดความรู้ที่ได้รับจากภารกิจหนึ่งไปยังภารกิจอื่นได้ง่าย ๆ การสร้างแบบจำลองและเทคนิคการเรียนรู้ระดับเมต้าสามารถช่วยให้ AI เรียนรู้วิธีการเรียนรู้และพัฒนาทักษะใหม่ ๆ ได้เร็วขึ้น

ประเภทของการเรียนรู้ระดับเมต้า

การเรียนรู้ระดับเมต้าแบบ Optimizer

การเรียนรู้ระดับเมต้า thườngถูกใช้เพื่อปรับให้เหมาะสมของประสิทธิภาพของเครือข่ายประสาทเทียมที่มีอยู่แล้ว วิธีการเรียนรู้ระดับเมต้าแบบ Optimizer มักจะทำงานโดยการปรับพารามิเตอร์ของเครือข่ายประสาทเทียมอื่นเพื่อปรับปรุงประสิทธิภาพของเครือข่ายประสาทเทียมหลัก ผลลัพธ์คือเครือข่ายประสาทเทียมที่เป้าหมายควรจะดีขึ้นในการทำภารกิจที่ได้รับการฝึกอบรม ตัวอย่างหนึ่งของการเรียนรู้ระดับเมต้าแบบ Optimizer คือการใช้เครือข่ายเพื่อปรับปรุง การลื่นไถลของความชัน

การเรียนรู้ระดับเมต้าแบบ Few-Shots

การเรียนรู้ระดับเมต้าแบบ Few-Shots คือการออกแบบเครือข่ายประสาทเทียมลึกที่สามารถทั่วไปจากชุดข้อมูลฝึกอบรมไปยังชุดข้อมูลที่ไม่เคยเห็นมาก่อน ตัวอย่างของการเรียนรู้ระดับเมต้าแบบ Few-Shots คือการเรียนรู้แบบ Few-Shots ที่คล้ายกับการเรียนรู้แบบปกติ แต่แทนการใช้ข้อมูลตัวอย่างที่เป็นชุดข้อมูลทั้งหมด แบบจำลองจะถูกฝึกอบรมบนหลายภารกิจ/ชุดข้อมูลและจากนั้นจะถูกปรับให้เหมาะสมสำหรับการทำงานสูงสุดบนภารกิจฝึกอบรมและข้อมูลที่ไม่เคยเห็นมาก่อน

ในแบบ Few-Shots การเรียนรู้ระดับเมต้าแบบ Few-Shots มีแนวคิดที่ว่าตัวอย่างการฝึกอบรมแต่ละตัวอย่างมีขนาดเล็กและเครือข่ายสามารถเรียนรู้เพื่อระบุวัตถุหลังจากที่เห็นเพียงไม่กี่รูปภาพเท่านั้น ซึ่งคล้ายกับวิธีที่เด็กเรียนรู้เพื่อแยกแยะวัตถุหลังจากที่เห็นเพียงไม่กี่รูปภาพเท่านั้น วิธีการนี้ได้ถูกใช้เพื่อสร้างเทคนิคเช่นแบบจำลองการสร้างแบบหนึ่งและเครือข่ายประสาทเทียมที่มีการเพิ่มหน่วยความจำ

การเรียนรู้ระดับเมต้าแบบ Metric

การเรียนรู้ระดับเมต้าแบบ Metric คือการใช้เครือข่ายประสาทเทียมเพื่อกำหนดว่าเมตริกที่ใช้กำลังทำงานได้อย่างมีประสิทธิภาพหรือไม่ และเครือข่ายหรือเครือข่ายที่กำลังใช้เมตริกที่กำหนดหรือไม่ การเรียนรู้ระดับเมต้าแบบ Metric คล้ายกับการเรียนรู้แบบ Few-Shots ในที่ที่ใช้เพียงไม่กี่ตัวอย่างในการฝึกอบรมเครือข่ายและทำให้เครือข่ายเรียนรู้พื้นที่เมตริก

การเรียนรู้ระดับเมต้าแบบ Recurrent Model

การเรียนรู้ระดับเมต้าแบบ Recurrent Model คือการนำเทคนิคการเรียนรู้ระดับเมต้ามาใช้กับเครือข่ายประสาทเทียมแบบ Recurrent และเครือข่ายประสาทเทียมแบบ Long Short-Term Memory เทคนิคนี้ทำงานโดยการฝึกอบรมแบบจำลอง RNN/LSTM เพื่อเรียนรู้ชุดข้อมูลทีละขั้นตอนและจากนั้นใช้แบบจำลองที่ฝึกอบรมแล้วเป็นพื้นฐานสำหรับการเรียนรู้อื่น ๆ ตัวเรียนรู้ระดับเมต้าจะรับอัลกอริทึมการปรับให้เหมาะสมที่ใช้ในการฝึกอบรมแบบจำลองแรก พารามิเตอร์ที่สืบทอดของตัวเรียนรู้ระดับเมต้าทำให้สามารถเริ่มต้นและเข้าใกล้ค่าเหมาะสมได้อย่างรวดเร็ว แต่ยังคงสามารถอัปเดตสำหรับสถานการณ์ใหม่ ๆ

การเรียนรู้ระดับเมต้าทำงานอย่างไร?

วิธีการที่แน่นอนของการเรียนรู้ระดับเมต้าจะแตกต่างกันไปตามแบบจำลองและลักษณะของภารกิจที่มอบหมาย อย่างไรก็ตาม โดยทั่วไปแล้ว การเรียนรู้ระดับเมต้าจะเกี่ยวข้องกับการคัดลอกพารามิเตอร์ของเครือข่ายแรกไปยังพารามิเตอร์ของเครือข่ายที่สอง/ตัวปรับให้เหมาะสม

มีกระบวนการฝึกอบรมสองกระบวนการในระหว่างการเรียนรู้ระดับเมต้า โดยทั่วไปแล้ว แบบจำลองการเรียนรู้ระดับเมต้าจะถูกฝึกอบรมหลังจากที่ได้ทำการฝึกอบรมแบบจำลองหลักหลายขั้นตอนแล้ว หลังจากที่ทำการฝึกอบรมไปข้างหน้า ข้างหลัง และการปรับให้เหมาะสมที่ฝึกอบรมแบบจำลองหลักแล้ว จะทำการฝึกอบรมไปข้างหน้าสำหรับตัวปรับให้เหมาะสม ตัวอย่างเช่น หลังจากที่ทำการฝึกอบรมแบบจำลองหลักสามหรือสี่ขั้นตอน จะคำนวณค่าความสูญเสียระดับเมต้า หลังจากที่คำนวณค่าความสูญเสียระดับเมต้าแล้ว จะคำนวณค่าอนุพันธ์ของพารามิเตอร์ระดับเมต้าสำหรับแต่ละพารามิเตอร์ หลังจากที่เกิดขึ้น จะอัปเดตพารามิเตอร์ระดับเมต้าในตัวปรับให้เหมาะสม

หนึ่งในความเป็นไปได้ในการคำนวณค่าความสูญเสียระดับเมต้า คือ การทำการฝึกอบรมไปข้างหน้าแบบจำลองหลักและจากนั้นรวมค่าความสูญเสียที่ได้คำนวณไว้แล้ว ตัวปรับให้เหมาะสมระดับเมต้าอาจเป็นตัวเรียนรู้ระดับเมต้าอีกตัวหนึ่ง แม้ว่าในจุดหนึ่ง ตัวปรับให้เหมาะสมแบบไม่ต่อเนื่อง เช่น ADAM หรือ SGD จะต้องถูกใช้

แบบจำลองการเรียนรู้ลึกหลายแบบอาจมีพารามิเตอร์หลายแสนหรือหลายล้านพารามิเตอร์ การสร้างตัวเรียนรู้ระดับเมต้าที่มีชุดพารามิเตอร์ใหม่ทั้งหมดจะใช้เวลาคอมพิวเตอร์มาก และด้วยเหตุนี้ จึงใช้กลยุทธ์ที่เรียกว่า การแบ่งพารามิเตอร์ การแบ่งพารามิเตอร์เกี่ยวข้องกับการออกแบบตัวเรียนรู้ระดับเมต้า/ตัวปรับให้เหมาะสมเพื่อให้เรียนรู้พารามิเตอร์เดียวจากแบบจำลองหลักและจากนั้นเพียงแค่คัดลอกพารามิเตอร์นั้นแทนที่พารามิเตอร์ทั้งหมด ผลลัพธ์คือพารามิเตอร์ที่ตัวปรับให้เหมาะสมมีไม่ขึ้นอยู่กับพารามิเตอร์ของแบบจำลอง

āļ™āļąāļāļšāļĨāđ‡āļ­āļāđāļĨāļ°āđ‚āļ›āļĢāđāļāļĢāļĄāđ€āļĄāļ­āļĢāđŒāļ—āļĩāđˆāļĄāļĩāļ„āļ§āļēāļĄāđ€āļŠāļĩāđˆāļĒāļ§āļŠāļēāļāđƒāļ™ Machine Learning āđāļĨāļ° Deep Learning āļŦāļąāļ§āļ‚āđ‰āļ­ Daniel āļŦāļ§āļąāļ‡āļ—āļĩāđˆāļˆāļ°āļŠāđˆāļ§āļĒāđƒāļŦāđ‰āļœāļđāđ‰āļ­āļ·āđˆāļ™āđƒāļŠāđ‰āļžāļĨāļąāļ‡āļ‚āļ­āļ‡ AI āļŠāļģāļŦāļĢāļąāļšāļŠāļīāđˆāļ‡āļ—āļĩāđˆāļ”āļĩ