Connect with us

จากเงินเป็นทอง: วิธีการที่ DeepMind’s AI พิชิตการแข่งขันคณิตศาสตร์โอลิมปิกระดับนานาชาติ

ปัญญาประดิษฐ์

จากเงินเป็นทอง: วิธีการที่ DeepMind’s AI พิชิตการแข่งขันคณิตศาสตร์โอลิมปิกระดับนานาชาติ

mm

DeepMind’s AI ได้ทำความก้าวหน้าอย่างน่าประทับใจในด้านการให้เหตุผลทางคณิตศาสตร์ภายในระยะเวลาเพียงหนึ่งปี หลังจากได้รับเหรียญเงินในการแข่งขันคณิตศาสตร์โอลิมปิกระดับนานาชาติ (IMO) ในปี 2024 ระบบ AI ของพวกเขาก็ได้เหรียญทองในปี 2025 การก้าวหน้าอย่างรวดเร็วนี้เน้นย้ำถึงความสามารถที่เพิ่มขึ้นของปัญญาประดิษฐ์ในการจัดการปัญหาเชิงนามธรรมที่ซับซ้อนซึ่งต้องการความคิดสร้างสรรค์และความเข้าใจเหมือนมนุษย์ บทความนี้จะพาไปสัมผัสกับวิธีการที่ DeepMind ประสบความสำเร็จในการเปลี่ยนแปลงนี้ ตัวเลือกด้านเทคนิคและยุทธศาสตร์ที่อยู่เบื้องหลัง และผลกระทบในวงกว้างของความก้าวหน้านี้

ความสำคัญของ IMO

การแข่งขันคณิตศาสตร์โอลิมปิกระดับนานาชาติ ซึ่งก่อตั้งขึ้นในปี 1959 ได้รับการยอมรับในระดับโลกว่าเป็นการแข่งขันคณิตศาสตร์ที่ดีที่สุดสำหรับนักเรียนมัธยมศึกษา ทุกๆ ปี นักเรียนที่ดีที่สุดจากทั่วโลกจะเผชิญกับปัญหา 6 ข้อที่ท้าทายที่ครอบคลุมด้านแอลจีบรา, จรมิติ, ทฤษฎีจำนวน, และทฤษฎีการรวมกัน การแก้ปัญหาเหล่านี้ต้องการมากกว่าการคำนวณ; ผู้เข้าแข่งขันต้องแสดงความสร้างสรรค์ทางคณิตศาสตร์ที่แท้จริง, การคิดเชิงตรรกะอย่างเข้มงวด, และความสามารถในการสร้างข้อพิสูจน์ที่สวยงาม

สำหรับปัญญาประดิษฐ์ การแข่งขันคณิตศาสตร์โอลิมปิกระดับนานาชาติเป็นการทดสอบที่ไม่เหมือนใคร ในขณะที่ AI ได้ทำความก้าวหน้าในด้านการรู้จำรูปแบบ, การวิเคราะห์ข้อมูล, และแม้กระทั่งเกมที่ซับซ้อนเช่น Go และหมากรุก, คณิตศาสตร์โอลิมปิกต้องการการให้เหตุผลเชิงนามธรรมและสร้างสรรค์ใหม่, ทักษะที่มักถือว่าเป็นลักษณะของปัญญาของมนุษย์ ดังนั้น IMO จึงกลายเป็นสถานที่ทดสอบที่เหมาะสมสำหรับการประเมินว่า AI ใกล้จะบรรลุการให้เหตุผลเหมือนมนุษย์หรือไม่

การผ่านเหรียญเงินในปี 2024

ในปี 2024 DeepMind แนะนำ ระบบ AI สองระบบเพื่อแก้ปัญหาในระดับ IMO: AlphaProof และ AlphaGeometry 2 ทั้งสองระบบเป็นตัวอย่างของ “neuro-symbolic” AI, ที่รวมความแข็งแกร่งของโมเดลภาษาขนาดใหญ่ (LLMs) กับความรัดกุมของตรรกะสัญลักษณ์

AlphaProof ได้รับการออกแบบมาเพื่อพิสูจน์ข้อความทางคณิตศาสตร์โดยใช้ Lean, ภาษาคณิตศาสตร์แบบเป็นทางการ ระบบนี้รวม Gemini, โมเดลภาษาขนาดใหญ่ของ DeepMind, กับ AlphaZero, ซึ่งเป็นเครื่องมือการเรียนรู้แบบเสริมที่มีชื่อเสียงในการเล่นเกมกระดาน ในบริบทนี้, บทบาทของ Gemini คือการแปลปัญหาจากภาษาธรรมชาติเป็น Lean และพยายามพิสูจน์โดยการสร้างขั้นตอนเชิงตรรกะ AlphaProof ได้รับการฝึกฝนจากตัวอย่างปัญหาหลายล้านข้อที่ครอบคลุมสาขาคณิตศาสตร์ต่างๆ และระดับความยากต่างๆ ระบบนี้ได้รับการปรับปรุงโดยการพยายามพิสูจน์ข้อความที่ซับซ้อนมากขึ้น, เหมือนกับที่ AlphaZero ได้เรียนรู้โดยการเล่นเกมกับตัวมันเอง

AlphaGeometry 2 ได้รับการออกแบบมาเพื่อแก้ปัญหาเรขาคณิต ในที่นี้, การเข้าใจภาษาของ Gemini ช่วยให้ AI คาดการณ์การก่อสร้างที่มีประโยชน์, ในขณะที่เครื่องมือการให้เหตุผลสัญลักษณ์จัดการการอนุมานเชิงตรรกะ วิธีการแบบผสมผสานนี้ทำให้ AlphaGeometry สามารถแก้ปัญหาเรขาคณิตที่อยู่นอกขอบเขตของการให้เหตุผลของเครื่องจักรแบบดั้งเดิม

ทั้งสองระบบสามารถแก้ปัญหา 4 ใน 6 ข้อของ IMO: 2 ในแอลจีบรา, 1 ในทฤษฎีจำนวน, และ 1 ในเรขาคณิต, โดยได้รับคะแนน 28 จาก 42 นี่เป็น 里程碑ที่สำคัญ, เนื่องจากเป็นครั้งแรกที่ AI บรรลุ ระดับเหรียญเงินในการแข่งขันคณิตศาสตร์โอลิมปิกระดับนานาชาติ อย่างไรก็ตาม, ความสำเร็จนี้ขึ้นอยู่กับการแปลปัญหาโดยผู้เชี่ยวชาญและต้องการทรัพยากรการคำนวณขนาดใหญ่ซึ่งใช้เวลาหลายวันในการประมวลผลแต่ละปัญหา

นวัตกรรมทางเทคนิคเบื้องหลังเหรียญทอง

การเปลี่ยนแปลงของ DeepMind จากการแสดงผลเหรียญเงินเป็นเหรียญทองได้รับแรงผลักดันจากความก้าวหน้าทางเทคนิคที่สำคัญหลายประการ

1. ภาษาธรรมชาติเป็นช่องทางในการพิสูจน์

การเปลี่ยนแปลงที่สำคัญที่สุดคือการเปลี่ยนจากระบบที่ต้องการการแปลโดยผู้เชี่ยวชาญเป็นภาษาแบบเป็นทางการไปสู่การรักษาภาษาธรรมชาติเป็นช่องทางในการพิสูจน์ การเปลี่ยนแปลงนี้ได้รับการบรรลุผ่านรุ่นที่ได้รับการปรับปรุงของ Gemini ที่มี ความสามารถ Deep Think แทนที่จะแปลงปัญหาเป็น Lean, โมเดลจะประมวลผลข้อความโดยตรง, สร้างภาพวาดที่ไม่เป็นทางการ, สร้างรูปแบบการให้เหตุผลภายใน, และสร้างพิสูจน์ที่สมบูรณ์แบบในรูปแบบภาษาอังกฤษ การเรียนรู้แบบเสริมจากข้อเสนอแนะของมนุษย์ (RLHF) ถูกใช้เพื่อรางวัลวิธีแก้ปัญหาที่มีความสอดคล้องทางตรรกะ, สั้น, และนำเสนอ

Gemini Deep Think แตกต่างจากรุ่นปกติของ Gemini ในสองด้านหลักๆ ประการแรก, มันจัดสรรหน้าต่างบริบทที่ยาวขึ้นและโทเค็นการคำนวณมากกว่าสำหรับการส่งคำถามแต่ละครั้ง, ซึ่งช่วยให้โมเดลสามารถรักษากระบวนการคิดที่ยาวหลายหน้าได้ ประการสอง, มันใช้การให้เหตุผลแบบขนาน, โดยที่เส้นทางการคิดที่เป็นไปได้หลายร้อยเส้นทางถูกสร้างขึ้นสำหรับวิธีแก้ปัญหาที่แตกต่างกัน ผู้ดูแลแบบเบาๆ จะจัดอันดับและสนับสนุนเส้นทางที่มีแนวโน้มมากที่สุด, ยืมแนวคิดจาก การค้นหาต้นไม้แบบมอนติคาร์โล แต่ถูกนำไปใช้กับข้อความแทน นี่เป็นวิธีการที่เลียนแบบวิธีการทำงานของทีมมนุษย์ที่คิดไอเดีย, ละทิ้งความคิดที่ไม่มีประสิทธิภาพ, และมาถึงวิธีแก้ปัญหาที่สวยงาม

2. การฝึกอบรมและการเรียนรู้แบบเสริม

การฝึกอบรม Gemini Deep Think เกี่ยวข้องกับการปรับโมเดลให้สามารถคาดการณขั้นตอนต่อไปได้แทนการคาดการณ์คำตอบสุดท้าย สำหรับจุดประสงค์นี้, ฐานข้อมูลของวิธีแก้ปัญหา 100,000 ข้อที่มีคุณภาพสูงในการแข่งขันคณิตศาสตร์โอลิมปิกและมหาวิทยาลัยถูกรวบรวม ฐานข้อมูลนี้ส่วนใหญ่มาจากฟอรัมคณิตศาสตร์สาธารณะ, arXiv preprints, และชุดปัญหาของมหาวิทยาลัย ผู้สอนคนให้คำปรึกษาตัวอย่างการฝึกอบรมเพื่อกรองพิสูจน์ที่ไม่สมเหตุสมผลหรือไม่สมบูรณ์ การเรียนรู้แบบเสริมช่วยให้โมเดลมีความแม่นยำและแม่นยำยิ่งขึ้น ตัวอย่างแรกๆ ที่สร้างขึ้นมักจะพิสูจน์ที่ยาวเกินไป, แต่การลงโทษต่อคำหรือวลีที่ซ้ำกันช่วยตัดทอนผลลัพธ์

ไม่เหมือนกับการปรับโมเดลแบบดั้งเดิมที่มักต้องดิ้นรนกับรางวัลที่ไม่ถี่นัก, โดยที่คำติชมเป็นแบบทวินาม, หรือพิสูจน์ถูกต้องหรือไม่ DeepMind นำระบบรางวัลแบบขั้นตอนมาใช้, โดยที่ทุกๆ ส่วนย่อยของทฤษฎีที่ได้รับการยืนยันจะช่วยเพิ่มคะแนนโดยรวม การเรียนรู้นี้ช่วยให้ Gemini มุ่งเน้นไปที่การสร้างพิสูจน์ที่แม่นยำและสมบูรณ์ แม้ว่าการพิสูจน์แบบสมบูรณ์จะไม่เกิดขึ้นบ่อยก็ตาม กระบวนการฝึกอบรมใช้เวลา 3 เดือนและใช้เวลาประมวลผล TPU ประมาณ 25 ล้านชั่วโมง

3. การขนานกันขนาดใหญ่

การขนานกันขนาดใหญ่ยังเป็นปัจจัยสำคัญในการก้าวหน้าของ DeepMind จากเหรียญเงินไปสู่เหรียญทอง แต่ละปัญหาเกิดสาขาการให้เหตุผลแบบขนาน, โดยทรัพยากรถูกย้ายไปสู่แนวทางที่มีแนวโน้มมากขึ้นเมื่อแนวทางอื่นๆ ติดค้าง การจัดตารางแบบไดนามิกนี้มีประโยชน์อย่างยิ่งสำหรับปัญหาเชิงผสม, ซึ่งมีพื้นที่ทางคำตอบขนาดใหญ่ วิธีการนี้คล้ายกับวิธีที่มนุษย์ทดสอบความไม่เท่าเทียมกันที่ช่วยเหลือก่อนที่จะยอมรับการอุปนัยที่สมบูรณ์ แม้ว่าวิธีการนี้จะมีราคาแพงในการคำนวณ, แต่ก็สามารถจัดการได้โดยใช้คลัสเตอร์ TPU v5 ของ DeepMind

DeepMind ที่ IMO 2025

เพื่อรักษาความซื่อสัตย์ของการแข่งขัน, DeepMind ได้ทำการแช่แข็งน้ำหนักของโมเดล 3 สัปดาห์ก่อนการแข่งขัน IMO เพื่อป้องกันไม่ให้ปัญหาอย่างเป็นทางการรั่วไหลเข้าสู่ชุดฝึกอบรม นอกจากนี้, พวกเขายังกรองข้อมูลที่มีคำตอบของปัญหาโอลิมปิกที่ไม่ได้เผยแพร่มาก่อน

ระหว่างการแข่งขัน, Gemini Deep Think ได้รับปัญหา 6 ข้ออย่างเป็นทางการในรูปแบบข้อความธรรมดา, โดยไม่ได้รับอนุญาตให้เข้าถึงอินเทอร์เน็ต ระบบทำงานบนคลัสเตอร์ที่กำหนดค่าให้มีพลังการคำนวณเทียบเท่ากับแล็ปท็อปมาตรฐานต่อกระบวนการ กระบวนการแก้ปัญหาเสร็จสิ้นภายในเวลาไม่ถึง 3 ชั่วโมง, ซึ่งอยู่ภายในข้อจำกัดเวลา ผลลัพธ์ที่สร้างขึ้นถูกส่งไปยังผู้ประสานงานของ IMO โดยไม่มีการเปลี่ยนแปลง

Gemini Deep Think ได้รับคะแนนสมบูรณ์ 5 ใน 6 ปัญหาแรก ปัญหา cuốiที่เป็นปัญหาเชิงผสมที่ท้าทาย, อย่างไรก็ตาม, ทำให้ทั้ง AI และ 94% ของผู้เข้าแข่งขันคนไม่สามารถแก้ได้ แม้ว่าจะเป็นเช่นนั้น, AI จบด้วยคะแนนรวม 35/42 เพื่อรับเหรียญทอง คะแนนนี้สูงกว่าผลลัพธ์เหรียญเงินในปีก่อนหน้า 7 คะแนน ผู้สังเกตการณ์ภายหลังอธิบายว่าพิสูจน์ของ AI เป็น ‘ดiligent’ และ ‘สมบูรณ์’, โดยสังเกตว่าพวกมันตามหลักการให้เหตุผลอย่างเข้มงวดที่คาดหวังจากผู้เข้าแข่งขันคน

ผลกระทบต่อ AI และคณิตศาสตร์

ความสำเร็จของ DeepMind เป็น 里程碑ที่สำคัญสำหรับทั้ง AI และคณิตศาสตร์ สำหรับ AI, การเป็นแชมป์ IMO เป็นก้าวหนึ่งไปสู่การบรรลุความฉลาดทั่วไป (AGI), โดยที่ระบบสามารถทำภารกิจทางปัญญาใดๆ ที่มนุษย์สามารถทำได้ การแก้ปัญหาเชิงคณิตศาสตร์ที่ซับซ้อนจำเป็นต้องมีการให้เหตุผลและความเข้าใจ, ซึ่งเป็นส่วนประกอบพื้นฐานของความฉลาดทั่วไป ความสำเร็จนี้บ่งชี้ว่า AI กำลังเดินหน้าไปสู่ความสามารถในการให้เหตุผลที่เหมือนมนุษย์มากขึ้น

สำหรับคณิตศาสตร์, ระบบ AI เช่น Gemini Deep Think สามารถกลายเป็นเครื่องมือที่มีคุณค่าสำหรับนักคณิตศาสตร์ พวกมันสามารถช่วยในการสำรวจพื้นที่ใหม่ๆ, ตรวจสอบสมมติฐาน, และแม้กระทั่งค้นพบทฤษฎีใหม่ๆ โดยการทำให้กระบวนการสร้างพิสูจน์เป็นแบบอัตโนมัติ, AI ช่วยให้นักคณิตศาสตร์คนสามารถมุ่งเน้นไปที่งานแนวคิดระดับสูงได้ นอกจากนี้, เทคนิคที่พัฒนาขึ้นสำหรับระบบ AI เหล่านี้อาจสร้างแรงบันดาลใจให้เกิดวิธีการใหม่ๆ ในการวิจัยคณิตศาสตร์ที่อาจไม่สามารถทำได้ด้วยความพยายามของมนุษย์คนเดียว

อย่างไรก็ตาม, ความก้าวหน้าของ AI ในคณิตศาสตร์ยังทำให้เกิดคำถามเกี่ยวกับบทบาทของ AI ในสภาพแวดล้อมทางการศึกษาและการแข่งขัน เมื่อความสามารถของ AI ยังคงเติบโต, จะมีการถกเถียงเกี่ยวกับว่าการมีส่วนร่วมของ AI อาจเปลี่ยนแปลงธรรมชาติของการศึกษาคณิตศาสตร์และการแข่งขัน

มองไปข้างหน้า

การชนะเหรียญทองในการแข่งขันคณิตศาสตร์โอลิมปิกระดับนานาชาติเป็น 里程碑ที่สำคัญ, แต่ยังมีปัญหาเชิงคณิตศาสตร์มากมายที่ยังอยู่นอกเหนือความสามารถของระบบ AI ในปัจจุบัน อย่างไรก็ตาม, การก้าวหน้าอย่างรวดเร็วจากเหรียญเงินไปสู่เหรียญทองในระยะเวลาเพียงหนึ่งปีเน้นย้ำถึงความเร็วที่เพิ่มขึ้นของนวัตกรรมและพัฒนาการของ AI หากความเร็วในการพัฒนานี้ยังคงดำเนินต่อไป, ระบบ AI อาจสามารถแก้ปัญหาเชิงคณิตศาสตร์ที่มีชื่อเสียงที่ยังไม่ได้รับการแก้ไขได้ในไม่ช้า แม้ว่าคำถามเกี่ยวกับว่า AI จะแทนที่หรือเพิ่มความสร้างสรรค์ของมนุษย์ยังคงไม่มีคำตอบ, การแข่งขันคณิตศาสตร์โอลิมปิกระดับนานาชาติในปี 2025 เป็นตัวอย่างที่ชัดเจนว่า AI ได้ทำความก้าวหน้าอย่างมีนัยสำคัญในด้านการให้เหตุผลเชิงตรรกะ

ดร. Tehseen Zia เป็น Professor ที่ COMSATS University Islamabad โดยได้รับ PhD ใน AI จาก Vienna University of Technology, Austria มีเชี่ยวชาญด้าน Artificial Intelligence, Machine Learning, Data Science, และ Computer Vision โดยมีส่วนร่วมที่สำคัญด้วยการเผยแพร่ในวารสารวิทยาศาสตร์ที่มีชื่อเสียง ดร. Tehseen ยังได้ดำเนินโครงการอุตสาหกรรมต่างๆ ในฐานะ Principal Investigator และให้บริการเป็นที่ปรึกษาด้าน AI