ปัญญาประดิษฐ์
จากเงินเป็นทอง: วิธีการที่ DeepMind’s AI พิชิตการแข่งขันคณิตศาสตร์โอลิมปิกระดับนานาชาติ

DeepMind’s AI ได้ทำความก้าวหน้าอย่างน่าประทับใจในด้านการให้เหตุผลทางคณิตศาสตร์ภายในระยะเวลาเพียงหนึ่งปี หลังจากได้รับเหรียญเงินในการแข่งขันคณิตศาสตร์โอลิมปิกระดับนานาชาติ (IMO) ในปี 2024 ระบบ AI ของพวกเขาก็ได้เหรียญทองในปี 2025 การก้าวหน้าอย่างรวดเร็วนี้เน้นย้ำถึงความสามารถที่เพิ่มขึ้นของปัญญาประดิษฐ์ในการจัดการปัญหาเชิงนามธรรมที่ซับซ้อนซึ่งต้องการความคิดสร้างสรรค์และความเข้าใจเหมือนมนุษย์ บทความนี้จะพาไปสัมผัสกับวิธีการที่ DeepMind ประสบความสำเร็จในการเปลี่ยนแปลงนี้ ตัวเลือกด้านเทคนิคและยุทธศาสตร์ที่อยู่เบื้องหลัง และผลกระทบในวงกว้างของความก้าวหน้านี้
ความสำคัญของ IMO
การแข่งขันคณิตศาสตร์โอลิมปิกระดับนานาชาติ ซึ่งก่อตั้งขึ้นในปี 1959 ได้รับการยอมรับในระดับโลกว่าเป็นการแข่งขันคณิตศาสตร์ที่ดีที่สุดสำหรับนักเรียนมัธยมศึกษา ทุกๆ ปี นักเรียนที่ดีที่สุดจากทั่วโลกจะเผชิญกับปัญหา 6 ข้อที่ท้าทายที่ครอบคลุมด้านแอลจีบรา, จรมิติ, ทฤษฎีจำนวน, และทฤษฎีการรวมกัน การแก้ปัญหาเหล่านี้ต้องการมากกว่าการคำนวณ; ผู้เข้าแข่งขันต้องแสดงความสร้างสรรค์ทางคณิตศาสตร์ที่แท้จริง, การคิดเชิงตรรกะอย่างเข้มงวด, และความสามารถในการสร้างข้อพิสูจน์ที่สวยงาม
สำหรับปัญญาประดิษฐ์ การแข่งขันคณิตศาสตร์โอลิมปิกระดับนานาชาติเป็นการทดสอบที่ไม่เหมือนใคร ในขณะที่ AI ได้ทำความก้าวหน้าในด้านการรู้จำรูปแบบ, การวิเคราะห์ข้อมูล, และแม้กระทั่งเกมที่ซับซ้อนเช่น Go และหมากรุก, คณิตศาสตร์โอลิมปิกต้องการการให้เหตุผลเชิงนามธรรมและสร้างสรรค์ใหม่, ทักษะที่มักถือว่าเป็นลักษณะของปัญญาของมนุษย์ ดังนั้น IMO จึงกลายเป็นสถานที่ทดสอบที่เหมาะสมสำหรับการประเมินว่า AI ใกล้จะบรรลุการให้เหตุผลเหมือนมนุษย์หรือไม่
การผ่านเหรียญเงินในปี 2024
ในปี 2024 DeepMind แนะนำ ระบบ AI สองระบบเพื่อแก้ปัญหาในระดับ IMO: AlphaProof และ AlphaGeometry 2 ทั้งสองระบบเป็นตัวอย่างของ “neuro-symbolic” AI, ที่รวมความแข็งแกร่งของโมเดลภาษาขนาดใหญ่ (LLMs) กับความรัดกุมของตรรกะสัญลักษณ์
AlphaProof ได้รับการออกแบบมาเพื่อพิสูจน์ข้อความทางคณิตศาสตร์โดยใช้ Lean, ภาษาคณิตศาสตร์แบบเป็นทางการ ระบบนี้รวม Gemini, โมเดลภาษาขนาดใหญ่ของ DeepMind, กับ AlphaZero, ซึ่งเป็นเครื่องมือการเรียนรู้แบบเสริมที่มีชื่อเสียงในการเล่นเกมกระดาน ในบริบทนี้, บทบาทของ Gemini คือการแปลปัญหาจากภาษาธรรมชาติเป็น Lean และพยายามพิสูจน์โดยการสร้างขั้นตอนเชิงตรรกะ AlphaProof ได้รับการฝึกฝนจากตัวอย่างปัญหาหลายล้านข้อที่ครอบคลุมสาขาคณิตศาสตร์ต่างๆ และระดับความยากต่างๆ ระบบนี้ได้รับการปรับปรุงโดยการพยายามพิสูจน์ข้อความที่ซับซ้อนมากขึ้น, เหมือนกับที่ AlphaZero ได้เรียนรู้โดยการเล่นเกมกับตัวมันเอง
AlphaGeometry 2 ได้รับการออกแบบมาเพื่อแก้ปัญหาเรขาคณิต ในที่นี้, การเข้าใจภาษาของ Gemini ช่วยให้ AI คาดการณ์การก่อสร้างที่มีประโยชน์, ในขณะที่เครื่องมือการให้เหตุผลสัญลักษณ์จัดการการอนุมานเชิงตรรกะ วิธีการแบบผสมผสานนี้ทำให้ AlphaGeometry สามารถแก้ปัญหาเรขาคณิตที่อยู่นอกขอบเขตของการให้เหตุผลของเครื่องจักรแบบดั้งเดิม
ทั้งสองระบบสามารถแก้ปัญหา 4 ใน 6 ข้อของ IMO: 2 ในแอลจีบรา, 1 ในทฤษฎีจำนวน, และ 1 ในเรขาคณิต, โดยได้รับคะแนน 28 จาก 42 นี่เป็น 里程碑ที่สำคัญ, เนื่องจากเป็นครั้งแรกที่ AI บรรลุ ระดับเหรียญเงินในการแข่งขันคณิตศาสตร์โอลิมปิกระดับนานาชาติ อย่างไรก็ตาม, ความสำเร็จนี้ขึ้นอยู่กับการแปลปัญหาโดยผู้เชี่ยวชาญและต้องการทรัพยากรการคำนวณขนาดใหญ่ซึ่งใช้เวลาหลายวันในการประมวลผลแต่ละปัญหา
นวัตกรรมทางเทคนิคเบื้องหลังเหรียญทอง
การเปลี่ยนแปลงของ DeepMind จากการแสดงผลเหรียญเงินเป็นเหรียญทองได้รับแรงผลักดันจากความก้าวหน้าทางเทคนิคที่สำคัญหลายประการ
1. ภาษาธรรมชาติเป็นช่องทางในการพิสูจน์
การเปลี่ยนแปลงที่สำคัญที่สุดคือการเปลี่ยนจากระบบที่ต้องการการแปลโดยผู้เชี่ยวชาญเป็นภาษาแบบเป็นทางการไปสู่การรักษาภาษาธรรมชาติเป็นช่องทางในการพิสูจน์ การเปลี่ยนแปลงนี้ได้รับการบรรลุผ่านรุ่นที่ได้รับการปรับปรุงของ Gemini ที่มี ความสามารถ Deep Think แทนที่จะแปลงปัญหาเป็น Lean, โมเดลจะประมวลผลข้อความโดยตรง, สร้างภาพวาดที่ไม่เป็นทางการ, สร้างรูปแบบการให้เหตุผลภายใน, และสร้างพิสูจน์ที่สมบูรณ์แบบในรูปแบบภาษาอังกฤษ การเรียนรู้แบบเสริมจากข้อเสนอแนะของมนุษย์ (RLHF) ถูกใช้เพื่อรางวัลวิธีแก้ปัญหาที่มีความสอดคล้องทางตรรกะ, สั้น, และนำเสนอ
Gemini Deep Think แตกต่างจากรุ่นปกติของ Gemini ในสองด้านหลักๆ ประการแรก, มันจัดสรรหน้าต่างบริบทที่ยาวขึ้นและโทเค็นการคำนวณมากกว่าสำหรับการส่งคำถามแต่ละครั้ง, ซึ่งช่วยให้โมเดลสามารถรักษากระบวนการคิดที่ยาวหลายหน้าได้ ประการสอง, มันใช้การให้เหตุผลแบบขนาน, โดยที่เส้นทางการคิดที่เป็นไปได้หลายร้อยเส้นทางถูกสร้างขึ้นสำหรับวิธีแก้ปัญหาที่แตกต่างกัน ผู้ดูแลแบบเบาๆ จะจัดอันดับและสนับสนุนเส้นทางที่มีแนวโน้มมากที่สุด, ยืมแนวคิดจาก การค้นหาต้นไม้แบบมอนติคาร์โล แต่ถูกนำไปใช้กับข้อความแทน นี่เป็นวิธีการที่เลียนแบบวิธีการทำงานของทีมมนุษย์ที่คิดไอเดีย, ละทิ้งความคิดที่ไม่มีประสิทธิภาพ, และมาถึงวิธีแก้ปัญหาที่สวยงาม
2. การฝึกอบรมและการเรียนรู้แบบเสริม
การฝึกอบรม Gemini Deep Think เกี่ยวข้องกับการปรับโมเดลให้สามารถคาดการณขั้นตอนต่อไปได้แทนการคาดการณ์คำตอบสุดท้าย สำหรับจุดประสงค์นี้, ฐานข้อมูลของวิธีแก้ปัญหา 100,000 ข้อที่มีคุณภาพสูงในการแข่งขันคณิตศาสตร์โอลิมปิกและมหาวิทยาลัยถูกรวบรวม ฐานข้อมูลนี้ส่วนใหญ่มาจากฟอรัมคณิตศาสตร์สาธารณะ, arXiv preprints, และชุดปัญหาของมหาวิทยาลัย ผู้สอนคนให้คำปรึกษาตัวอย่างการฝึกอบรมเพื่อกรองพิสูจน์ที่ไม่สมเหตุสมผลหรือไม่สมบูรณ์ การเรียนรู้แบบเสริมช่วยให้โมเดลมีความแม่นยำและแม่นยำยิ่งขึ้น ตัวอย่างแรกๆ ที่สร้างขึ้นมักจะพิสูจน์ที่ยาวเกินไป, แต่การลงโทษต่อคำหรือวลีที่ซ้ำกันช่วยตัดทอนผลลัพธ์
ไม่เหมือนกับการปรับโมเดลแบบดั้งเดิมที่มักต้องดิ้นรนกับรางวัลที่ไม่ถี่นัก, โดยที่คำติชมเป็นแบบทวินาม, หรือพิสูจน์ถูกต้องหรือไม่ DeepMind นำระบบรางวัลแบบขั้นตอนมาใช้, โดยที่ทุกๆ ส่วนย่อยของทฤษฎีที่ได้รับการยืนยันจะช่วยเพิ่มคะแนนโดยรวม การเรียนรู้นี้ช่วยให้ Gemini มุ่งเน้นไปที่การสร้างพิสูจน์ที่แม่นยำและสมบูรณ์ แม้ว่าการพิสูจน์แบบสมบูรณ์จะไม่เกิดขึ้นบ่อยก็ตาม กระบวนการฝึกอบรมใช้เวลา 3 เดือนและใช้เวลาประมวลผล TPU ประมาณ 25 ล้านชั่วโมง
3. การขนานกันขนาดใหญ่
การขนานกันขนาดใหญ่ยังเป็นปัจจัยสำคัญในการก้าวหน้าของ DeepMind จากเหรียญเงินไปสู่เหรียญทอง แต่ละปัญหาเกิดสาขาการให้เหตุผลแบบขนาน, โดยทรัพยากรถูกย้ายไปสู่แนวทางที่มีแนวโน้มมากขึ้นเมื่อแนวทางอื่นๆ ติดค้าง การจัดตารางแบบไดนามิกนี้มีประโยชน์อย่างยิ่งสำหรับปัญหาเชิงผสม, ซึ่งมีพื้นที่ทางคำตอบขนาดใหญ่ วิธีการนี้คล้ายกับวิธีที่มนุษย์ทดสอบความไม่เท่าเทียมกันที่ช่วยเหลือก่อนที่จะยอมรับการอุปนัยที่สมบูรณ์ แม้ว่าวิธีการนี้จะมีราคาแพงในการคำนวณ, แต่ก็สามารถจัดการได้โดยใช้คลัสเตอร์ TPU v5 ของ DeepMind
DeepMind ที่ IMO 2025
เพื่อรักษาความซื่อสัตย์ของการแข่งขัน, DeepMind ได้ทำการแช่แข็งน้ำหนักของโมเดล 3 สัปดาห์ก่อนการแข่งขัน IMO เพื่อป้องกันไม่ให้ปัญหาอย่างเป็นทางการรั่วไหลเข้าสู่ชุดฝึกอบรม นอกจากนี้, พวกเขายังกรองข้อมูลที่มีคำตอบของปัญหาโอลิมปิกที่ไม่ได้เผยแพร่มาก่อน
ระหว่างการแข่งขัน, Gemini Deep Think ได้รับปัญหา 6 ข้ออย่างเป็นทางการในรูปแบบข้อความธรรมดา, โดยไม่ได้รับอนุญาตให้เข้าถึงอินเทอร์เน็ต ระบบทำงานบนคลัสเตอร์ที่กำหนดค่าให้มีพลังการคำนวณเทียบเท่ากับแล็ปท็อปมาตรฐานต่อกระบวนการ กระบวนการแก้ปัญหาเสร็จสิ้นภายในเวลาไม่ถึง 3 ชั่วโมง, ซึ่งอยู่ภายในข้อจำกัดเวลา ผลลัพธ์ที่สร้างขึ้นถูกส่งไปยังผู้ประสานงานของ IMO โดยไม่มีการเปลี่ยนแปลง
Gemini Deep Think ได้รับคะแนนสมบูรณ์ 5 ใน 6 ปัญหาแรก ปัญหา cuốiที่เป็นปัญหาเชิงผสมที่ท้าทาย, อย่างไรก็ตาม, ทำให้ทั้ง AI และ 94% ของผู้เข้าแข่งขันคนไม่สามารถแก้ได้ แม้ว่าจะเป็นเช่นนั้น, AI จบด้วยคะแนนรวม 35/42 เพื่อรับเหรียญทอง คะแนนนี้สูงกว่าผลลัพธ์เหรียญเงินในปีก่อนหน้า 7 คะแนน ผู้สังเกตการณ์ภายหลังอธิบายว่าพิสูจน์ของ AI เป็น ‘ดiligent’ และ ‘สมบูรณ์’, โดยสังเกตว่าพวกมันตามหลักการให้เหตุผลอย่างเข้มงวดที่คาดหวังจากผู้เข้าแข่งขันคน
ผลกระทบต่อ AI และคณิตศาสตร์
ความสำเร็จของ DeepMind เป็น 里程碑ที่สำคัญสำหรับทั้ง AI และคณิตศาสตร์ สำหรับ AI, การเป็นแชมป์ IMO เป็นก้าวหนึ่งไปสู่การบรรลุความฉลาดทั่วไป (AGI), โดยที่ระบบสามารถทำภารกิจทางปัญญาใดๆ ที่มนุษย์สามารถทำได้ การแก้ปัญหาเชิงคณิตศาสตร์ที่ซับซ้อนจำเป็นต้องมีการให้เหตุผลและความเข้าใจ, ซึ่งเป็นส่วนประกอบพื้นฐานของความฉลาดทั่วไป ความสำเร็จนี้บ่งชี้ว่า AI กำลังเดินหน้าไปสู่ความสามารถในการให้เหตุผลที่เหมือนมนุษย์มากขึ้น
สำหรับคณิตศาสตร์, ระบบ AI เช่น Gemini Deep Think สามารถกลายเป็นเครื่องมือที่มีคุณค่าสำหรับนักคณิตศาสตร์ พวกมันสามารถช่วยในการสำรวจพื้นที่ใหม่ๆ, ตรวจสอบสมมติฐาน, และแม้กระทั่งค้นพบทฤษฎีใหม่ๆ โดยการทำให้กระบวนการสร้างพิสูจน์เป็นแบบอัตโนมัติ, AI ช่วยให้นักคณิตศาสตร์คนสามารถมุ่งเน้นไปที่งานแนวคิดระดับสูงได้ นอกจากนี้, เทคนิคที่พัฒนาขึ้นสำหรับระบบ AI เหล่านี้อาจสร้างแรงบันดาลใจให้เกิดวิธีการใหม่ๆ ในการวิจัยคณิตศาสตร์ที่อาจไม่สามารถทำได้ด้วยความพยายามของมนุษย์คนเดียว
อย่างไรก็ตาม, ความก้าวหน้าของ AI ในคณิตศาสตร์ยังทำให้เกิดคำถามเกี่ยวกับบทบาทของ AI ในสภาพแวดล้อมทางการศึกษาและการแข่งขัน เมื่อความสามารถของ AI ยังคงเติบโต, จะมีการถกเถียงเกี่ยวกับว่าการมีส่วนร่วมของ AI อาจเปลี่ยนแปลงธรรมชาติของการศึกษาคณิตศาสตร์และการแข่งขัน
มองไปข้างหน้า
การชนะเหรียญทองในการแข่งขันคณิตศาสตร์โอลิมปิกระดับนานาชาติเป็น 里程碑ที่สำคัญ, แต่ยังมีปัญหาเชิงคณิตศาสตร์มากมายที่ยังอยู่นอกเหนือความสามารถของระบบ AI ในปัจจุบัน อย่างไรก็ตาม, การก้าวหน้าอย่างรวดเร็วจากเหรียญเงินไปสู่เหรียญทองในระยะเวลาเพียงหนึ่งปีเน้นย้ำถึงความเร็วที่เพิ่มขึ้นของนวัตกรรมและพัฒนาการของ AI หากความเร็วในการพัฒนานี้ยังคงดำเนินต่อไป, ระบบ AI อาจสามารถแก้ปัญหาเชิงคณิตศาสตร์ที่มีชื่อเสียงที่ยังไม่ได้รับการแก้ไขได้ในไม่ช้า แม้ว่าคำถามเกี่ยวกับว่า AI จะแทนที่หรือเพิ่มความสร้างสรรค์ของมนุษย์ยังคงไม่มีคำตอบ, การแข่งขันคณิตศาสตร์โอลิมปิกระดับนานาชาติในปี 2025 เป็นตัวอย่างที่ชัดเจนว่า AI ได้ทำความก้าวหน้าอย่างมีนัยสำคัญในด้านการให้เหตุผลเชิงตรรกะ












