الذكاء الاصطناعي
من الفضة إلى الذهب: كيف تغلب الذكاء الاصطناعي لشركة DeepMind على أولمبياد الرياضيات

حقق نظام الذكاء الاصطناعي لشركة ديب مايند تقدمًا ملحوظًا في التفكير الرياضي خلال عام واحد فقط. بعد فوزه بالميدالية الفضية في أولمبياد الرياضيات الدولي (IMO) عام ٢٠٢٤، حصد نظام الذكاء الاصطناعي الخاص بهم الميدالية الذهبية عام ٢٠٢٥. يُبرز هذا التقدم السريع القدرات المتنامية للذكاء الاصطناعي في معالجة المشكلات المعقدة والمجردة التي تتطلب إبداعًا وبصيرة بشرية. يستعرض هذا المقال كيفية تحقيق ديب مايند لهذا التحول، والخيارات التقنية والاستراتيجية التي استند إليها، والآثار الأوسع لهذه التطورات.
أهمية المنظمة البحرية الدولية
استخدم الأولمبياد الدولي للرياضياتتأسست عام ١٩٥٩، وتُعرف عالميًا بأنها المسابقة الرائدة في الرياضيات لطلاب المرحلة الثانوية. في كل عام، يواجه الطلاب المتفوقون من جميع أنحاء العالم ست مسائل رياضية شاقة في الجبر والهندسة ونظرية الأعداد والتوافقيات. يتطلب حل هذه المسائل أكثر بكثير من مجرد الحساب؛ إذ يجب على المشاركين إظهار إبداع رياضي حقيقي، وتفكير منطقي دقيق، وقدرة على بناء براهين دقيقة.
بالنسبة للذكاء الاصطناعي، يُمثل اختبار الرياضيات الأولمبي (IMO) تحديًا فريدًا. فبينما أتقن الذكاء الاصطناعي التعرف على الأنماط وتحليل البيانات، وحتى ألعابًا معقدة مثل لعبة "جو" والشطرنج، تتطلب رياضيات الأولمبياد تفكيرًا إبداعيًا ومجردًا، وتركيب أفكار جديدة، وهي مهارات تُعتبر تقليديًا من سمات الذكاء البشري. ونتيجةً لذلك، أصبح اختبار الرياضيات الأولمبي منصة اختبار مثالية لتقييم مدى قرب الذكاء الاصطناعي من تحقيق تفكير بشري حقيقي.
إنجاز الميدالية الفضية لعام 2024
في عام 2024، DeepMind أدخلت نظامان للذكاء الاصطناعي لمعالجة مشاكل على مستوى المنظمة البحرية الدولية: AlphaProof و AlphaGeometry 2. كلا النظامين هما مثالان على "رمزي عصبي"الذكاء الاصطناعي، يجمع بين نقاط قوة نماذج اللغة الكبيرة (LLMs) وقوة المنطق الرمزي.
AlphaProof تم تصميمه لإثبات البيانات الرياضية باستخدام تتكئ، وهي لغة رياضية رسمية. جمعت بين جيميني، نموذج اللغة الكبير من ديب مايند، مع AlphaZero، وهو محرك تعلم معزز معروف بنجاحه في ألعاب الطاولة. في هذا السياق، كان دور جيميني هو ترجمة مسائل اللغة الطبيعية إلى منهجية لين ومحاولة إثباتها من خلال توليد خطوات منطقية. تم تدريب ألفابروف على ملايين المسائل النموذجية التي تغطي مختلف التخصصات والصعوبات الرياضية. حسّن النظام نفسه من خلال محاولة إثبات عبارات متزايدة التعقيد، على غرار طريقة تعلم ألفا زيرو من خلال اللعب ضد نفسه.
هندسة ألفا 2 صُمم لحل مسائل الهندسة. هنا، مكّن فهم جيميني اللغوي الذكاء الاصطناعي من التنبؤ بالإنشاءات المساعدة المفيدة، بينما أدار محرك الاستدلال الرمزي الاستنتاجات المنطقية. سمح هذا النهج الهجين هندسة ألفا معالجة المشاكل الهندسية التي تتجاوز نطاق التفكير الآلي التقليدي.
معًا، تمكنت هذه الأنظمة من حل أربع من أصل ست مشكلات في IMO: اثنتان في الجبر، وواحدة في نظرية الأعداد، وواحدة في الهندسة، محققة درجة 28 من 42. كان هذا الأداء إنجازًا مهمًا، حيث كانت المرة الأولى التي يتمكن فيها الذكاء الاصطناعي من حل هذه المشكلات. التي تم الوصول إليها مستوى الميدالية الفضية في المنظمة البحرية الدولية. إلا أن هذا النجاح اعتمد بشكل كبير على الخبراء البشريين لترجمة المسائل إلى لغات رياضية رسمية. كما تطلبت موارد حاسوبية هائلة، استغرقت أيامًا من وقت المعالجة لكل مسألة.
الابتكارات التقنية وراء الميدالية الذهبية
انتقال DeepMind من الفضة إلى ميدالية ذهبية تم تعزيز الأداء من خلال العديد من التحسينات التقنية الهامة.
1. اللغة الطبيعية كوسيلة للإثبات
كان التغيير الأهم هو التحول من الأنظمة التي تتطلب ترجمات متخصصة إلى اللغات الرسمية إلى التعامل مع اللغة الطبيعية كوسيلة للإثباتات. وقد تحقق هذا التحول من خلال نسخة مُحسّنة من برنامج جيميني. مجهزة قدرات التفكير العميق. بدلاً من تحويل المشكلات إلى نموذج لين، يُعالج النموذج النص مباشرةً، ويُنتج رسومات تخطيطية غير رسمية، ويُصوغ الخطوات المهمة داخليًا، ويُنتج برهانًا إنجليزيًا مُحسّنًا. التعلم المُعزّز من التغذية الراجعة البشرية (RLHF) تم استخدامها لمكافأة الحلول المتسقة منطقيًا والموجزة والمقدمة.
يختلف جيميني ديب ثينك عن النسخة العامة من جيميني بطريقتين رئيسيتين. أولًا، يُخصص نوافذ سياقية أطول ورموز حوسبة أكثر لكل استعلام، مما يُمكّن النموذج من الحفاظ على سلاسل تفكير متعددة الصفحات. ثانيًا، يستخدم التفكير المتوازي، حيث تُولّد مئات الخيوط التخمينية لحلول محتملة مختلفة. ثم يُصنّف مُشرف خفيف ويُروّج لأكثر المسارات الواعدة، مستعيرًا المفاهيم من... البحث عن شجرة مونت كارلو لكن يُطبَّق هذا النهج على النصوص. يُحاكي هذا النهج طريقةَ العصف الذهني التي تتبعها الفرق البشرية، وتتخلص من الأفكار غير المُجدية، وتتوصل إلى حلولٍ فعّالة.
2. التدريب والتعلم التعزيزي
تضمن تدريب "جيميني ديب ثينك" ضبط النموذج بدقة للتنبؤ بالخطوات التالية بدلاً من الإجابات النهائية. ولهذا الغرض، جُمعت مجموعة حلول عالية الجودة من 100,000 حل لمسابقات الأولمبياد والجامعات. جُمعت المجموعة بشكل رئيسي من منتديات الرياضيات العامة، ونسخ arXiv الأولية، ومجموعات مسائل جامعية. راجع مرشدون بشريون أمثلة التدريب لتصفية البراهين غير المنطقية أو غير المكتملة. ساعد التعلم التعزيزي في تحسين النموذج، ودفعه نحو إنتاج براهين موجزة ودقيقة. أنتجت الإصدارات المبكرة براهين مطولة بشكل مفرط، لكن العقوبات على العبارات الزائدة ساعدت في تقليص الناتج.
بخلاف الضبط الدقيق التقليدي، الذي غالبًا ما يواجه صعوبات في الحصول على مكافآت ضئيلة حيث تكون التغذية الراجعة ثنائية، فإن الإثبات إما صحيح أو خاطئ. طبّقت DeepMind نظام مكافآت تدريجيًا، حيث ساهمت كل مسألة فرعية مُتحققة في النتيجة الإجمالية. تُرشد آلية المكافأة هذه جهاز Gemini حتى في حال ندرة الإثبات الكامل. امتدت عملية التدريب ثلاثة أشهر، واستهلكت حوالي 25 مليون ساعة تدريب.
3. التوازي الهائل
لعب التوازي أيضًا دورًا حاسمًا في تطور DeepMind من الفضي إلى الذهبي. فقد ولّدت كل مسألة فروعًا استدلالية متعددة بالتوازي، مع انتقال الموارد ديناميكيًا إلى مسارات أكثر واعدة عندما تتعثر أخرى. كان هذا الجدول الديناميكي مفيدًا بشكل خاص لمسائل التوافقيات، التي تتطلب مساحات حل واسعة. يشبه هذا النهج اختبار البشر للمتباينات المساعدة قبل الالتزام بالاستقراء الكامل. ورغم أن هذه التقنية كانت مكلفة حسابيًا، إلا أنها كانت سهلة الاستخدام باستخدام مجموعات TPU v5 من DeepMind.
DeepMind في IMO 2025
للحفاظ على نزاهة المنافسة، جمّدت DeepMind أوزان النموذج قبل ثلاثة أسابيع من أولمبياد IMO لمنع تسرب المشكلات الرسمية إلى مجموعة التدريب. كما قامت بتصفية البيانات التي تحتوي على حلول لأسئلة أولمبياد لم تُنشر سابقًا.
خلال المسابقة، قُدِّمت المسائل الست الرسمية لبرنامج جيميني ديب ثينك بصيغة نص عادي، دون الحاجة إلى الوصول إلى الإنترنت. شُغِّل النظام على مجموعة مُهيأة لمحاكاة القدرة الحسابية لجهاز كمبيوتر محمول قياسي لكل عملية. أُنجزت عملية حل المسائل بالكامل في أقل من ثلاث ساعات، ضمن الإطار الزمني المحدد. سُلِّمت البراهين المُولَّدة إلى منسقي المنظمة البحرية الدولية دون أي تعديلات.
حصل برنامج "جيميني ديب ثينك" على درجات كاملة في المسائل الخمس الأولى. إلا أن السؤال الأخير، وهو لغز تركيبي صعب، أربك كلاً من الذكاء الاصطناعي و94% من المشاركين. ومع ذلك، أنهى الذكاء الاصطناعي المسابقة بنتيجة إجمالية 35/42، ليحصد الميدالية الذهبية. وكانت هذه النتيجة أعلى بسبع نقاط من أداء العام السابق الذي حاز فيه على الميدالية الفضية. وصف المراقبون لاحقًا براهين الذكاء الاصطناعي بأنها "مجتهدة" و"كاملة"، مشيرين إلى أنها اتبعت التبريرات الدقيقة المتوقعة من المتسابقين البشر.
التأثيرات على الذكاء الاصطناعي والرياضيات
يُعد إنجاز ديب مايند إنجازًا هامًا لكلٍّ من الذكاء الاصطناعي والرياضيات. بالنسبة للذكاء الاصطناعي، يُعد إتقان خوارزمية IMO خطوةً نحو الذكاء الاصطناعي العام (AGI)، حيث تستطيع الأنظمة أداء أي مهمة فكرية يستطيعها الإنسان. يتطلب حل المسائل الرياضية المعقدة التفكير والفهم، وهما عنصران أساسيان للذكاء العام. يشير هذا النجاح إلى أن الذكاء الاصطناعي يتقدم بخطى واسعة نحو قدرات معرفية أقرب إلى قدرات الإنسان.
في مجال الرياضيات، يمكن أن تُصبح أنظمة الذكاء الاصطناعي، مثل جيميني ديب ثينك، أدوات قيّمة لعلماء الرياضيات. فهي تُساعد في استكشاف مجالات جديدة، والتحقق من التخمينات، وحتى اكتشاف نظريات جديدة. ومن خلال أتمتة الجوانب الأكثر تعقيدًا في بناء البراهين، يُتيح الذكاء الاصطناعي لعلماء الرياضيات التركيز على العمل المفاهيمي الأكثر تعقيدًا. بالإضافة إلى ذلك، يُمكن للتقنيات المُطوّرة لهذه الأنظمة أن تُلهم أساليب جديدة في البحث الرياضي، والتي قد لا تُتاح بالجهد البشري وحده.
مع ذلك، يثير تقدم الذكاء الاصطناعي في الرياضيات تساؤلات حول دوره في البيئات التعليمية والمسابقات. ومع استمرار نمو قدرات الذكاء الاصطناعي، ستُثار نقاشات حول كيفية تأثيره على طبيعة التعليم والمنافسات الرياضية.
التطلعية
يُعدّ الفوز بالميدالية الذهبية في مسابقة IMO إنجازًا هامًا، إلا أن العديد من التحديات الرياضية لا تزال بعيدة المنال بالنسبة لأنظمة الذكاء الاصطناعي الحالية. ومع ذلك، فإن التقدم السريع من الفضية إلى الذهبية في عام واحد فقط يُبرز الوتيرة المتسارعة لابتكارات وتطورات الذكاء الاصطناعي. وإذا استمر هذا الوتيرة، فقد تُعالج أنظمة الذكاء الاصطناعي قريبًا بعضًا من أشهر مسائل الرياضيات التي لم تُحلّ بعد. وبينما لا يزال السؤال حول ما إذا كان الذكاء الاصطناعي سيحل محل الإبداع البشري أم سيُعززه دون إجابة، فإن مسابقة IMO لعام 2025 تُعدّ مؤشرًا واضحًا على أن الذكاء الاصطناعي قد حقق تقدمًا كبيرًا في التفكير المنطقي.












