الذكاء الاصطناعي

التماثل في وقت الاختبار: السر وراء موجة جديدة من نماذج الاستدلال على مستوى الدكتوراه

mm

Reached مجال الذكاء الاصطناعي إلى نقطة حيث إضافة المزيد من البيانات أو زيادة حجم النموذج ليس أفضل طريقة لجعلها أكثر ذكاء. خلال السنوات القليلة الماضية، كنا نعتقد أن إذا بنينا شبكات عصبونية أكبر وأطعمها المزيد من الإنترنت، فإنها ستصبح في النهاية أكثر ذكاء. هذا النهج، المعروف باسم قوانين التماثل، عمل بشكل رائع. أعطانا نماذج يمكن أن تكتب الشعر، وتترجم اللغات، وتنجح في امتحان القانون. ومع ذلك، كافح هذه النماذج غالبًا مع المنطق العميق، والرياضيات المعقدة، والمشكلات العلمية متعددة الخطوات. كانت ممتازة في مطابقة الأنماط ولكن غالبًا ما فشلت في المشكلات التي تتطلب استدلالًا متعددة الخطوات.

最近، ظهرت اتجاه جديد يغير الطريقة التي نفكر بها عن قدرات الذكاء الاصطناعي. هذا الاتجاه يسمى التماثل في وقت الاختبار. بدلاً من التركيز فقط على مقدار ما يتعلمه النموذج خلال مرحلة التدريب، يركز الباحثون الآن على مقدار “فكر” النموذج عندما ي回答 سؤالاً. هذا التحول هو السر وراء أحدث موجة من نماذج الاستدلال، مثل سلسلة o1 من OpenAI، والتي تعمل الآن على مستوى طلاب الدكتوراه في مجالات صعبة مثل الفيزياء والكيمياء والأحياء.

الانتقال من تماثل التدريب إلى تماثل الاستدلال

للفهم لماذا هذا تغيير كبير، يجب علينا النظر إلى كيفية بناء الذكاء الاصطناعي حتى الآن. تقليدًا، تم تحديد “ذكاء” النموذج根据 تدريبه. هذا涉ل الملايين من الدولارات لتشغيل كميات هائلة من البيانات من خلال آلاف وحدات معالجة الرسومات. مرة واحدة انتهى التدريب، تم تجميد النموذج بشكل أساسي. عندما تسأله سؤالاً، سوف يقدم جوابًا تقريبًا على الفور بناءً على الأنماط التي تعلمها بالفعل. هذا ما نسميه استدلالًا أو وقت اختبار.

المشكلة مع هذا النهج التقليدى هي أن النموذج لديه فرصة واحدة فقط للحصول على الجواب الصحيح. يعالج الإشارة ويولد رموز واحدة تلو الأخرى بدون طريقة “لفكر” أو “التأكد” من منطقه قبل التحدث. التماثل في وقت الاختبار يغير هذه الديناميكية. يسمح للنموذج باستخدام المزيد من القوة الحاسوبية خلال مرحلة الاستدلال. كما يفعل الإنسان قد يأخذ بضع ثوان للاجابة على سؤال بسيط ولكن بضع دقائق أو ساعات لحل مشكلة رياضية معقدة، النماذج الاصطناعية يتم تصميمها الآن لتكيف جهودها بناءً على صعوبة المهمة.

تعريف مفهوم التماثل في وقت الاختبار

التماثل في وقت الاختبار يشير إلى التقنيات التي تسمح للنموذج الاصطناعي باستخدام موارد حاسوبية إضافية لمعالجة طلب في لحظة التسليم. ببساطة، يعني ذلك إعطاء النموذج المزيد من “زمن التفكير”. هذا ليس عن جعل النموذج أكبر؛ إنه عن جعل النموذج أكثر عقلانية. عندما يستخدم النموذج التماثل في وقت الاختبار، لا ينتج فقط الجواب الأول الذي يأتي في باله. بدلاً من ذلك، قد يبحث في مسارات مختلفة، ويبحث عن أخطاء في منطقه، ويعمل على تحسين جوابه قبل أن يرى المستخدم ذلك.

يتم مقارنة هذا المفهوم غالبًا بالطريقة التي تعمل بها الدماغ البشري. غالبًا ما يتحدث علماء النفس عن “النظام 1” و “النظام 2” للتفكير. النظام 1 سريع، غريزي، وعاطفي. إنه ما تستخدمه عندما تعرف وجهًا أو تقود سيارة على طريق مألوف. النظام 2 أبطأ، أكثر عقلانية، ومنطقي. إنه ما تستخدمه عندما تحل مشكلة رياضية معقدة أو تخطط لمشروع معقد. حتى وقت قريب، كانت نماذج اللغة الكبيرة في الغالب تفكيرًا من نوع النظام 1. التماثل في وقت الاختبار هو الجسر الذي يسمح لهم بالوصول إلى تفكير النظام 2.

ميكانيكا عملية الاستدلال

هناك عدة طرق يتحقق بها الباحثون التماثل في وقت الاختبار. واحدة من أكثر الطرق شيوعًا تسمى سلسلة الأفكار، ولكن في هذه النماذج الجديدة، يتم بناؤها مباشرة في النظام بدلاً من أن تكون شيئًا يجب على المستخدم أن يطلبها. يتم تدريب النموذج على كسر مشكلة إلى خطوات منطقية أصغر. من خلال القيام بذلك، يمكن للنموذج التحقق من كل جزء من الحل قبل الانتقال إلى الجزء التالي.

تكنولوجيا أخرى مهمة تتضمن خوارزميات البحث، مثل مونت كارلو للبحث في الشجرة. بدلاً من التنبؤ ببساطة بالكلمة التالية الأكثر احتمالاً، يولد النموذج مسارات возможة متعددة لجواب. يقيم هذه المسارات ويحدد أيهما الأكثر احتمالاً أن يؤدي إلى حل صحيح. إذا وصل إلى طريق مسدود أو أدرك أن خطوة سابقة كانت خاطئة، فيمكنه العودة ومحاولة نهج مختلف. هذه القدرة على “النظر إلى الأمام” مشابهة جدًا للطريقة التي يقيّم بها محرك الشطرنج آلاف الحركات المحتملة قبل اختيار أفضل حركة. من خلال البحث من خلال العديد من الاحتمالات خلال مرحلة الاستدلال، يمكن للنموذج حل مشاكل أكثر تعقيدًا من تلك التي يمكن حلها مباشرة باستخدام نموذج لغة قياسي.

لماذا يتطلب الاستدلال على مستوى الدكتوراه أكثر من الذاكرة

السبب في أن هذا الأمر مهم جدًا هو أن الاستدلال على مستوى عال في العلوم والرياضيات لا يمكن حلها بالذاكرة فقط. في امتحان الفيزياء على مستوى الدكتوراه، لا يمكنك ببساطة تكرار حقيقة قرأتها في كتاب مدرسي. يجب عليك تطبيق مبادئ معقدة على وضع جديد وفريد. النماذج القياسية غالبًا ما توهم في هذه السيناريوهات لأنها تحاول التنبؤ بالكلمة التالية بناءً على الاحتمال وليس المنطق.

التماثل في وقت الاختبار يسمح للنموذج بالتصرف أكثر مثل الباحث. يمكنه اختبار الفرضيات داخليًا. على سبيل المثال، إذا طُلب من نموذج كتابة قطعة معقدة من الكود، يمكنه “تشغيل” المنطق في سلسلة أفكاره الخفية، وتحديد خطأ محتمل، وتصحيحه قبل تقديم الكود النهائي. هذه القدرة على التصحيح الذاتي هي ما يسمح لأحدث النماذج بالحصول على درجات عالية في المعايير مثل امتحان الرياضيات الأمريكي الدعوي أو GPQA (اختبار علمي صعب مصممโดย الخبراء). إنهم لا يخمنون فقط؛ إنهم يتحققون.

التعادل بين الكفاءة وتكلفة الحوسبة

في حين أن التماثل في وقت الاختبار قوي، فإنه يأتي مع تكلفة كبيرة. في الطريقة القديمة للقيام بالأمور، كان الجزء الأكثر تكلفة من الذكاء الاصطناعي هو التدريب. مرة واحدة تم نشر النموذج، كان تشغيله بشكل نسبي يعتبر رخيصًا وسريعًا. مع التماثل في وقت الاختبار، تنتقل التكلفة إلى طلب المستخدم. بسبب أن النموذج يقوم بأكثر من العمل من خلال توليد مسارات متعددة ومراجعة عمله، يستغرق وقتًا أطول للرد ويحتاج إلى موارد أجهزة أكثر.

يخلق هذا نوعًا جديدًا من الاقتصاد للذكاء الاصطناعي. نحن نتحرك نحو وضع حيث يمكن أن تختلف “تكلفة الاستعلام” بشكل كبير. قد تكلفت سؤال بسيط عن الطقس بجزء من سنت ويتخذ ثانية. قد تكلفت استفسار علمي عميق بضع دولارات في وقت الحوسبة وربما يستغرق ساعة لمعالجته. هذا التعادل ضروري لتحقيق استدلال عالي المستوى، ولكنه يعني أيضًا أن المطورين يجب أن يجدوا طرقًا لجعل هذه النماذج كفاءة بحيث يمكن استخدامها على نطاق واسع في صناعات مثل الطب أو الهندسة.

التأثير على مستقبل الذكاء الاصطناعي

يرمز صعود التماثل في وقت الاختبار إلى أننا قد ندخل عصرًا جديدًا من تطوير الذكاء الاصطناعي. لسنوات، كان هناك قلق من أننا في النهاية سوف نفقد بيانات بشرية عالية الجودة لتدريب النماذج. إذا كانت النماذج تتعلم فقط من ما كتبه البشر بالفعل، فقد تصل إلى سقف. ومع ذلك، يظهر التماثل في وقت الاختبار أن النماذج يمكنها تحسين أدائها بالتفكير أكثر، وليس فقط بقراءة المزيد.

هذا يفتح الباب أمام الذكاء الاصطناعي لاكتشافاته الخاصة. إذا كان نموذجًا يمكنه استدلال مشكلة لم يره من قبل، فيمكنه أن يجد حلولًا جديدة في العلوم الموادية، اكتشاف الأدوية، أو الطاقة المتجددة. ينتقل الذكاء الاصطناعي من كونه مساعدًا مفيدًا يلخص النص إلى كونه شريكًا رقميًا يمكنه مساعدة حل أكثر مشاكل العالم الصعبة. نحن نشهد تحركًا بعيدًا عن “الذكاء الاصطناعي التوليدي” نحو “الذكاء الاصطناعي الاستدلالي”.

الخط الأساسي

التماثل في وقت الاختبار يثبت أنه الرابط المفقود في السعي نحو الذكاء الاصطناعي المتقدم. من خلال السماح للنماذج باستخدام المزيد من القوة الحاسوبية في وقت الاستدلال، قمنا بفتح مستوى أداء كان يُعتقد في السابق أنه بعيد السنوات. هذه النماذج تبدأ في إظهار نوع من المنطق يبدو أقرب إلى الذكاء البشري من مجرد مطابقة الأنماط البسيطة في الماضي.

كما نتقدم، ستكون التحديات في تحسين هذه التقنيات. نحن بحاجة إلى جعل الاستدلال أسرع وأكثر سهولة، مع إيجاد التوازن الصحيح بين “الفكر السريع” و “الفكر البطيء”. السر لا يعود إلى حجم النموذج أو مقدار البيانات التي رأها. السر هو كيف يستخدم النموذج وقته للتفكير. لأي شخص يتابع تقدم الذكاء الاصطناعي، من الواضح أن التركيز قد تحول. السباق لم يعد فقط حول من لديه أكبر نموذج، ولكن من لديه نموذج يمكنه الاستدلال بشكل أفضل. هذا التحول سوف يحدد على الأرجح العقد القادم من الابتكارات في هذا المجال.

الدكتور تيهسين زيا هو أستاذ مساعد دائم في جامعة كومساتس إسلام آباد، وحاصل على دكتوراه في الذكاء الاصطناعي من جامعة التكنولوجيا في فيينا، النمسا. يتخصص في الذكاء الاصطناعي وتعلم الآلة وعلوم البيانات ورؤية الكمبيوتر، وقدم مساهمات كبيرة من خلال منشورات في مجلات علمية مشهورة. كما قاد الدكتور تيهسين مشاريع صناعية مختلفة كمستслед رئيسي وقدم خدماته كمستشار في الذكاء الاصطناعي.