الذكاء الاصطناعي

لماذا تفشل الذكاء الاصطناعي العامل في العالم الحقيقي

mm

على مدار السنوات القليلة الماضية ، شاهدنا أنظمة الذكاء الاصطناعي العامل تنتج عروضًا مثيرة للإعجاب. إنهم يكتبون رمزًا يمر بケース الاختبار. يبحثون على الويب ويعطون إجابات على أسئلة معقدة. يتنقلون في واجهات البرامج بدقة مذهلة. كل عرض مؤتمر ، كل بيان صحفي ، كل تقرير اختبار يبرز ظهور الذكاء الاصطناعي العامل.

لكن هناك مشكلة مخفية تحت هذه العروض المثيرة للإعجاب. عندما تتحرك هذه الأنظمة نفسها من بيئات خاضعة للرقابة إلى نشر العالم الحقيقي ، غالبًا ما تفشل بطرق لم تتوقعها البنود أبدًا. مولد الرمز الذي عمل بشكل مثالي على 100 مثال منضبط يبدأ في إنتاج أخطاء في حالات حافة لم يرها من قبل. وكلاء البحث على الويب الذين حققوا 85٪ دقة في المختبر يحصلون على نتائج أقل صلة مع تغيير سلوك المستخدم. نظام التخطيط الذي أعد 10 مكالمات API بشكل مثالي خلال الاختبار ينهار عند مواجهة تنسيق استجابة API غير متوقع.

تفشل هذه الأنظمة لا لأنها تفتقر إلى الذكاء ، ولكن لأنها تفتقر إلى التكيف. المشكلة تكمن في كيفية تعلم وضبط وكلاء الذكاء الاصطناعي. في حين أن الأنظمة المتقدمة مبنية على نماذج أساسية ضخمة ، فإن الذكاء الخام وحده غير كافٍ. لأداء مهام متخصصة ، يجب أن يكون الوكيل قادرًا على التكيف. لا تستطيع أنظمة الذكاء الاصطناعي العامل الحالية القيام بذلك بسبب القيود الهيكلية في تصميمها وبرمجتها. في هذه المقالة ، نستكشف هذه القيود ولماذا تستمر.

وهم القدرة في العروض

أخطار الفشل الأكثر خطورة في الذكاء الاصطناعي الحديث هو وهم الكفاءة. العروض القصيرة غالبًا ما تخفي التعقيد الحقيقي. تعمل على مجموعات بيانات نظيفة ، وواجهات برمجة تطبيقات قابلة للتنبؤ ، ونطاقات مهام ضيقة. بيئات الإنتاج هي العكس. قواعد البيانات غير مكتملة ، وال مخططات تتغير دون إشعار ، والخدمات تنتهي ، والصلاحيات تتعارض ، والمستخدمون يطرحون أسئلة تنتهك افتراضات النظام الأساسية.

هنا يزيد تعقيد الإنتاج بشكل كبير. حالة حافة واحدة تظهر مرة واحدة في العرض قد تظهر آلاف المرات في اليوم في النشر. تتراكم الأخطاء الاحتمالية الصغيرة. الوكيل الذي هو “معظم الوقت صحيح” يصبح غير موثوق به بسرعة في العمليات الحقيقية.

في صميم المشكلة يوجد الاعتماد على نماذج أساسية مجمدة. هذه النماذج تتفوق في إكمال الأنماط ، ولكن السلوك العامل هو متسلسل وذو حالة. كل عمل يعتمد على نتيجة العمل السابق. في مثل هذه الإعدادات ، تتراكم الشكوك الإحصائية بسرعة. يمكن أن يؤدي خطأ صغير في البداية إلى تسلسل من الحلقات أو النهايات المدمرة أو الإجراءات في وقت لاحق. هذا هو السبب في أن الوكلاء الذين يبدون قادرين خلال التقييم يتحولون بسرعة إلى غير موثوق بهم بمجرد نشرهم.

المشكلة ليست ميزة مفقودة. إنها أن النماذج العامة يتم طلبها لتصرفها مثل المتخصصين في المجال دون السماح لهم بالتعلم من بيئتهم.

من الذكاء العام إلى الكفاءة الموضوعة

نماذج الأساس هي عامة بتصميم. أنها ترموز المعرفة الواسعة والأنماط المرنة للتفكير. ومع ذلك ، يجب أن يكون وكلاء الإنتاج موضعيين. يجب أن يفهموا القواعد والقيود وطرق الفشل المحددة للمنظمة وأدواتها. بدون ذلك ، يبدون مثل شخص قرأ كل الدليل ولكن لم يعمل يومًا في الوظيفة.

لجسر هذه الفجوة ، يتعين إعادة التفكير في التكيف نفسه. الطرق الحالية تنقسم إلى فئتين عريضتين ، معيبة: إعادة تدريب الوكيل الذكاء الاصطناعي نفسه ، أو تعديل الأدوات الخارجية التي يستخدمها. كل نهج يحل مشكلة واحدة بينما يخلق أخرى. هذا يترك لنا أنظمة إما تكون قاسية أو باهظة التكلفة أو غير مستقرة لبيئات الإنتاج حيث يهم الثبات والتكلفة.

فخ الوكيل المتجانس

النهج الأول ، التكيف مع الوكيل ، يحاول جعل الوكيل الذكاء الاصطناعي أكثر ذكاء في استخدام الأدوات. إنه يعلم الوكيل بشكل أساسي المهارات المحددة التي يحتاجها لاستخدام الأدوات. يصنف الباحثون هذا إلى فئتين. بعض الطرق تتدرب على الوكيل باستخدام ملاحظات مباشرة من الأدوات ، مثل مجمع الرمز أو نتائج محرك البحث. بينما يتدرب البعض الآخر على الوكيل بناءً على صحة الإخراج النهائي ، مثل إجابة صحيحة أو خاطئة.

تظهر أنظمة مثل DeepSeek-R1 و Search-R1 أن الوكلاء يمكنهم تعلم استراتيجيات معقدة متعددة الخطوات لاستخدام الأدوات. ومع ذلك ، يأتي هذا القدر مع تكلفة كبيرة. التدريب على نماذج بمليار معامل هو استهلاك كبير للطاقة الحاسوبية. أكثر من ذلك ، يخلق ذكاءًا قاسيًا ومتينًا. من خلال الجمع بين معرفة الوكيل وقواعد استخدام الأدوات ، يجعل هذا النهج التحديثات بطيئة ومخاطرة وغير مناسبة لاحتياجات الأعمال التي تتغير بسرعة. التكيف مع الوكيل لاستخدام مهمة جديدة أو أداة يخاطر “النسيان الكارثي” ، حيث يفقد المهارات التي سبق أن أتقنها. إنه مثل الحاجة إلى إعادة بناء خط تجميع مصنع كامل كل مرة تريد إضافة أداة جديدة.

مشكلة الصندوق الأدوي المتحلل

معترفًا بهذه القيود ، النهج الثاني ، تكيف الأداة ، يترك الوكيل الأساسي مجمدًا ويتكيف مع الأدوات في بيئته. هذا أكثر تركيبية وفعالية من حيث التكلفة. بعض الأدوات يتم تدريبها بشكل عام ، مثل مسترجع بحث قياسي ، وتركيبها. بينما يتم تعديل البعض الآخر خصيصًا ليكمل الوكيل المجمد ، ويتعلم من مخرجاته ليكون مساعدًا أفضل.

يحمل هذا المنهج وعودًا كبيرة للكفاءة. أظهرت دراسة رائدة لنظام يسمى s3 إمكانات هذا النهج. لقد درب “مستجوب” متخصص صغير لدعم الوكيل المجمد ، وحقق أداءً قابلاً للمقارنة مع وكيل مجهز بالكامل مثل Search-R1 ، ولكن باستخدام 70 مرة أقل من بيانات التدريب. الفكرة هي لماذا إعادة تعليم فيزيائي عبقري كيفية استخدام فهرس مكتبة؟ بدلاً من ذلك ، تدرب على أمين مكتبة أفضل يفهم احتياجات الفيزيائي.

然而 ، نموذج الصندوق الأدوي له قيوده الخاصة. قدرات النظام بأكمله محدودة في النهاية بالاستدلال المجمد للوكيل. يمكنك إعطاء سكين حاد لجراح ، ولكن لا يمكنك جعل شخصًا غير جراح يؤدي جراحة قلب. بالإضافة إلى ذلك ، يصبح تنسيق مجموعة متزايدة من الأدوات التكيفية تحديًا في التكامل. قد يتحسن أداة A لقياس معين يخرق متطلبات الإدخال لأداة B. يعتمد أداء النظام على توازن هش بين المكونات المترابطة.

تحدي التكيف المشترك

هذا يأخذنا إلى صميم عجز التكيف في أنماذج الذكاء الاصطناعي العامل الحالية. إما نتكيف مع الوكيل أو الأدوات ، ولكن ليس كليهما بطريقة منسقة ومستقرة. بيئات الإنتاج ليست ساكنة. تظهر بيانات جديدة ومتطلبات المستخدم الجديدة وأدوات جديدة باستمرار. نظام الذكاء الاصطناعي الذي لا يستطيع التطور بسلاسة وأمان لكلا “دماغه” و “يديه” سوف ينهار في النهاية.

يحدد الباحثون الحاجة إلى التكيف المشترك باعتبارها الجبهة التالية. ومع ذلك ، إنه تحد صعب. إذا كان وكيل وأدوات يتعلمون في نفس الوقت ، من يحصل على الفضل أو اللوم على الفشل؟ كيف تمنع حلقة تغذية راجعة غير مستقرة حيث يتبع الوكيل والأدوات تغييرات بعضهم البعض دون تحسين الأداء العام؟ تظهر المحاولات المبكرة لهذا ، مثل معاملة علاقة الوكيل والأداة كـ نظام وكلاء تعاوني ، صعوبة ذلك. بدون حلول قوية لتحديد الفضل وثبات النظام ، يبقى حتى الذكاء الاصطناعي العامل الأكثر تقدمًا مجموعة من القدرات المثيرة للإعجاب ولكن المنفصلة.

الذاكرة كمنظومة من الدرجة الأولى

أحد أكثر علامات عجز التكيف وضوحًا هو الذاكرة الثابتة. لا يستطيع العديد من الوكلاء النشر تحسين أدائهم مع مرور الوقت. يكررون نفس الأخطاء لأنهم لا يستطيعون توطين الخبرة. كل互одействة يتم التعامل معها كما لو كانت الأولى.

تتطلب بيئات الإنتاج ذاكرة متكيفة. يحتاج الوكلاء إلى استدعاء الحوادث لمعالجة المهام على المدى الطويل ، وذاكرة استراتيجية لتحسين الخطط ، وذاكرة تشغيلية لتجنب تكرار الأخطاء. بدون ذلك ، يبدو الوكلاء هشين وغير موثوق بهم.

يجب معاملة الذاكرة كعنصر قابل للتعديل ، وليس سجلًا سلبيًا. الأنظمة التي تستعرض الخبرة وتتعلم من الأخطاء وتعدل سلوكها أكثر استقرارًا.

مخاطر جديدة من الأنظمة التكيفية

يُقدم التكيف مخاطره الخاصة. يمكن للوكلاء تعلم تحسين المقاييس بدلاً من الأهداف ، وهو ظاهرة تعرف باسم التكيف الطفيلي. قد يبدون ناجحين بينما يخدرون الهدف الأساسي. في أنظمة متعددة الوكلاء ، يمكن للأدوات المتضررة توجيه الوكلاء من خلال حقن سطر الأوامر الخادعة أو البيانات الخادعة. لتخفيف هذه المخاطر ، يتطلب الوكلاء آليات التحقق القوية. يجب أن تكون الإجراءات قابلة للفحص ، وقابلة للإلغاء ، وقابلة للتدقيق. تعمل طبقات الأمان بين الوكلاء والأدوات على ضمان عدم انتشار الأخطاء بلا مبالاة.

الخط الأساسي

من أجل عمل الذكاء الاصطناعي العامل في العالم الحقيقي ، لا يمكن أن يكون مجرد ذكاء ، بل يجب أن يكون قادرًا على التكيف. تفشل معظم الوكلاء اليوم لأنهم “مجمدون” في الوقت ، بينما العالم الحقيقي معقد ويتغير باستمرار. إذا لم يكن بإمكان الذكاء الاصطناعي تحديث ذاكرته وتحسين أخطائه ، فسيانهار في النهاية. لا تأتي الموثوقية من عرض مثالي ، بل من القدرة على التكيف.

الدكتور تيهسين زيا هو أستاذ مساعد دائم في جامعة كومساتس إسلام آباد، وحاصل على دكتوراه في الذكاء الاصطناعي من جامعة التكنولوجيا في فيينا، النمسا. يتخصص في الذكاء الاصطناعي وتعلم الآلة وعلوم البيانات ورؤية الكمبيوتر، وقدم مساهمات كبيرة من خلال منشورات في مجلات علمية مشهورة. كما قاد الدكتور تيهسين مشاريع صناعية مختلفة كمستслед رئيسي وقدم خدماته كمستشار في الذكاء الاصطناعي.