Connect with us

معمل الوكيل: فريق بحث افتراضي من AMD و Johns Hopkins

الذكاء الاصطناعي

معمل الوكيل: فريق بحث افتراضي من AMD و Johns Hopkins

mm

بينما كان الجميع يتحدثون عن وكلاء الذكاء الاصطناعي و التأتمات، قامت AMD و جامعة جونز هوبكينز بتحسين كيفية تعاون البشر و الذكاء الاصطناعي في البحث. إطارهم الجديد مفتوح المصدر، معمل الوكيل، هو إعادة تخيل كاملة لكيفية تسريع البحث العلمي من خلال تعاون الإنسان و الذكاء الاصطناعي.

بعد النظر في العديد من إطارات البحث بالذكاء الاصطناعي، يبرز معمل الوكيل لنهجه العملي. بدلاً من محاولة استبدال الباحثين البشر (مثل الحلول الحالية)، يركز على تعزيز قدراتهم من خلال التعامل مع الجوانب المستهلكة للزمن في البحث مع الحفاظ على البشر في مقعد السائق.

الابتكار الرئيسي هنا بسيط ولكن قوي: بدلاً من السعي إلى البحث التام الذكاء الاصطناعي (الذي غالباً ما يؤدي إلى نتائج مشكوك فيها)، يخلق معمل الوكيل مختبراً افتراضياً حيث يعمل وكلاء الذكاء الاصطناعي المتخصصون معاً، كل واحد منهم يتعامل مع جوانب مختلفة من عملية البحث مع الحفاظ على التوجيه البشري.

تفكيك المختبر الافتراضي

افكر في معمل الوكيل كفريق بحث منسق جيداً، ولكن مع وكلاء الذكاء الاصطناعي يلعبون أدواراً متخصصة. مثل مختبر بحث حقيقي، لكل وكيل مسؤوليات وخبرة محددة:

  • وكيل الدكتوراه يتعامل مع استعراض الأدب و تخطيط البحث
  • وكلاء ما بعد الدكتوراه يساعدون في تحسين المناهج التجريبية
  • وكلاء مهندس التعلم الآلي يتعاملون مع التنفيذ الفني
  • وكلاء الأستاذ يقيّمون و يُقيمون مخرجات البحث

ما يجعل هذا النظام مثيراً للاهتمام بشكل خاص هو تدفق العمل. على عكس أدوات الذكاء الاصطناعي التقليدية التي تعمل في العزل، يخلق معمل الوكيل بيئة تعاونية حيث يتفاعل و يبني هؤلاء الوكلاء على عمل بعضهم البعض.

يتابع العملية تطوراً طبيعياً في البحث:

  1. استعراض الأدب: وكيل الدكتوراه يبحث في الأوراق الأكاديمية باستخدام واجهة برمجة التطبيقات arXiv، و يجمع و ينظم البحث ذا الصلة
  2. صياغة الخطة: وكلاء الدكتوراه و ما بعد الدكتوراه يتعاونون لإنشاء خطط بحث مفصلة
  3. التنفيذ: وكلاء مهندس التعلم الآلي يكتبون و يختبرون الكود
  4. التحليل و التوثيق: يعمل الفريق معاً لتحليل النتائج و إنشاء تقارير شاملة

ولكن هنا يأتي الجانب العملي: إطار العمل مرن من حيث الحوسبة، مما يسمح للباحثين بتخصيص الموارد بناءً على إمكانية الوصول إلى القوة الحاسوبية و قيود الميزانية. هذا يجعلها أداة مصممة للبيئات البحثية في العالم الحقيقي.

Schmidgall et al.

العامل البشري: حيث يلتقي الذكاء الاصطناعي بالخبرة

بينما يحتوي معمل الوكيل على قدرات تلقائية مثيرة للإعجاب، يحدث السحر الحقيقي في ما يسمونه “وضع المساعد”. في هذا الإعداد، يمكن للباحثين تقديم ملاحظات في كل مرحلة من مراحل العملية، مما يخلق تعاوناً حقيقياً بين الخبرة البشرية و مساعدة الذكاء الاصطناعي.

كشفت بيانات ملاحظات المساعد عن بعض الاكتشافات المثيرة. في الوضع التلقائي، حصلت الأوراق التي أنتجها معمل الوكيل على متوسط تقييم 3.8/10 في التقييمات البشرية. ولكن عندما شارك الباحثون في وضع المساعد، قفزت تلك التقييمات إلى 4.38/10. ما هو مثير للاهتمام بشكل خاص هو حيث ظهرت هذه التحسينات – سجلت الأوراق درجات أعلى بكثير في الوضوح (+0.23) و العرض (+0.33).

ولكن هنا هي الفحص الواقعي: حتى مع المشاركة البشرية، سجلت هذه الأوراق درجات أقل بـ 1.45 نقطة من المعدل المقبول للورقة NeurIPS (التي تبلغ 5.85). هذا ليس فشلاً، ولكنه تعلم حاسم حول كيفية حاجة الخبرة البشرية و قدرات الذكاء الاصطناعي إلى التكامل.

كشفت التقييم عن شيء آخر مثير للاهتمام: قيم المراجعون الذكاء الاصطناعي الأوراق بثبات أعلى بـ 2.3 نقطة من المراجعين البشر. هذا الفجوة تبرز لماذا يبقى الإشراف البشري حاسماً في تقييم البحث.

Schmidgall et al.

تفكيك الأرقام

ما الذي يهم حقاً في بيئة بحث؟ التكلفة و الأداء. يظهر подход معمل الوكيل لمقارنة النماذج بعض المكاسب الكفاءة المثيرة في هذا الصدد.

ظهر GPT-4o كبطل السرعة، حيث أكمل تدفق العمل كله في 1,165.4 ثانية فقط – هذا أسرع 3.2 مرة من o1-mini و 5.3 مرة من o1-preview. ولكن ما هو أكثر أهمية هو أنه يكلف فقط 2.33 دولار لكل ورقة. بالمقارنة مع الطرق البحثية التلقائية السابقة التي تكلف حوالي 15 دولار، نحن نتحدث عن تخفيض التكلفة بنسبة 84%.

نظرًا إلى أداء النموذج:

  • سجل o1-preview أعلى درجات في الفائدة و الوضوح
  • حقق o1-mini أعلى درجات جودة تجريبية
  • تأخر GPT-4o في المعايير ولكن قاد في الكفاءة التكلفة

الآثار الواقعية هنا هامة.

يمكن للباحثين الآن اختيار نهجهم بناءً على احتياجاتهم المحددة:

  • تحتاج إلى بروتوكول سريع؟ يقدم GPT-4o السرعة و الكفاءة التكلفة
  • تُفضل جودة التجربة؟ قد يكون o1-mini أفضل رهان لك
  • تبحث عن مخرجات أكثر نضجاً؟ يظهر o1-preview وعداً

تسمح هذه المرونة لأفرقة البحث بالتعديل في الإطار بناءً على مواردهم و متطلباتهم، بدلاً من أن يكونوا مقيدون بحل واحد يناسب الجميع.

فصل جديد في البحث

بعد النظر في قدرات معمل الوكيل و نتائجه، أنا مقتنع بأننا نشهد تحولاً كبيراً في كيفية إجراء البحث. ولكن ليس هذا هو السرد الذي يغلب على العناوين – إنها قصة أكثر دقة و قوة.

بينما لا تصل أوراق معمل الوكيل بعد إلى معايير الأبحاث الرائدة، فهي تخلق نمطاً جديداً لتسريع البحث. فكر في الأمر كفريق من مساعدي البحث بالذكاء الاصطناعي الذين لا ينامون، كل واحد منهم متخصص في جوانب مختلفة من العملية العلمية.

الآثار على الباحثين هائلة:

  • يمكن توجيه الوقت الذي يتم قضاءه على استعراض الأدب و البرمجة الأساسية إلى التخيل الإبداعي
  • يمكن جعل أفكار البحث التي قد تكون قد وضعت على الرف بسبب قيود الموارد قابلة للتطبيق
  • يمكن أن يؤدي القدرة على بروتوكول سريع و اختبار الفرضيات إلى تحقيق اختراقات أسرع

التقييدات الحالية، مثل الفجوة بين تقييمات الذكاء الاصطناعي و البشر، هي فرص. كل تكرار لهذه الأنظمة يقربنا أكثر من تعاون بحث أكثر تطوراً بين البشر و الذكاء الاصطناعي.

نظرًا إلى الأمام، أرى ثلاث تطورات رئيسية يمكن أن تغير الاكتشاف العلمي:

  1. ستظهر أنماط تعاون أكثر تطوراً بين الإنسان و الذكاء الاصطناعي مع تعلم الباحثين كيفية استغلال هذه الأدوات بشكل فعال
  2. يمكن أن يؤدي التوفير في التكلفة و الوقت إلى ديمقراطية البحث، مما يسمح للمعامل و المؤسسات الصغيرة بمتابعة مشاريع أكثر طموحاً
  3. يمكن أن يؤدي القدرة على بروتوكول سريع إلى المزيد من النهج التجريبية في البحث

المفتاح لتحقيق هذا الإمكانية؟ فهم أن معمل الوكيل و الإطارات المماثلة هي أدوات لتكبير، لا تلقائية. مستقبل البحث ليس عن اختيار بين الخبرة البشرية و قدرات الذكاء الاصطناعي – إنها عن إيجاد طرق مبتكرة لدمجها.

Alex McFarland هو صحفي وكاتب في مجال الذكاء الاصطناعي يستكشف أحدث التطورات في الذكاء الاصطناعي. وقد تعاون مع العديد من الشركات الناشئة في مجال الذكاء الاصطناعي والمنشورات في جميع أنحاء العالم.