اتصل بنا للحصول على مزيد من المعلومات

كل ما تحتاج إلى معرفته حول مشغل OpenAI

الذكاء الاصطناعي

كل ما تحتاج إلى معرفته حول مشغل OpenAI

mm
(أوبن إيه آي)

على مدار الأسابيع القليلة الماضية، كانت OpenAI تضع الأساس. وفي حين كان معظم المستخدمين قد بدأوا للتو في استكشاف مهام ChatGPT - ميزة جديدة تتيح للمستخدم جدولة المهام وتشغيلها - كانت الشركة تستعد لشيء أكثر أهمية.

إصدار الأمس من المُشغل إنها إشارة واضحة أخرى إلى المكان الذي يتجه إليه الذكاء الاصطناعي: من النماذج التي تقوم ببساطة بمعالجة المعلومات إلى الوكلاء الذين يمكنهم العمل بنشاط جنبًا إلى جنب معنا.

نقضي يوميًا ساعات لا تُحصى في تصفح المواقع الإلكترونية، وملء النماذج، وحجز الخدمات، وإدارة المهام الرقمية. في الغالب، كان دور الذكاء الاصطناعي يقتصر على تقديم النصائح أو معالجة النصوص. وقد أعلنت شركة Operator، إلى جانب بعض إعلانات الوكلاء الأخرى مؤخرًا مثل Anthropic، عن... استخدام الكمبيوتر وجوجل مشروع مارينر، تغيير هذه الديناميكية بالكامل.

إن الإنجاز التقني هنا مهم. فقد ابتكرت شركة OpenAI ذكاء اصطناعيًا يمكنه رؤية واجهات الويب والتفاعل معها مثل الإنسان. فهو يلتقط لقطات شاشة، ويفهم التخطيطات المرئية، ويتخذ القرارات بشأن المكان الذي يجب النقر عليه، وما يجب كتابته، وكيفية التنقل.

إليك ما تحتاج إلى معرفته حول وكيل المشغل: في حين أن العديد من أدوات الذكاء الاصطناعي محصورة بشكل أساسي خلف واجهات برمجة التطبيقات والتكاملات المتخصصة، فإن Operator يعمل مع الويب تمامًا كما تفعل أنت. فهو يرى الشاشة ويفهم السياق ويتخذ الإجراء بشكل مباشر.

مشغل العرض التوضيحي

نظرة عن كثب على الأداء الحقيقي للمشغل

عند إصدار شركات الذكاء الاصطناعي لمعاييرها، من المهم التدقيق في معناها الفعلي. يختلف أداء المُشغّل باختلاف بيئات الاختبار.

المقياس الأكثر إثارة للإعجاب هو معدل نجاح المشغل بنسبة 87٪ على معيار WebVoyagerوهذا مهم لأن WebVoyager يختبر مواقع الويب في العالم الحقيقي - المنصات الفعلية التي نستخدمها يوميًا مثل Amazon وGoogle Maps. وهذا ليس اختبارًا معمليًا خاضعًا للرقابة. إنه أداء في البرية.

ولكن عندما ننظر إلى معايير أخرى، نرى صورة أكثر دقة:

  • معيار WebArena: معدل نجاح 58.1%. اختبار مواقع الويب المحاكاة لمهام مثل التسوق وإدارة المحتوى. يكشف الأداء المنخفض هنا في الواقع عن شيء مهم حول كيفية تعامل وكلاء الذكاء الاصطناعي مع البيئات المنظمة مقابل البيئات غير المنظمة.
  • معيار OSWorld: معدل نجاح 38.1%. يختبر هذا مهام معقدة ومتعددة الخطوات مثل دمج ملفات PDF من رسائل البريد الإلكتروني. يوضح لنا الانخفاض الكبير في الأداء الحدود الحالية لوكلاء الذكاء الاصطناعي عندما تتطلب المهام تبديلات سياق متعددة.

ما يثير اهتمامي في هذه الأرقام هو كيف تعكس أنماط التعلم البشرية. فنحن عادة نؤدي بشكل أفضل في البيئات المألوفة في العالم الحقيقي مقارنة بسيناريوهات الاختبار الاصطناعية. والحقيقة أن Operator يتفوق على المواقع الفعلية بينما يواجه صعوبات في المواقع المحاكاة، مما يشير إلى أن تدريبه يعطي الأولوية للفائدة العملية على الأداء النظري.

تضع هذه المعايير معايير جديدة لأرقام قياسية في أتمتة المتصفح، ولكن معدلات النجاح المتفاوتة عبر الاختبارات المختلفة تخبرنا بشيء بالغ الأهمية حول استراتيجية OpenAI.

فكّر في تصفحك للإنترنت. معظم المهام بسيطة: ملء النماذج، الشراء، حجز المواعيد. وهنا يبرز معدل نجاح Operator البالغ 87%. أما المهام الأكثر تعقيدًا - حيث ينخفض ​​الأداء - فهي عادةً ما تكون ذات أهمية قصوى للمراقبة البشرية.

تشير هذه البيانات إلى أن OpenAI تتخذ خيارًا متعمدًا: إتقان المهام الشائعة أولاً، ثم التوسع تدريجيًا إلى عمليات أكثر تعقيدًا. إنه نهج عملي يعطي الأولوية للمنفعة الفورية على القدرات النظرية.

معايير أداء وكلاء الذكاء الاصطناعي (OpenAI)

استراتيجية OpenAI وراء المشغل

يكشف نهج OpenAI مع Operator عن استراتيجية منظمة بعناية.

أولاً، ضع في اعتبارك التوقيت. لم يكن طرح ميزات مثل ChatGPT Tasks مؤخرًا يهدف إلى إضافة ميزات فحسب، بل كان يهدف إلى إعداد المستخدمين للتعامل مع الوكلاء المستقلين.

ولكن ما هو مثير للاهتمام حقًا هو أن شركة OpenAI تخطط لعرض نموذج CUA من خلال واجهة برمجة التطبيقات. وهذا يعني أن المطورين سيكونون قادرين على إنشاء وكلاء باستخدام الكمبيوتر.

والآثار المترتبة على ذلك كبيرة:

  1. إمكانية التكامل
  • الدمج المباشر في سير العمل الحالية
  • وكلاء مخصصون لتلبية احتياجات الأعمال المحددة
  • حلول الأتمتة الخاصة بالصناعة
  1. مسار التنمية المستقبلية
  • التوسع لمستخدمي Plus وTeam وEnterprise
  • التكامل المباشر مع ChatGPT
  • التوسع الجغرافي (على الرغم من أن أوروبا سوف تستغرق وقتًا أطول بسبب المتطلبات التنظيمية)

وتُعد الشراكات الاستراتيجية مفيدة أيضًا. إذ تحاول شركة OpenAI إنشاء نظام بيئي كامل. وهي تعمل مع شركات مثل DoorDash وInstacart وOpenTable، ولكن أيضًا مع منظمات القطاع العام مثل مدينة ستوكتون.

ويشير هذا إلى مستقبل حيث لا يكون وكلاء الذكاء الاصطناعي مجرد مساعدين بل جزءًا لا يتجزأ من كيفية تفاعلنا مع الأنظمة الرقمية.

ماذا يعني هذا فعليا بالنسبة لك

نحن ندخل مرحلة حيث لم يعد الذكاء الاصطناعي يجيب على الأسئلة فحسب، بل أصبح مشاركًا نشطًا في حياتنا الرقمية.

فكّر في مهامك اليومية على الإنترنت. ليس العمل المُعقّد والاستراتيجي الذي يتطلب خبرتك، بل المهام المتكررة. أتحدث هنا عن البحث عن خيارات السفر عبر مواقع متعددة، وملء نماذج موحدة، وجمع البيانات من مصادر إلكترونية مُختلفة، وإدارة الحجوزات الروتينية. هنا يبدأ Operator في التخلص من الأعمال الرقمية المُرهقة. لكن هذا لن يتوقف. مع مرور الوقت، سيتمكن وكلاء الذكاء الاصطناعي من إكمال سير عمل أكثر تعقيدًا.

كما تخبرنا بيانات الأداء المبكرة بأمر بالغ الأهمية: يتفوق المشغل في أداء مهام الويب الروتينية بنسبة نجاح تصل إلى 87%. وسوف يتمتع المستخدمون الأوائل الذين يتعلمون كيفية دمجه بفعالية بميزة إنتاجية كبيرة.

يُظهر الجدول الزمني للتكامل نهج OpenAI الدقيق. يبدأ الفريق بمستخدمي Pro في الولايات المتحدة، ثم يتوسع ليشمل مستخدمي Plus وTeam وEnterprise، قبل أن يتكاملوا مباشرةً مع ChatGPT.

إننا نشهد تحولاً جوهرياً في كيفية عمل أدوات الذكاء الاصطناعي. والسؤال الحقيقي الذي ينبغي لك أن تطرحه على نفسك ليس ما إذا كان عليك التكيف مع هذا التغيير، بل كيف تفعل ذلك استراتيجياً. إن التكنولوجيا سوف تتطور، ولكن المبدأ يظل كما هو: فالذكاء الاصطناعي ينتقل من الإجابة على الأسئلة إلى اتخاذ الإجراءات. وسوف يتمتع أولئك الذين يفهمون هذا التحول في وقت مبكر بميزة كبيرة في تشكيل كيفية دمج هذه الأدوات في سير عملهم.

أليكس ماكفارلاند صحفي وكاتب في مجال الذكاء الاصطناعي يستكشف أحدث التطورات في مجال الذكاء الاصطناعي. لقد تعاون مع العديد من الشركات الناشئة والمنشورات في مجال الذكاء الاصطناعي في جميع أنحاء العالم.