الذكاء الاصطناعي
OpenAI و Anthropic تطلقان نماذج Dueling في الوقت الذي تتشدد فيه سباق الأسلحة الإصطناعية

أطلقت OpenAI و Anthropic نماذجها الرائدة الجديدة في غضون دقائق من بعضها البعض اليوم، بينما أطلقت OpenAI في الوقت نفسه منصة وكلاء المؤسسة وطرح Perplexity ميزة بحث متعددة النماذج. اليوم قدم أكثر الإعلانات عن المنتجات الإصطناعية أهمية في بعد ظهر واحد مما تنتجه معظم الأسابيع في المجموع.
هنا ما تم إطلاقه وما يعنيه.
Anthropic’s Opus 4.6: فرق الوكلاء ونافذة مليون رمز
أطلقت Anthropic Claude Opus 4.6، وهو نموذجها الأكثر قدرة، مع ميزتين رئيسيتين: نافذة سياق تبلغ مليون رمز وسمات جديدة تسمى فرق الوكلاء.
نافذة السياق هي الإنجاز الفني الأكبر. عند مليون رمز، يمكن ل Opus 4.6 معالجة حوالي 3000 صفحة من النص في استدعاء واحد — أربع مرات الحد الأقصى البالغ 256000 رمز من سابقه. متوفر مع دعم الإخراج البالغ 128000 رمز، يمكن للنموذج الآن استيعاب العمل مع قواعد بيانات كاملة أو مستندات قانونية أو مجموعات بحثية دون تقطيع أو تلخيص.
فرق الوكلاء، المتاحة في Claude Code، تسمح لمultiple Claude instances بالعمل بالتوازي على قاعدة بيانات مشتركة. بدلاً من وكيل واحد ينفذ المهام بشكل متسلسل، يمكن للمطورين تشغيل فرق حيث يعالج وكيل التغييرات في الواجهة، ووكيل آخر يكتب الاختبارات، ووكيل ثالث يعيد هيكلة المنطق الخلفي — جميعهم يتناسقون على نفس المشروع في نفس الوقت.
كما يطرح Opus 4.6 التفكير التكيفي، الذي يسمح للنموذج بضبط مقدار الجهد العقلاني الذي يجب استثماره في استدعاء معين. الإجابات السريعة للأسئلة البسيطة؛ مشاكل معقدة تؤدي إلى تفكير موسع أعمق. يمكن للمطورين تعديل هذا عبر عناصر التحكم في الجهد عبر أربعة مستويات: منخفض ومتوسط ومرتفع وأقصى.
على المقاييس، يحصل Opus 4.6 على أعلى الدرجات على Terminal-Bench 2.0 للترميز الوكيل ويتقدم في Humanity’s Last Exam، وهو تقييم للتفكير المعقد. تدعي Anthropic تفوقًا يبلغ 144 نقطة Elo على GPT-5.2 على تقييم GDPval-AA وتحسينًا يبلغ 190 نقطة عن Opus 4.5.
تظل أسعار API دون تغيير عند 5 دولارات لكل مليون رمز إدخال و 25 دولارًا لكل مليون رمز إخراج، على الرغم من أن الاستدعاءات التي تتجاوز 200000 رمز تحمل معدل متميز يبلغ 10/37.50 دولارًا.
في خطوة مؤسسية ملحوظة، أعلنت Anthropic عن معاينة بحثية ل Claude في Microsoft PowerPoint، حيث يمكن للنموذج قراءة تخطيطات الشرائح والقوالب الحالية وإنشاء أو تعديل العروض التقديمية مع الحفاظ على تنسيق العلامة التجارية.
OpenAI’s GPT-5.3-Codex: النموذج الذي ساعد في بناء نفسه
بعد دقائق من إعلان Anthropic، أطلقت OpenAI GPT-5.3-Codex، وهو نموذج الترميز الأكثر قدرة. يوحيد الإصدار أداء الترميز الرائد ل GPT-5.2-Codex مع قدرات التفكير والمعرفة المهنية ل GPT-5.2 في نظام واحد هو أيضًا أسرع بنسبة 25%.
المطالبة الأكثر إثارة للاهتمام: ساعد GPT-5.3-Codex في بناء نفسه. استخدم فريق Codex في OpenAI إصدارات مبكرة من النموذج خلال عملية تدريبه — تصحيح تشغيل التدريب وإدارة بنية التوزيع وتشخيص نتائج التقييم. إنه أول إعتراف عام من OpenAI بأن النموذج كان инструментيًا في تطويره، وهو علامة فارقة تثير أسئلة الكفاءة والسلامة.
يحقق GPT-5.3-Codex درجات قياسية جديدة في SWE-Bench Pro و Terminal-Bench، وهي مقاييس تقييم المهام الهندسية البرمجية في العالم الحقيقي. يمكن للنموذج التعامل مع المهام التي تستمر لمدة طويلة تتضمن البحث واستخدام الأدوات والتنفيذ المعقد، ويمكن للمستخدمين التفاعل معه في منتصف المهمة دون فقدان السياق — أكثر مثل التعاون مع زميل من إصدار الأوامر.
النموذج متاح الآن لجميع مستخدمي خطة ChatGPT المدفوعة عبر تطبيق Codex و CLI و IDE extension و واجهة الويب. وصول API قادم قريباً.
لمطوري البرامج الذين يختارون بين مولدات الشفرة الإصطناعية، الصورة التنافسية الآن محددة بشكل حاد: يتقدم Opus 4.6 في تنسيق الوكيل وعمل السياق الطويل، بينما يركز GPT-5.3-Codex على السرعة والتفكير المتكامل. كلاهما يطالب بأعلى الدرجات على المقاييس المتداخلة، وأدوات مثل Cursor و Apple’s Xcode يدعم كلاهما، لذلك يمكن للمطورين التبديل بحرية.
OpenAI Frontier: وكلاء المؤسسة يحصلون على منصتهم الخاصة
إلى جانب إطلاق النموذج، أعلنت OpenAI Frontier، وهي منصة مؤسسية لإنشاء وتوزيع وإدارة وكلاء الإصطناعية. يصل Frontier إلى قواعد البيانات وأنظمة CRM وأنظمة HR وأدوات التذاكر وغيرها من تطبيقات الأعمال، ثم يسمح لوكلاء الإصطناعية بتنفيذ العمليات عبرها.
وصفت OpenAI Frontier بأنها “طبقة семантиكية للمؤسسة” حيث يعمل الموظفون البشريون ووكلاء الإصطناعية على نفس المنصة مع الوصول المشترك إلى البيانات وضوابط الأمان.
المنصة غير معتمدة على النموذج — يمكن للشركات إدارة وكلاء تم بناؤهم على نماذج OpenAI إلى جانب تلك من Google و Microsoft و Anthropic. تشمل العملاء الأوليين Intuit و State Farm و Thermo Fisher و Uber.
يضع Frontier OpenAI في منافسة مباشرة مع منصات المؤسسة مثل Agentforce من Salesforce ووكلاء الإصطناعية من ServiceNow. الفرق: OpenAI تبني من طبقة النموذج إلى الأعلى، بينما يضيف الموردين الحاليون الإصطناعية إلى أدوات العمل المتداولة. سوف تحدد ما إذا كانت المؤسسات تفضل بنية وكلاءها من مزود الإصطناعية أو بائع البرامج منافسة الإصطناعية في المؤسسة في عام 2026.
مجلس Perplexity للنموذج: ثلاثة نماذج، إجابة واحدة
أطلقت Perplexity Model Council، وهو ميزة يُشغل عبرها نفس الاستعلام على ثلاثة نماذج في نفس الوقت — Claude Opus و GPT و Gemini — ثم يستخدم نموذجًا مركبًا لمصالحة مخرجاتهم في إجابة واحدة تشير إلى مناطق الاتفاق والاختلاف.

Image: Perplexity
الفرضية هي أن لا نموذج واحد موثوق به بشكل موثوق به عبر جميع الاستفسارات. عندما تتقارب ثلاثة نماذج رائدة على نفس الإجابة، يكون الثقة مرتفعًا. عندما تختلف، يعرف المستخدمون أن يبحثوا بشكل أعمق. مجلس النموذج متاح لمشتركي Max وموجه لبحث الاستثمار والتحليل الاستراتيجي وصنع القرار المعقد.
ت反映 الميزة استراتيجية Perplexity في التميز من خلال تنسيق النماذج المتعددة بدلاً من بناء نماذج أساسية. مع تضيق الفجوة بين نماذج الإصطناعية الرائدة على مقاييس فردية، قد يثبت دمج مخرجاتها أنه أكثر قيمة من اختيار مزود واحد.
ما يعنيه كل هذا
تؤكد هذه الإصدارات أن المنافسة الإصطناعية قد انتقلت من قدرة النموذج إلى بنية المنتج. كلاً من OpenAI و Anthropic لديهما نماذج تتصدر نفس المقاييس؛ التمايز الآن يعيش في ما يمكنك بناءه فوقها.
Perplexity، في غضون ذلك، يقدم حجة هادئة بأن حروب النماذج قد تكون أقل أهمية من كيفية دمج النماذج. إذا أثبت مجلس النموذج أنه مفيد، فإنه يشير إلى أن المستقبل ليس اختيارًا بين Claude و GPT — بل استخدامهما.
للمطورين والمؤسسات التي تقيم مكدس الإصطناعية، هذا جعل القرار أكثر صعوبة.












