اتصل بنا للحصول على مزيد من المعلومات

لا، الذكاء الاصطناعي لا يتباطأ. أنت تنظر إلى لوحة النتائج الخاطئة.

قاده التفكير

لا، الذكاء الاصطناعي لا يتباطأ. أنت تنظر إلى لوحة النتائج الخاطئة.

mm

بدأ المسؤولون التنفيذيون في إعادة النظر في خططهم المتعلقة بالذكاء الاصطناعي. فبعد الطفرة الأولية في أدوات التوليد عام 2023، من الطبيعي التساؤل عما إذا كان الزخم قد تباطأ. لكن هذا التساؤل يُسيء فهم الوضع. لم يتوقف التقدم في مجال الذكاء الاصطناعي، بل تغير مساره.

ما كان يبدو في السابق وكأنه تغيير هائل ظاهريًا، كالكتابة السلسة والملخصات المتقنة، يحدث الآن في مجالات أعمق وأكثر أهمية: كالتفكير المنطقي، والبرمجة، وتنسيق سير العمل، والفهم متعدد الوسائط. هذه التطورات أقل بريقًا، لكنها أكثر تأثيرًا بكثير. إذا كنت لا تزال تقيس الذكاء الاصطناعي بقدرته على كتابة فقرة أفضل، فأنت تغفل التحول الحقيقي.

المكاسب الحقيقية تتحقق حيث يتم إنجاز العمل

يتسارع التقدم في المجالات الأكثر أهمية. ففي المعايير الجديدة الصارمة مثل GPQA، التي تقيّم مهارات التفكير العلمي على مستوى الدراسات العليا، قفز أداء النموذج بنسبة تقارب 49 نقطة مئوية على أساس سنوي. في اختبار MMMU، الذي يختبر المهام متعددة المجالات والوسائط، ارتفعت الدرجات بما يقرب من 19 نقطة. مقعد SWE، وهو معيار يتطلب إصلاح قواعد بيانات GitHub الحقيقية واجتياز الاختبارات الآلية، قفز من 4.4٪ إلى أكثر من 71٪ في عام واحد.

هذه ليست تحسينات طفيفة، بل تُظهر أن نماذج اللغة الكبيرة تتقن المهام التي تتطلب دقةً واستدلالًا وتكاملًا عبر الأنظمة المعقدة. ويتجاوز برنامج SWE-bench، على وجه الخصوص، المسائل التجريبية ليُثبت ما إذا كان بإمكان النماذج المشاركة في تطوير البرمجيات الفعلي، وهو مستوى كان يبدو بعيد المنال لسنوات.

في الوقت نفسه، تتطور توقعات المؤسسات. لم يعد كافياً أن تكون النماذج "ذكية بشكل عام"، بل يجب أن تكون مفيدة بشكل خاص. ويعكس التحول نحو النماذج المُكيَّفة مع المجال، والأنظمة المتصلة بالأدوات، وأطر العمل متعددة الوكلاء، الطلب المتزايد على الأداء الذي يكون عملياً وقابلاً للتدقيق ومتكاملاً مع سير العمل في العالم الحقيقي.

الرواية لا تتطابق مع الواقع

فلماذا يبدو أن الأمور تتباطأ؟ هناك سببان. أولاً، المعايير التي جذبت الانتباه في البداية، وهي تلخيص النصوص، وإنشاء رسائل البريد الإلكتروني، ومهام الدردشة البسيطة، قد وصلت إلى حدها الأقصى الطبيعي. فبمجرد أن يحقق النموذج أداءً ثابتًا بدقة 90% في هذه المهام، تبدو التحسينات ضئيلة. هذا تأثير حد أقصى، وليس مجرد استقرار في الأداء.

تشمل التحسينات الحالية ذاكرة السياق الطويل، وتكامل الأدوات، والاستدلال في وقت الاستدلال، والدقة الخاصة بالمجال. هذه الإمكانيات لا تُنتج عروضًا توضيحية واسعة الانتشار، لكنها تُحسّن بشكلٍ كبير ما يمكن أن تفعله النماذج في سير العمل الحقيقي. في حين أن معايير اللغة التقليدية تستقر عند مستوى معين، تتحسن المعايير التشغيلية المرتبطة بالاستدلال الواقعي واستخدام الأدوات وموثوقية المؤسسة بوتيرة أسرع من أي وقت مضى.. هذه الفجوة تفسر الانفصال: يرى المراقبون العاديون حالة من الركود لأن السطح لم يتغير، لكن الممارسين يرون التحول يحدث تحته مباشرة.

من العروض التوضيحية إلى النشر

لم يعد الذكاء الاصطناعي مقتصراً على العروض التوضيحية المبهرة أو النماذج الأولية المحدودة، بل بات ينتقل إلى الاستخدام الشائع، لا سيما في بيئات المؤسسات حيث تُعدّ الموثوقية والدقة وسرعة إنجاز النتائج أموراً بالغة الأهمية. وقد بدأ بالفعل التحول نحو الأنظمة المنظمة والمخصصة لمهام محددة.

بواسطة 2026، 40% ستتضمن تطبيقات المؤسسات وكلاء الذكاء الاصطناعي المدمجين، وهي قفزة هائلة من 5٪ فقط في عام 2025. تم تصميم هؤلاء الوكلاء ليس فقط للاستجابة للمطالبات، ولكن لتنفيذ المهام، وتنسيق سير العمل، وتقديم نتائج ملموسة في مجالات مثل التمويل والأمن السيبراني وعمليات العملاء.

يعكس هذا التطور تحولاً تقنياً أعمق. إذ يتجاوز مطورو الذكاء الاصطناعي الرائدون، بما في ذلك OpenAI، التوسعَ القائم على القوة الغاشمة، ويتبنون الاستدلالَ الفوري، مما يُمكّن النماذج من التفكير في المشكلات، والتحقق من صحة المخرجات، والتفاعل مع الأدوات الخارجية ديناميكياً. ما كان يُعتبر في السابق مجرد أتمتة محدودة النطاق، أصبح اليوم أكثر قدرةً بكثير: وكلاء يخططون ويتكيفون وينفذون بكفاءة عالية. هذا ليس مجرد ذكاء اصطناعي أكبر حجماً، بل هو ذكاء اصطناعي أكثر ذكاءً، مصمم للعمل الحقيقي.

ويتم قياس هذا العمل الحقيقي، لا مجرد تخيله. تتجاوز المؤسسات مرحلة إثبات المفهوم وتنتقل إلى عمليات نشر جاهزة للإنتاج مع مؤشرات أداء رئيسية واضحة وأهداف تجارية مرتبطة بالنتائج. هذه المرحلة الناضجة لا تركز على الحداثة بقدر ما تركز على الموثوقية.

الخطأ الذي يوشك المدراء التنفيذيون على ارتكابه

إن الخطر الحقيقي الذي يواجه قادة المؤسسات اليوم ليس توقف التقدم في مجال الذكاء الاصطناعي، بل اعتقادهم بتوقفه وتعليق استثماراتهم في اللحظة التي تتسارع فيها القدرات الكامنة.

لا تنتظر المؤسسات الرائدة ظهور تقنية جديدة على غرار GPT، بل تُدمج تقنيات الذكاء الاصطناعي الحالية في سير العمل عالي القيمة والمتعدد الوظائف، مما يُحقق تأثيراً ملموساً على الأعمال. أكثر من ثلثي أفادت العديد من المؤسسات التي تستخدم الذكاء الاصطناعي بتحقيق انخفاضات كبيرة في التكاليف أو نمو في الإيرادات مرتبط بشكل مباشر بتطبيق هذه التقنيات. وكانت المؤسسات الأكثر نجاحًا في تبني الذكاء الاصطناعي هي تلك التي دمجته في وظائف أعمال متعددة وأتمتت سلاسل العمليات بالكامل.

مع ذلك، لا تزال العديد من فرق الإدارة التنفيذية عالقة في استخدام أطر تقييم قديمة. فهي تعتمد على معايير أكاديمية لم تعد تعكس تعقيد مهام المؤسسات الحقيقية. كما أنها تُفرط في التركيز على كفاءة استخدام الرموز، متجاهلةً القيمة التشغيلية للدقة، وإمكانية الاسترداد، والتكامل.

هذا ليس مجرد تأخر تقني، بل هو تأخر استراتيجي. تتسع الفجوة بين الشركات التي أعادت النظر في نهجها تجاه الذكاء الاصطناعي وتلك التي لم تفعل. وقريبًا، لن يُقاس هذا التأخر بعدد النماذج المستخدمة، بل بحصة السوق المكتسبة والوقت اللازم لتحقيق القيمة.

كيفية إعادة التفكير في تقييم الذكاء الاصطناعي

حان الوقت لتحديث لوحة النتائج. تحتاج المؤسسات إلى تتبع إنجاز المهام بالكامل، وتنسيق الأدوات، وسير العمل متعدد الوسائط. يجب تقييم النماذج ليس فقط بناءً على ما إذا كانت "تجيب على سؤال ما"، بل أيضاً على ما إذا كانت تُنجز مهمة متعددة الخطوات، وتتعافى من الفشل، وتُنتج مخرجات تتكامل مع الأنظمة القائمة.

تُعدّ معايير الأداء مثل GPQA وMMMU وSWE-bench بدايةً جيدة. لكنّ معايير الأداء الداخلية المبنية على أساس مجال عمل المؤسسة المحدد وسير العمل الخاص بها، تُعدّ أكثر أهمية.

إن الذكاء الاصطناعي الحديث قادر على تحقيق نتائج عالية القيمة، ولكن فقط إذا قمت باختبار النتائج المهمة.

لن يكون معيار النجاح في الموجة القادمة هو النماذج ذات المعايير الكثيرة، بل الأنظمة التي تعمل بكفاءة عالية ضمن سياق أعمال محدد. ستكون الدقة، وقابلية التدقيق، ودعم سلسلة الأدوات، والقدرة على التعافي من الأخطاء، أهم بكثير من سلاسة الأداء أو أسلوب الكتابة.

لقد انتقلت الحدود

لا يتوقف الذكاء الاصطناعي عن التطور، بل ينتقل إلى الطبقات التي تُنجز فيها الأعمال فعلياً، حيث يتعين على الأنظمة التفكير والتحقق والتفاعل عبر مختلف المجالات. إنه يتجاوز مرحلة الحداثة ويدخل مرحلة البنية التحتية.

الشركات التي تدرك هذا التحول تبني بالفعل ميزة تنافسية. فهي لا تسعى وراء أحدث العروض الترويجية واسعة الانتشار، بل تركز على تحقيق إنتاجية حقيقية، وتحسين سرعة حل المشكلات، وتوسيع نطاق العمليات بدقة وسرعة.

إذا كنت لا تزال تنظر إلى لوحة النتائج القديمة، فأنت تغفل عن النقاط التي تُحرز في مكان آخر. لن يكون القادة القادمون هم من انتظروا الألعاب النارية، بل سيكونون من رأوا ما وراء الضجيج وتصرفوا بناءً على الإشارة الحقيقية.

ستيف ويلسون هو الرئيس التنفيذي للذكاء الاصطناعي في Exabeam، حيث يقود تطوير حلول أمن سيبراني متقدمة قائمة على الذكاء الاصطناعي للشركات العالمية. ويلسون، وهو مسؤول تنفيذي متمرس في مجال التكنولوجيا، أمضى مسيرته المهنية في تصميم منصات سحابية واسعة النطاق وأنظمة آمنة لمؤسسات عالمية من بين أفضل 2000 شركة. يحظى ويلسون باحترام واسع في مجتمعي الذكاء الاصطناعي والأمن لربطه بين الخبرة التقنية العميقة وتطبيقات المؤسسات العملية. ويلسون هو أيضًا مؤلف كتاب دليل المطور لأمن نموذج اللغة الكبير (O'Reilly Media)، دليل عملي لتأمين أنظمة GenAI في مجموعات البرامج الحديثة.