Connect with us

إطلاق Simbian لمعيار الدفاع السيبراني، وكشف عن فجوة كبيرة في قدرات الأمان الذكية

الأمن السيبراني

إطلاق Simbian لمعيار الدفاع السيبراني، وكشف عن فجوة كبيرة في قدرات الأمان الذكية

mm

أصدرت Simbian معيارًا جديدًا ي挑ّى أحد أكثر المفاهيم شيوعًا في الذكاء الاصطناعي: أن النماذج القادرة على العثور على الثغرات يمكنها أيضًا الدفاع عنها.

المعيار الجديد الذي أطلقته الشركة، معيار الدفاع السيبراني، والذي طوّره مختبر أبحاث Simbian، يقيم أداء النماذج اللغوية الكبيرة الرائدة (LLM) في سيناريوهات الدفاع السيبراني في العالم الحقيقي. والنتائج واضحة. في حين أن الأنظمة الذكية الحديثة تكون أكثر فعالية في اكتشاف نقاط الضعف واستغلالها، إلا أنها تواجه صعوبات كبيرة عند تكليفها بالتعرف على الهجمات النشطة ووقفها.

نماذج الجبهة تفشل في تحقيق الحد الأدنى للدفاع

اختبر المعيار نماذج رائدة بما في ذلك Claude Opus 4.6 وGPT-5 وGemini 3.1 Pro وغيرها في بيئات الشركات المحاكاة.

لم تحقق أي من النماذج درجة مرور.

اكتشف Claude Opus 4.6، وهو الأقوى في الاختبار، جزءًا فقط من أدلة الهجوم عبر إستراتيجيات MITRE ATT&CK، في حين فشلت العديد من النماذج في تحديد فئات كاملة من الأنشطة الخبيثة. وتوافق البحث الأكاديمي المستقل مع هذه النتائج، مما يدل على أن حتى أفضل النماذج ت투ّق مع صيد التهديدات المفتوحة، وتكتشف فقط جزءًا صغيرًا من الأحداث الخبيثة في السيناريوهات الواقعية.

تسلط هذه الفجوة الضوء على حدودة حرجة. الأنظمة الذكية الحديثة قد تتفوق في الإجابة على الأسئلة الموضوعة أو حل المشكلات المحصورة، ولكنها تتعثر عندما تتطلب منها التحقيق في سلاسل الهجمات المعقدة المتطورة بدون إرشاد.

التوجه نحو التقييم القائم على الوكيل الحقيقي

ما يميز هذا المعيار هو تصميمه.

على عكس الاختبارات السابقة لأمن السيبرانية التي تعتمد على أسئلة متعددة الخيارات أو مجموعات بيانات ثابتة، يستخدم подход Simbian بيانات التелеметري الحقيقية ويوضع النماذج في حلقة تحقيق وكيلية. بدلاً من أن يُخبر النموذج بما يبحث عنه، يجب على الذكاء الاصطناعي استكشاف السجلات وتكوين فرضيات وتحديد التهديدات بشكل مستقل.

هذا يُقلّد كيفية عمل المحللين الأمنيين البشر في مراكز العمليات الأمنية الحقيقية.

يضم المعيار عشرات تقنيات الهجوم عبر مراحل متعددة، مما يضطر النماذج إلى ربط الإشارات عبر الوقت والأنظمة. من خلال تغيير السياق وفرض تسجيل حتمي، يقلل أيضًا من خطر أن يتذكر النماذج فقط الأنماط.

التسارع في الفجوة بين الهجوم والدفاع الذكي

تؤكد النتائج اتجاهًا أوسع نطاق ي出现 عبر الصناعة.

الذكاء الاصطناعي يتحسن بسرعة في المهام الهجومية السيبرانية. دراسات حديثة تُظهر أن نماذج الجبهة يمكنها بالفعل تنفيذ هجمات متعددة الخطوات في بيئات محاكاة وتنفذها بشكل متزايد مع أدوات طفيفة. وفي الوقت نفسه، تتخلف القدرات الدفاعية.

لماذا يفشل الذكاء الاصطناعي “الجاهز للاستخدام”?

استنتجت Simbian أن الذكاء الاصطناعي لا يستطيع الدفاع عن الأنظمة، ولكن لا يستطيع فعل ذلك بمفرده.

يقترح المعيار أن النماذج اللغوية الكبيرة (LLM) تتطلب ما وصفه الشركة بـ “حزام متقدم” – مزيجًا من الذكاء الخارجي وعمليات العمل الموضوعة وتكامل النظام – للعمل بشكل فعال في بيئات الأمان.

فئة جديدة من المعايير لآمان الذكاء الاصطناعي

يُشكل إصدار معيار الدفاع السيبراني خطوة مهمة في كيفية تقييم أنظمة الذكاء الاصطناعي للنشر في العالم الحقيقي.

من خلال التركيز على صيد التهديدات القائمة على الأدلة بدلاً من الإجابة على الأسئلة، يُعاد صياغة المشكلة من الذكاء إلى التنفيذ. كما يُ導خِل التكلفة كعامل قابل للقياس، مما يبرز التبادل بين الأداء والكفاءة عبر النماذج.

كما تتواصل تطورات الذكاء الاصطناعي في أمن السيبرانية، قد تصبح معايير مثل هذه أدوات أساسية لفهم ليس فقط ما يمكن للنماذج القيام به، ولكن أين تفشل – ولماذا.

أنطوان هو قائد رؤى ومؤسس شريك في Unite.AI، مدفوعًا بشغف لا يتزعزع لتشكيل وتعزيز مستقبل الذكاء الاصطناعي والروبوتات. رجل أعمال متسلسل، يعتقد أن الذكاء الاصطناعي سيكون مدمرًا للمجتمع مثل الكهرباء، وغالبًا ما يُقبض عليه وهو يثرثر عن إمكانات التكنولوجيات المدمرة و AGI.

كما أنه مستقبلي، فهو مخصص لاستكشاف كيف سيشكل هذه الابتكارات العالم. بالإضافة إلى ذلك، فهو مؤسس Securities.io، وهي منصة تركز على الاستثمار في التكنولوجيات المتقدمة التي تعيد تعريف المستقبل وتهيئ القطاعات بأكملها.