الأمن السيبراني
إطلاق سيمبيان لمعيار الدفاع السيبراني، وكشف الفجوة الكبيرة في قدرات الأمن الإصطناعي

أصدرت سيمبيان معيارًا جديدًا ي挑ّف أحد أكثر المفاهيم شيوعًا في الذكاء الاصطناعي: أن النماذج القادرة على العثور على الثغرات يمكنها أيضًا الدفاع عنها.
تم تطوير معيار الدفاع السيبراني الجديد من قبل مختبر أبحاث سيمبيان، ويتناول مدى أداء نماذج اللغة الكبيرة الرائدة (LLM) في سيناريوهات الدفاع السيبراني في العالم الحقيقي. والنتائج واضحة. في حين أن الأنظمة الإصطناعية الحديثة أكثر فعالية في اكتشاف نقاط الضعف واستغلالها، فإنها تعاني بشكل كبير عند تكليفها بالتعرف على الهجمات النشطة ووقفها.
نماذج الحدود لا ت满ي الحد الأدنى للدفاع
تم اختبار النماذج الرائدة، بما في ذلك كلود أوبوس 4.6 وجي بي تي-5 وجيميني 3.1 برو، وغيرها في بيئات الشركات المحاكاة.
لم تصل أي من النماذج إلى درجة مرضية.
كلود أوبوس 4.6، وهو الأقوى في الاختبار، اكتشف فقط جزءًا من أدلة الهجوم عبر إستراتيجيات ميتري أتاك، في حين فشلت العديد من النماذج في تحديد فئات كاملة من الأنشطة الخبيثة. وتوافق البحث الأكاديمي المستقل مع هذه النتائج، مما يدل على أن حتى أفضل النماذج تعاني من صيد التهديدات المفتوحة، واكتشاف جزء صغير فقط من الأحداث الخبيثة في السيناريوهات الواقعية.
تسلط هذه الفجوة الضوء على حد محدودية حرجة. قد تتفوق أنظمة الذكاء الاصطناعي اليوم في الإجابة على الأسئلة الموضوعة أو حل المشكلات المحصورة، لكنها تعثُر عند الحاجة إلى التحقيق في سلاسل الهجمات المعقدة المتطورة دون توجيه.
التوجه نحو التقييم القائم على الوكيل الواقعي
ما يميز هذا المعيار هو تصميمه.
على عكس الاختبارات السابقة لأمن السيبرانية التي تعتمد على الأسئلة متعددة الخيارات أو مجموعات البيانات الثابتة، يستخدم نهج سيمبيان بيانات التелеметري الحقيقية ويوضع النماذج في حلقة تحقيق وكيلية. بدلاً من أن يُقال لهم ما يجب البحث عنه، يجب على الذكاء الاصطناعي استكشاف السجلات وتكوين فرضيات وتحديد التهديدات بشكل مستقل.
هذا يُقلّد كيفية عمل المحللين الأمنيين البشريين في مراكز العمليات الأمنية الحقيقية.
يضم المعيار عشرات تقنيات الهجوم عبر مراحل متعددة، مما يضطر النماذج إلى ربط الإشارات عبر الوقت والنظم. كما يقلل من خطر أن تتذكر النماذج فقط الأنماط من خلال تطبيق السياق القسري وتقييمه بشكل محدد.
هذا التوجّه نحو الواقعية مهم. في تطوير الذكاء الاصطناعي، فإن إنشاء معيار يعكس تعقيد العالم الحقيقي بشكل دقيق هو往往 الخطوة الأولى نحو حل المشكلة نفسها.
التفاوت المتزايد بين الذكاء الاصطناعي الهجومي والدفاعي
تؤكد النتائج على اتجاه أوسع نطاق ي出现 في جميع أنحاء الصناعة.
يتحسن الذكاء الاصطناعي بسرعة في المهام الهجومية السيبرانية. تظهر الدراسات الحديثة أن نماذج الحدود يمكنها بالفعل تنفيذ هجمات متعددة الخطوات في البيئات المحاكاة، وتنفذها بشكل متزايد مع أدوات بسيطة. وفي الوقت نفسه، تتخلف القدرات الدفاعية.
ينشئ هذا التباين عدم تناسق متزايد. يمكن للمهاجمين الاستفادة من التأتمت وزيادة الحجم، بينما لا يزال المدافعون يعتمدون بشكل كبير على الخبرة البشرية والأدوات المتناثرة. حتى عندما يكتشف الذكاء الاصطناعي ثغرة، قد يفسر خطورةها بشكل خاطئ أو يفشل في التصرف بشكل مناسب، مما يبرز الفجوة بين الكشف والفهم.
لماذا يفشل الذكاء الاصطناعي “جاهز للاستخدام”?
استنتجت سيمبيان أن الذكاء الاصطناعي لا يمكنه الدفاع عن الأنظمة بمفرده.
يقترح المعيار أن نماذج اللغة الكبيرة (LLM) تتطلب ما وصفه الشركة بـ “حزام متقدم” – مزيجًا من الذكاء الخارجي والعمليات الموضوعة والتكامل على مستوى النظام – للعمل بشكل فعال في بيئات الأمن.
هذا يتوافق مع البحث الأوسع الذي يظهر أن إضافة أدوات وذاكرة وسياق تحسن بشكل كبير أداء الذكاء الاصطناعي في مهام الأمن السيبراني.
في بيئات الإنتاج، ادعت سيمبيان أنها حققت دقة كشف أعلى بشكل كبير من خلال الجمع بين النماذج مع هذه الطبقات الإضافية. والاستنتاج واضح: القدرة على النموذج الخام ليست سوى جزء من اللغز.
فئة جديدة من المعايير لأمن الذكاء الاصطناعي
يُشكل إصدار معيار الدفاع السيبراني خطوة مهمة في كيفية تقييم أنظمة الذكاء الاصطناعي للنشر في العالم الحقيقي.
من خلال التركيز على صيد التهديدات القائمة على الأدلة بدلاً من الإجابة على الأسئلة، يعيد صياغة المشكلة من الذكاء إلى التنفيذ. كما يقدم التكلفة كعامل قابل للقياس، مما يبرز التبادل بين الأداء والكفاءة عبر النماذج.
مع استمرار الذكاء الاصطناعي في إعادة تشكيل أمن السيبرانية، قد تصبح معايير مثل هذه أدوات أساسية لفهم ليس فقط ما يمكن أن تفعله النماذج، ولكن أيضًا أين تفشل – والسبب.
للحظة، النتيجة واضحة. على الرغم من التقدم السريع في الذكاء الاصطناعي، يبقى الدفاع السيبراني التام غير متاح. ومن المرجح أن تعتمد المرحلة القادمة من الابتكار على تصميم أنظمة تجمع بين الذكاء الاصطناعي والذكاء الموضوع والسياق والرقابة البشرية.












