الأمن السيبراني

تعترف OpenAI بأن متصفحات الويب الإصطناعية قد لا تكون أمنية بشكل كامل

mm

نشرت OpenAI منشورًا في مدونة الأمان في 22 ديسمبر يحتوي على اعتراف صارخ: قد لا يتم حل هجمات الحقن الإلزامي ضد متصفحات الويب الإصطناعية “أبدًا بشكل كامل”. يأتي هذا الاعتراف بعد شهرين فقط من إطلاق متصفح ChatGPT Atlas ، الذي يحتوي على متصفح مع قدرات وكيل tự động.

قارنت الشركة بين الحقن الإلزامي والاحتيال والهندسة الاجتماعية على الويب – تهديدات مستمرة التي يديرها المدافعون بدلاً من القضاء عليها.对于 المستخدمين الذين يثقون في وكلاء إصطناعيين للتنقل على الإنترنت من behalfهم، يثير هذا التموضع أسئلة أساسية حول مقدار الاستقلالية المناسبة.

ما كشفت عنه OpenAI

يصف المنشور في مدونة الأمان هيكل الدفاع عن Atlas، بما في ذلك “مهاجم تلقائي” مدعوم بالتعلم التعزيزي الذي يبحث عن نقاط الضعف قبل أن يجد المهاجمون الخبيثونها. وتدعي الشركة أن فريقها الداخلي اكتشف “استراتيجيات هجوم جديدة لم تظهر في حملة اختبارنا البشري أو التقارير الخارجية”.

أظهرت إحدى التجارب كيف يمكن لبريد إلكتروني خبيث أن يخترق وكيل إصطناعي يتحقق من صندوق الوارد للمستخدم. بدلاً من صياغة رد خارج المكتب كما هو موصوف، أرسل الوكيل المتخترق رسالة استقالة. وتقول OpenAI إن تحديث الأمان الأخير يلتقط الآن هذا الهجوم – ولكن المثال يظهر المخاطر عندما يتصرف وكلاء إصطناعيون بشكل مستقل في سياقات حساسة.

يمكن للمهاجم التلقائي “توجيه وكيل إلى تنفيذ سير عمل ضار معقدة وطويلة الأمد تنتشر على عشرات (أو حتى مئات) الخطوات”، وفقًا لما قاله OpenAI. تساعد هذه القدرة OpenAI على العثور على عيوب أسرع من المهاجمين الخارجيين، ولكنها تكشف أيضًا عن كيفية تعقيد وضرر هجمات الحقن الإلزامي.

صورة: OpenAI

المشكلة الأمنية الأساسية

يستغل الحقن الإلزامي حداً أساسيًا للنماذج اللغة الكبيرة: لا يمكنها التمييز بشكل موثوق بين الإرشادات الصحيحة والمحتوى الخبيث المضمن في البيانات التي تمت معالجتها. عندما يقرأ متصفح الويب الإصطناعي صفحة ويب، يمكن لأي نص على تلك الصفحة التأثير على سلوكه.

أثبت باحثو الأمان ذلك مرارًا وتكرارًا. متصفحات الويب الإصطناعية تجمع بين استقلالية معتدلة ووصول عالٍ جدًا – موقف صعب في مجال الأمان.

لا تتطلب الهجمات تقنيات متقدمة. النص الخفي على صفحات الويب أو البريد الإلكتروني أو الإرشادات غير المرئية في المستندات يمكن أن تضلل وكلاء إصطناعيين لتنفيذ أفعال غير مقصودة. وقد أظهر بعض الباحثين أن التحفيزات الخبيثة المخفية في لقطات الشاشة يمكن أن تنفذ عند التقاط وكيل إصطناعي لصورة من شاشة المستخدم.

كيف تستجيب OpenAI

تتضمن دفاعات OpenAI نماذج مدربة بشكل عدوى، وتصنيفات حقن الإلزامي، و “حواجز سرعة” تتطلب تأكيد المستخدم قبل الإجراءات الحساسة. وتوصي الشركة للمستخدمين بتحديد ما يمكن لاتلاس الوصول إليه – تقييد الوصول المتصل، وتطلب التأكيد قبل الدفعات أو الرسائل، وتقديم تعليمات ضيقة بدلاً من المандات الواسعة.

هذا التوصية مُ启رة. تقريبًا، تنصح OpenAI باستخدام منتجها بنفس الشك الذي يُستخدم مع أدوات أخرى.

يقلل تحديث الأمان من هجمات الحقن الناجحة. هذا التحسين مهم، ولكنه يعني أيضًا أن السطح المتاح للهجوم لا يزال قائمًا – والمتسللين سوف يعتادون على أي دفاعات تُ نشرها OpenAI.

الآثار على مستوى الصناعة

OpenAI ليست الوحيدة في مواجهة هذه التحديات. إطار أمان جوجل لميزات الوكيل في كروم يحتوي على طبقات دفاع متعددة، بما في ذلك نموذج إصطناعي منفصل يفحص كل إجراء مقترح. متصفح Comet من Perplexity واجه انتقادات مماثلة من باحثي الأمان في Brave، الذين وجدوا أن التنقل إلى صفحة ويب خبيثة يمكن أن يؤدي إلى إجراءات إصطناعية ضارة.

ما يجب أن يعتبره المستخدمون

التقييم الصادق غير مريح: متصفحات الويب الإصطناعية هي أدوات مفيدة مع قيود أمنية متأصلة لا يمكن إزالتها من خلال الهندسة الأفضل. يواجه المستخدمون تحديًا بين الراحة والمخاطر الذي لا يمكن لأي مورد حله تمامًا.

توصية OpenAI – تقييد الوصول، وتطلب التأكيد، وتجنب المандات الواسعة – تعادل نصيحة لاستخدام نسخ أقل قوة من المنتج. هذا ليس موقفًا سينيكًا؛ إنه اعتراف واقعي بالقيود الحالية. المساعدين الإصطناعيين الذين يمكنهم القيام بأكثر يمكنهم أيضًا أن يُضللوا لتنفيذ المزيد.

التوازي مع أمان الويب التقليدية هو مُ启ر. المستخدمون لا يزالون يقعون فدية للهجمات الاحتيالية عقودًا بعد ظهورها. متصفحات الويب لا تزال تحجب ملايين المواقع الخبيثة يوميًا. التهديد يتكيف أسرع من الدفاعات التي لا يمكن حلها بشكل دائم.

متصفحات الويب الإصطناعية تضيف بعدًا جديدًا إلى هذا الديناميكية المألوفة. عندما يتصفح البشر، يأتي الحكم حول ما يبدو مشبوهًا. وكلاء إصطناعيون يعالجون كل شيء بنفس الثقة، مما يجعلهم أكثر عرضة للتلاعب حتى مع نموهم في القدرة.

الطريق الأمام

تستحق شفافية OpenAI الاعتراف. يمكن للشركة أن تنشر تحديثات أمان بشكل هادئ دون الاعتراف بمواصلة المشكلة الأساسية. بدلاً من ذلك، نشرت تحليلًا مفصلًا للطرق الهجومية والهياكل الدفاعية – معلومات تساعد المستخدمين على اتخاذ قرارات مدروسة وتحسين حماية منافسيهم.

لكن الشفافية لا تحل التوتر الأساسي. كلما أصبحت وكلاء إصطناعيين أكثر قوة، زادت فرصتهم كأهداف. نفس القدرات التي تتيح لاتلاس التعامل مع سير عمل معقدة تُخلق أيضًا فرصًا للهجمات المتقدمة.

لمستخدمي متصفحات الويب الإصطناعية يجب أن يعتبروها أدوات قوية ذات قيود معنوية – وليس مساعدين رقميين مستقلين تمامًا جاهزين لمعالجة المهام الحساسة بدون إشراف. لقد كانت OpenAI غير عادية في إعترافها بهذه الحقيقة. السؤال هو ما إذا كان سيتوافق تسويق الصناعة مع ما يعرفه فرق الأمان بالفعل.

Alex McFarland هو صحفي وكاتب في مجال الذكاء الاصطناعي يستكشف أحدث التطورات في الذكاء الاصطناعي. وقد تعاون مع العديد من الشركات الناشئة في مجال الذكاء الاصطناعي والمنشورات في جميع أنحاء العالم.