قادة الفكر

يعني الأولوية للأمان في الذكاء الاصطناعي

mm

اشترِ دراجة جديدة للطفل ، وستكون الدراجة هي التي تحظى باهتمام الجميع – وليس الخوذة اللامعة التي تأتي معها. ولكن الآباء يقدرون الخوذة.

أخشى أن nhiều منا اليوم يشبه الأطفال عندما يتعلق الأمر بالذكاء الاصطناعي. نحن منهمكون في كيفية جعلها تبدو رائعة وكيف يمكننا أن نذهب معها بسرعة. وليس كثيرًا فيما نقدر على فعله لضمان سلامتنا أثناء استخدامها. هذا يأسف له لأنك لا يمكنك الحصول على فوائد واحدة دون الأخرى.

ببساطة ، تطبيق الذكاء الاصطناعي دون التخطيط بعناية للسلامة أولاً ليس فقط مخاطرة. إنه طريق مباشر إلى الهبوط من المنحدر.

ما يعني الأمان في الذكاء الاصطناعي؟

يتضمن الأمان في الذكاء الاصطناعي مجموعة من الخطوات. ولكن ربما يكون أهم عنصر هو متى نأخذها. لتكون فعالة ، يجب أن يكون الأمان في الذكاء الاصطناعي بتصميم.

يعني ذلك أننا نعتمد على كيفية منع الأذى قبل أن نأخذها للاختبار. نحن نحدد كيف نجعل الذكاء الاصطناعي يعمل وينتج نتائج متوافقة مع قيمنا وتوقعاتنا الاجتماعية أولاً – وليس بعد الحصول على نتائج رهيبة.

التصميم من أجل الأمان في الذكاء الاصطناعي يتضمن أيضًا التفكير في كيفية جعلها قوية ، أو قادرة على أداء يمكن توقعها حتى في الحالات الصعبة. إنه يعني جعل الذكاء الاصطناعي شفافًا ، بحيث تكون القرارات التي يتخذها الذكاء الاصطناعي مفهومة ويمكن فحصها وعدم تحيزها.

ولكنه يتضمن أيضًا النظر إلى العالم الذي سيعمل فيه الذكاء الاصطناعي. ما هي الحماية المؤسسية والقانونية التي نحتاجها ، خاصةً للامتثال للوائح الحكومية المعمول بها؟ ولا أستطيع التأكيد على مكونات الأشخاص: ماذا سيكون تأثير استخدام الذكاء الاصطناعي على الأشخاص الذين يتفاعلون معه؟

الأمان بتصميم يعني دمج أمان الذكاء الاصطناعي في جميع عملياتنا وعملياتنا التشغيلية قبل أن نكتب أول سطر من الشفرة.

المخاطر تفوق المخاوف

ليس الجميع يتفقون. عندما يسمعون “الأولوية للأمان” ، يسمع بعضهم “الخطوة ببطء شديد حتى تُترك في الخلف”. بالطبع ، هذا ليس ما يعنيه الأولوية للأمان. لا يتعين أن يثبط الابتكار أو يبطئ من الوقت الذي يستغرقه إطلاق المنتج. ولا يعني ذلك سلسلة لا نهاية لها من الاختبارات التي لن تتوسع أبدًا. على العكس من ذلك.

يعني ذلك فهم مخاطر عدم تصميم الأمان في الذكاء الاصطناعي. فكر في بعض الأمثلة.

  • مركز ديلويت للخدمات المالية يتوقع أن تكون GenAI مسؤولة عن خسائر احتيال تبلغ 40 مليار دولار في الولايات المتحدة وحدها بحلول عام 2027 ، من 12.3 مليار دولار في عام 2023 ، بمعدل نمو سنوي مركب يبلغ 32٪.
  • قرارات متحيزة. الحالات الوثائقية الرعاية الطبية المتحيزة بسبب الذكاء الاصطناعي الذي تم تدريبه على بيانات متحيزة.
  • قرارات سيئة تلهم المزيد من القرارات السيئة. أسوأ من قرار سيئ مبدئي مدفوع بالذكاء الاصطناعي المعيب ، الدراسات تشير إلى أن تلك القرارات السيئة يمكن أن تصبح جزءًا من كيفية تفكيرنا وصنع القرارات في المستقبل.
  • عواقب حقيقية. الذكاء الاصطناعي الذي يقدم نصائح طبية سيئة كان مسؤولاً عن نتائج قاتلة للمرضى. وقد نتجت عنها مشاكل قانونية بسبب الاستشهاد بهلوسة الذكاء الاصطناعي كمرجع قانوني. وأدت الأخطاء البرمجية الناجمة عن مساعد الذكاء الاصطناعي الذي قدم معلومات خاطئة إلى تلوث منتجات الشركة وسمعتها وأدت إلى انزعاج المستخدمين على نطاق واسع.

وما زال الأمر على وشك أن يصبح أكثر إثارة.

الظهور والاعتماد السريع على الذكاء الاصطناعي العامل ، الذكاء الاصطناعي الذي يمكنه العمل بشكل مستقل لاتخاذ إجراءات بناءً على القرارات التي يتخذها ، سيزيد من أهمية تصميم الأمان في الذكاء الاصطناعي.

يمكن أن يكون وكيل الذكاء الاصطناعي الذي يمكنه العمل نيابة عنك مفيدًا بشكل كبير. بدلاً من إخبارك عن أفضل الرحلات للرحلة ، يمكنه العثور عليها والحجز لها من أجلك. إذا كنت تريد إرجاع منتج ، يمكن لوكيل شركة الذكاء الاصطناعي أن يعالج عملية الإرجاع بالكامل من أجلك.

جيد – طالما أن الوكيل لا يهلوس رحلة أو يسيء التعامل مع معلوماتك المالية. أو يخطئ في سياسة الإرجاع وي拒ض الإرجاع الصحيح.

من السهل رؤية كيف يمكن أن تتدفق مخاطر الأمان الحالية في الذكاء الاصطناعي بسهولة مع مجموعة من وكلاء الذكاء الاصطناعي الذين يأخذون القرارات والعمل ، خاصةً لأنهم لن يعملوا بمفردهم. سيتأتي معظم القيمة الحقيقية من وكلاء الذكاء الاصطناعي من فرق من الوكلاء ، حيث يتعامل كل وكيل مع أجزاء من المهام ويعمل معًا – الوكيل مع الوكيل – لإنجاز العمل.

كيف يمكننا تبني أمان الذكاء الاصطناعي بتصميم دون إعاقة الابتكار وقتل قيمته؟

الأمان بتصميم في العمل

فحوصات الأمان العرضية ليست هي الإجابة. ولكن دمج ممارسات الأمان في كل مرحلة من مراحل تنفيذ الذكاء الاصطناعي هو.

ابحث عن البيانات. تأكد من أن البيانات تم تحديدها وتم إضافتها عند الحاجة ، وخالية من التحيز ، وذات جودة عالية. هذا صحيح بشكل خاص للبيانات المستخدمة في التدريب.

اقترن نموذجك بتعليقات الإنسان ، حيث أن الحكم البشري ضروري لتشكيل سلوك النموذج. تقنيات التعلم التعزيزي مع تعليقات الإنسان (RLHF) وغيرها من التقنيات المماثلة تسمح للمعلمين بتقييم وتوجيه الاستجابات ، مما يساعد النماذج على توليد مخرجات آمنة ومتوافقة مع القيم البشرية.

ثم ، قبل إصدار النموذج ، اجعله يخضع لاختبار الضغط. يمكن لفريق红 الذي يحاول إثارة سلوك غير آمن باستخدام محفزات معادية وحدود الحالات ومحاولات الاختراق أن يكشف عن نقاط الضعف. إصلاحها قبل أن تصل إلى الجمهور يحافظ على الأمان قبل حدوث مشكلة.

بينما يضمن هذا الاختبار أن نماذج الذكاء الاصطناعي قوية ، استمر في مراقبتها بعين على التهديدات الناشئة والتعديلات التي قد تكون ضرورية للنماذج.

على نحو مماثل ، راقب بانتظام مصادر المحتوى والتفاعلات الرقمية للاشتباه في الاحتيال. وحاسم ، استخدم نهجًا هجينًا من الذكاء الاصطناعي والإنسان ، حيث يتعامل الذكاء الاصطناعي مع حجم كبير من البيانات المراد مراقبتها ، ويتم التعامل مع المراجعة من قبل بشر مهرة من أجل تنفيذ وضمان الدقة.

تطبيق وكلاء الذكاء الاصطناعي يتطلب مزيدًا من العناية. متطلب أساسي: تدريب الوكيل على معرفة حدوده. عندما يواجه عدم اليقين أو المأزق الأخلاقي أو الحالات الجديدة أو القرارات الخطيرة بشكل خاص ، تأكد من أنه يعرف كيف يطلب المساعدة.

كما صمم التأثير في وكلائك. هذا مهم بشكل خاص حتى تتم تفاعلاته مع مستخدمين موثوق بهم ، لتجنب تأثير الممثلين الاحتياليين على أفعال الوكيل.

إذا بدا أنهم يعملون بشكل فعال ، فقد يكون من الم诱ي إطلاقهم والسماح لهم بفعلهم. لكن خبرتنا تقول إننا يجب أن نستمر في مراقبتهم والمهام التي يقومون بها للبحث عن الأخطاء أو السلوك غير المتوقع. استخدم الفحوصات الآلية ومراجعة الإنسان.

في الواقع ، عنصر أساسي من أمان الذكاء الاصطناعي هو المشاركة البشرية المنتظمة. يجب أن يتم إشراك البشر عمدًا حيث يتضمن الحكم النقدي أو التعاطف أو الدقة والغموض في القرار أو الإجراء.

مرة أخرى ، لتوضيح ، هذه هي جميع الممارسات التي تبنيها في تنفيذ الذكاء الاصطناعي مسبقًا ، بتصميم. إنها ليست نتيجة شيء ي发生 خطأ ثم نهدر في كيفية تقليل الضرر.

هل يعمل؟

لقد طبقنا فلسفة الأولوية للأمان في الذكاء الاصطناعي وإطار “بتصميم” مع عملائنا على مدار ظهور GenAI والآن على المسار السريع لوكلاء الذكاء الاصطناعي. ونحن نجد أن ، على عكس المخاوف بشأن إبطاء الأمور ، إنه يساعد في facto تسريعها.

يمكن لوكلاء الذكاء الاصطناعي أن يخفضوا تكلفة الدعم الفني بنسبة 25-50٪ ، على سبيل المثال ، بينما يزيدون من رضا العملاء. ولكن هذا يعتمد على الثقة.

يجب على البشر الذين يستخدمون الذكاء الاصطناعي أن يثقوا به ، ويمكن للعملاء الذين يتفاعلون مع وكلاء بشريين مدعومين بالذكاء الاصطناعي أو مع وكلاء حقيقيين للذكاء الاصطناعي أن يختبروا تفاعلًا واحدًا فقط يمكن أن يؤدي إلى تدمير الثقة في العلامة التجارية.

لا نثق في ما ليس آمنًا. لذلك ، عندما نبني الأمان في كل طبقة من طبقات الذكاء الاصطناعي الذي سنطرحه قريبًا ، يمكننا القيام بذلك بثقة. وعندما نكون على استعداد لتوسيع نطاقه ، يمكننا القيام بذلك بسرعة – بثقة.

بينما قد يبدو تطبيق الأولوية للأمان في الذكاء الاصطناعي معقدًا ، أنت لست وحدك. هناك العديد من الخبراء الذين يمكنهم المساعدة والشركاء الذين يمكنهم مشاركة ما تعلموه وما يتعلمونه بحيث يمكنك الاستفادة من قيمة الذكاء الاصطناعي بأمان دون إبطاءك.

لقد كان رحلة مثيرة لذكاء حتى الآن ، وأنا أجد أنه مع تسارع الرحلة ، أجد أنه ممتع. لكني أيضًا سعيد لأنني أرتدي خوذتي.

جو أندرسون هو المدير التنفيذي للاستشارات والتحول الرقمي في TaskUs، حيث يقود استراتيجية التسويق والابتكار. يركز على تقاطع الذكاء الاصطناعي وتجربة العملاء والعمليات الرقمية، ويترأس ممارسة الاستشارات الجديدة في TaskUs.