Connect with us

Cybersecurity

OpenAI Akui Peramban AI Mungkin Tidak Akan Pernah Sepenuhnya Aman

mm

OpenAI menerbitkan sebuah postingan blog keamanan pada 22 Desember yang berisi pengakuan mencolok: serangan injeksi perintah terhadap peramban AI “mungkin tidak akan pernah sepenuhnya teratasi.” Pengakuan ini muncul hanya dua bulan setelah perusahaan meluncurkan ChatGPT Atlas, perambannya dengan kemampuan agen otonom.

Perusahaan tersebut membandingkan injeksi perintah dengan “penipuan dan rekayasa sosial di web”—ancaman persisten yang dikelola oleh para pembela alih-alih dihilangkan. Bagi pengguna yang mempercayai agen AI untuk menavigasi internet atas nama mereka, kerangka pemikiran ini memunculkan pertanyaan mendasar tentang seberapa besar otonomi yang tepat.

Apa yang Diungkapkan OpenAI

Postingan blog tersebut menggambarkan arsitektur pertahanan OpenAI untuk Atlas, termasuk “penyerang otomatis” bertenaga pembelajaran penguatan yang memburu kerentanan sebelum aktor jahat menemukannya. Perusahaan mengklaim bahwa tim merah internal ini telah menemukan “strategi serangan baru yang tidak muncul dalam kampanye tim merah manusia kami atau laporan eksternal.”

Salah satu demonstrasi menunjukkan bagaimana email berbahaya dapat membajak agen AI yang sedang memeriksa kotak masuk pengguna. Alih-alih menyusun balasan di luar kantor seperti yang diperintahkan, agen yang dikompromikan itu mengirim pesan pengunduran diri. OpenAI mengatakan pembaruan keamanan terbarunya kini menangkap serangan ini—tetapi contoh tersebut menggambarkan taruhannya ketika agen AI bertindak secara otonom dalam konteks yang sensitif.

Penyerang otomatis “dapat mengarahkan agen untuk mengeksekusi alur kerja berbahaya yang canggih dan berjangka panjang yang berlangsung selama puluhan (atau bahkan ratusan) langkah,” tulis OpenAI. Kemampuan ini membantu OpenAI menemukan celah lebih cepat daripada penyerang eksternal, tetapi juga mengungkapkan betapa kompleks dan merusaknya serangan injeksi perintah dapat menjadi.

Gambar: OpenAI

Masalah Keamanan Mendasar

Alex McFarland adalah seorang jurnalis dan penulis AI yang mengeksplorasi perkembangan terbaru dalam kecerdasan buatan. Ia telah berkolaborasi dengan banyak startup dan publikasi AI di seluruh dunia.