Pemimpin pemikiran

Mempertimbangkan Kembali Rel Pengaman untuk Aplikasi AI

Published November 17, 2025

Updated April 25, 2026

Girish Chandrasekar, Head of Product, Straiker

Ketika aplikasi AI melangkah melampaui chatbot sederhana ke sistem agenik yang mampu bertindak atas nama pengguna, risiko tumbuh secara eksponensial. Aplikasi agenik dapat mengambil tindakan melalui alat, dan ini membuka vektor ancaman baru bagi penyerang yang dapat memanipulasi alat tersebut untuk mengubah keadaan aplikasi dan data pengguna.

Model keamanan dan rel pengaman tradisional dirancang untuk ancaman yang sempit dan terdefinisi dengan baik, tetapi mereka mengalami kesulitan untuk berkembang melawan keragaman dan kreativitas teknik serangan modern. Kenyataan baru ini memerlukan pergeseran paradigma: menerapkan AI untuk membela AI, memungkinkan pengaman yang adaptif dan dapat diskalakan yang sesuai dengan kecerdasan dan ketidakpastian lawan hari ini.

Mengerti Risiko yang Diperluas

AI menyebar ke setiap lapisan perangkat lunak – dari CRMs ke kalender, email, alur kerja, peramban, dan lain-lain – menyematkan kecerdasan di mana-mana. Apa yang dimulai sebagai asisten percakapan sekarang menjadi agen otonom yang mampu mengambil tindakan independen.

Sebagai contoh, “agen” yang muncul dari OpenAI dapat menjelajahi internet atau menjalankan tugas online. Kemampuan ini membuka produktivitas yang luar biasa tetapi juga memaparkan permukaan serangan yang luas dan belum dipetakan. Risiko tersebut meluas melampaui kebocoran data untuk mencakup manipulasi perilaku, penghindaran model, dan serangan injeksi prompt – ancaman yang berkembang dinamis dan menargetkan logika model daripada infrastruktur.

Bagi perusahaan, pergeseran ini berarti keamanan harus berkembang secepat AI itu sendiri. Tantangan bagi pemimpin teknologi dan keamanan adalah bagaimana melindungi inovasi tanpa memperlambatnya, ketegangan yang telah lama ada antara tim keamanan dan pengembangan AI.

Di Mana Rel Pengaman Tradisional Gagal

Sebagian besar alat keamanan AI saat ini masih bergantung pada model pembelajaran mesin statis yang terlatih sempit dirancang untuk mengenali jenis serangan tertentu. Setiap metode penghindaran atau injeksi prompt baru sering memerlukan pelatihan ulang atau penyebaran model khusus. Pendekatan reaktif ini menganggap bahwa aktor jahat akan berperilaku secara dapat diprediksi. Namun, kenyataannya adalah penyerang sekarang menggunakan AI mereka sendiri untuk menghasilkan ancaman adaptif, kreatif, dan bergerak cepat yang pertahanan tradisional tidak dapat antisipasi.

Bahkan rel pengaman yang dianggap sebagai yang terdepan cenderung terbatas dalam cakupan dan kemampuan, efektif hanya dalam skenario untuk yang mereka dilatih. Paradigma lama memerlukan pelatihan model terpisah untuk setiap teknik eksploitasi baru, yang merupakan pendekatan yang rapuh dan tidak berkelanjutan karena jumlah teknik eksploitasi potensial meningkat ke ratusan.

Menambahkan ini, kesenjangan budaya bertahan antara tim keamanan dan AI. Pengembang AI sering melihat keamanan sebagai penghalang – sesuatu yang memperlambat kecepatan mereka – sementara tim keamanan menanggung tanggung jawab jika sesuatu gagal. Kekurangan kolaborasi ini telah meninggalkan banyak organisasi rentan oleh desain. Apa yang diperlukan adalah pertahanan yang terintegrasi secara menyeluruh ke dalam siklus hidup AI, menyediakan pengawasan tanpa gesekan.

Membalik Skrip: Menggunakan AI untuk Membela AI

Untuk memenuhi tantangan ini, paradigma keamanan baru muncul: AI yang menyerang AI jahat dan membela AI Anda. Daripada bergantung pada aturan statis atau tanda tangan buatan tangan, pendekatan ini memanfaatkan kekuatan generatif dan analitis dari model bahasa besar (LLM) untuk menguji dan melindungi sistem AI.

Pengujian merah tim AI: LLM dapat mensimulasikan berbagai perilaku musuh, termasuk penghindaran model, injeksi prompt, dan penyalahgunaan agen. Dengan melepaskan model “tidak sejalan” atau “rogue” untuk menguji aplikasi secara kreatif, organisasi memperoleh pemahaman yang lebih kaya dan realistis tentang kerentanan sebelum penyerang mengeksploitasi mereka.
Pertahanan adaptif terus-menerus: Sistem AI yang sama dapat dilatih untuk belajar dari setiap serangan dan secara otomatis memperkuat pertahanan. Daripada mengelola ratusan model dengan cakupan sempit, organisasi dapat mengirimkan lapisan pertahanan tunggal yang dapat diskalakan yang mampu mengenali dan beradaptasi dengan ancaman beragam sambil mempertahankan latensi dan kinerja yang konsisten.

Ini menandai pergeseran mendasar dari pengujian manual, titik-dalam-waktu ke rel pengaman yang hidup yang berkembang bersama dengan sistem yang mereka lindungi.

Membangun Ekosistem yang Dapat Membela Diri

AI membela AI tidak hanya meningkatkan deteksi; itu mengubah seluruh postur pertahanan. Ketika terintegrasi dengan baik, sistem ini dapat:

Menggunakan perlindungan dengan mudah dengan menggeneralisasi melintasi beberapa jenis serangan.
Terus-menerus memperbaiki ketika mereka menemui ancaman baru dalam produksi.
Menghubungkan kesenjangan antara tim AI dan keamanan, memungkinkan pengawasan yang tidak menghambat inovasi.
Menyediakan visibilitas ke permukaan risiko kompleks yang diperkenalkan oleh perilaku agenik, di mana sistem AI bertindak otonom dalam lingkungan digital.

Tujuannya adalah membangun sistem keamanan yang berpikir seperti penyerang, mengantisipasi gerakan mereka dan berkembang secepat mereka.

Panggilan untuk Minda Adaptif

Industri berada pada titik balik. Setelah hiruk-pikuk awal tahun 2023–2024, banyak inisiatif AI perusahaan macet karena mereka menghadapi hambatan produksi. Itu tidak karena kurangnya potensi, tetapi karena infrastruktur dan paradigma keamanan tidak bisa mengikuti. Ketika AI sekarang terintegrasi ke dalam alur kerja kritis, konsekuensi dari desain yang tidak aman hanya akan membesar.

Organisasi harus mengadopsi mindset keamanan adaptif, di mana sistem AI terus-menerus memantau, menguji, dan memperkuat sistem AI lainnya. Ini berarti menyematkan rel pengaman cerdas dari awal daripada menambahkannya kemudian. Ini tidak masuk akal untuk berpikir tentang perangkat lunak yang tidak didasarkan pada AI dan berbahaya untuk berpikir tentang AI yang tidak aman secara inheren.

Rel Pengaman AI Hidup

AI adalah fondasi baru perangkat lunak, dan seperti fondasi lainnya, kekuatannya bergantung pada seberapa baik ia dapat menahan stres. Pertahanan statis tidak bisa memenuhi momen. Era keamanan berikutnya akan dimiliki oleh sistem self-learning (AI yang membela AI) yang sesuai dengan kecepatan, kreativitas, dan skala ancaman yang dihadapinya. Hanya dengan mengajarkan AI untuk melindungi dirinya sendiri kita dapat mengamankan masa depan yang sedang dibangunnya.

Related Topics:Ai applications cybersecurity Guardrails Straiker

Girish Chandrasekar, Head of Product, Straiker

Girish Chandrasekar adalah Kepala Produk di Straiker, membantu mengambil perusahaan dari nol ke satu. Sebelumnya, ia bergabung dengan tim produk di Robust Intelligence (acq. Cisco), dan sebelum itu, ia bekerja dalam peran teknis pada tim Machine Learning di Postmates dan JPMorgan Asset Management.