Connect with us

Pemimpin pemikiran

Krisis Memori AI: Kami Sedang Membangun Abad Kegelapan Digital

mm

Jutaan agen AI memasuki sistem produksi. Hampir tidak ada yang dapat berbagi pengalaman operasional. Ini adalah mengapa pilihan arsitektur itu penting—dan apa yang berubah jika kita melakukannya dengan benar.

Pada pukul 2:06 PM, seorang pelanggan melakukan pemesanan online untuk sebuah laptop.

Agen checkout mengquery basis data operasionalnya: riwayat pembelian yang bersih, jumlah dalam kisaran normal, alamat pengiriman yang pernah digunakan sebelumnya, perangkat dan lokasi konsisten dengan pemesanan sukses sebelumnya. Semuanya terlihat normal. Agen tersebut menyetujui pemesanan.

Pada saat yang sama, agen perilaku memproses data clickstream di data lakehouse perusahaan. Dari sesi tersebut, agen tersebut menghasilkan pola: pengguna tiba langsung di URL checkout yang dalam dengan tidak ada perilaku browsing atau perbandingan. Sinyal ini lemah secara mandiri, tetapi merupakan pendahulu yang dikenal dalam skenario pengambilalihan akun ketika digabungkan dengan pemesanan lain yang normal.

Agen perilaku merekam interpretasi ini sebagai pengetahuan yang diperoleh untuk analisis dan pelatihan model selanjutnya.

Agen checkout tidak pernah melihatnya. Bukan karena sinyal tersebut tidak dihitung, dan bukan karena diabaikan—tetapi karena pengetahuan itu hidup di dalam sistem yang agen checkout tidak konsultasikan selama otorisasi.

Setiap agen berperilaku dengan benar berdasarkan apa yang dapat dilihat. Setiap agen menulis ke sistem yang dimilikinya. Tetapi wawasan yang diperoleh oleh satu agen tidak terlihat oleh agen lain pada saat pengambilan keputusan.

Laptop tersebut dikirim.

Tiga puluh enam jam kemudian, biaya tersebut dibantah. Investigasi mengkonfirmasi bahwa akun tersebut telah dikompromikan sebelumnya pada hari yang sama. Penyerang tersebut menjaga transaksi dalam batas normal, mengandalkan fakta bahwa peringatan awal hanya ada sebagai pengetahuan perilaku yang terjebak di luar konteks pengambilan keputusan agen checkout.

Kegagalan tersebut bukan karena data yang hilang, pemrosesan yang lambat, atau model yang buruk. Ini adalah silo agen: pengetahuan yang terbentuk, tetapi tidak dibagikan.

Dan ini mengungkapkan masalah yang hampir tidak ada yang membicarakannya. Kami telah membangun arsitektur di mana agen AI yang membuat keputusan tidak dapat mengakses apa yang telah ditemukan oleh agen AI lain.

Masalah yang Diselesaikan oleh Mesin Cetak

Sebelum mesin cetak, pengetahuan itu rapuh. Ketika seorang sarjana meninggal, banyak dari apa yang telah dipelajari meninggal bersamanya. Seorang matematikawan di London mungkin menghabiskan dekade untuk menemukan prinsip-prinsip yang seorang matematikawan di Paris akan temukan secara independen lima puluh tahun kemudian. Kemajuan itu nyata, tetapi lokal, lambat, dan direset berulang kali.

Mesin cetak tidak membuat individu lebih pintar. Ini memperluas memori. Pengetahuan berhenti terikat pada satu pikiran dan mulai bertahan melampaui kehidupan penciptanya. Wawasan dapat dibagikan, dikunjungi kembali, dan dibangun di atasnya melintasi generasi. Itulah yang memungkinkan kemajuan untuk berkompound.

Kami berisiko mengulangi kesalahan sebelum mesin cetak dengan AI.

Sebagian besar organisasi sekarang mengirimkan agen AI ke sistem produksi, dengan banyak lagi bereksperimen secara aktif di bidang seperti dukungan pelanggan, pengembangan perangkat lunak, penelitian, dan deteksi penipuan. Agen-agen ini biasanya diterapkan sebagai layanan independen yang sejalan dengan arsitektur microservice modern, masing-masing dengan data dan batas operasionalnya sendiri. Bahkan di dalam organisasi yang sama, agen-agen tersebut menghasilkan wawasan dari pengalaman produksi mereka sendiri tetapi jarang membagikan pengetahuan yang dihasilkan dengan agen lain yang membuat keputusan terkait.

Akibatnya, wawasan operasional tetap terfragmentasi. Keputusan lokal mungkin diperbaiki, tetapi pengalaman tidak terakumulasi di seluruh sistem. Setiap kemajuan yang tetap terjebak di dalam satu agen adalah kemajuan yang tidak dapat berkompound.

Kali ini, faktor pembatas bukanlah kecerdasan atau kecepatan. Ini adalah memori. Tanpa cara bagi sistem AI untuk memperluas dan membagikan apa yang ditemukannya, kemajuan lebih sering direset daripada dibangun.

Apa yang Terlihat seperti Memori Bersama

Jendela konteks yang lebih besar dapat memperkaya alasan individu, tetapi tidak menciptakan pengalaman yang berkelanjutan dan bersama di antara agen.

Memori bersama mengubah hasil bukan dengan memperbaiki model, tetapi dengan mengubah apa yang dapat dilihat agen pada saat pengambilan keputusan.

Dalam sistem yang terisolasi, setiap agen berperilaku dengan benar dalam batasannya sendiri. Agen checkout mengevaluasi risiko transaksi. Agen perilaku menganalisis pola clickstream. Setiap agen menulis kesimpulan ke sistem yang dimilikinya, dan kesimpulan tersebut tetap tidak terlihat oleh agen lain yang beroperasi secara paralel. Keputusan secara lokal benar, tetapi secara global tidak lengkap.

Dengan lapisan memori bersama, batasan itu menghilang.

Ketika agen perilaku memproses sesi, agen tersebut menghasilkan sinyal yang lemah tetapi bermakna: pola navigasi yang terkait dengan upaya pengambilalihan akun awal. Sebagai gantinya menyimpan wawasan tersebut hanya untuk analisis offline, agen tersebut menulis sinyal ke memori bersama, terkait dengan sesi aktif.

Beberapa saat kemudian, ketika agen checkout mengevaluasi pembelian, agen tersebut mengquery memori yang sama. Transaksi masih terlihat normal. Tetapi sekarang agen tersebut melihat konteks tambahan: peringatan perilaku yang tidak akan ada jika tidak ada memori bersama. Tidak ada sinyal yang menentukan secara mandiri. Bersama-sama, mereka melewati ambang batas untuk verifikasi lebih lanjut.

Tidak ada yang berubah tentang agen-agen tersebut. Tidak ada model yang diperbarui. Tidak ada pengontrol pusat yang mengintervensi. Perbedaan adalah visibilitas: wawasan yang dibentuk oleh satu agen menjadi tersedia untuk agen lain pada saat yang masih penting.

Sangat penting, wawasan tersebut bertahan. Ketika hasilnya kemudian diketahui—penipuan atau sah—asosiasi antara sinyal dan hasilnya direkam. Dengan waktu, sistem mengakumulasi catatan empiris tentang indikator lemah mana yang cenderung penting, dan dalam kondisi apa. Keputusan di masa depan diberitahu oleh pengalaman yang melampaui interaksi atau agen tunggal.

Memori bersama bukanlah gudang data dan bukan basis data operasional. Ini adalah substrat berlatensi rendah untuk konteks yang diperoleh: sinyal, interpretasi, dan asosiasi yang bertahan melampaui interaksi yang menghasilkannya dan tetap dapat diquery oleh agen lain yang membuat keputusan terkait.

Inilah cara pengalaman berkompound—bukan di dalam model tunggal, tetapi di seluruh sistem.

Tradeoff Arsitektur di Balik Silo Agen

Silo agen bukanlah kesalahan implementasi. Ini adalah hasil prediktif dari arsitektur perusahaan yang dirancang untuk konsumen yang berbeda.

Selama beberapa dekade, sistem produksi telah memisahkan beban kerja berdasarkan fungsi. Sistem operasional dioptimalkan untuk transaksi yang konsisten dan berlatensi rendah, sedangkan sistem analitis dioptimalkan untuk agregasi skala besar dan penemuan pola sejarah (OLTP vs. OLAP). Pemisahan ini mencerminkan bagaimana wawasan dikonsumsi: hasil analitis diproduksi untuk manusia, bukan mesin, dan diharapkan tiba secara asinkron dan di luar jalur kritis pengambilan keputusan.

Agen-agen AI mewarisi pemisahan arsitektur ini, tetapi tidak sesuai dengan kebutuhan.

Konsekuensinya bukan hanya penundaan wawasan, tetapi juga titik buta struktural. Wawasan yang dihasilkan dalam sistem analitis, oleh desain, ditemukan setelah keputusan waktu nyata telah dibuat. Sinyal yang dapat mengubah hasil ada, tetapi tidak dapat disampaikan pada saat pengambilan keputusan karena mereka berada di sistem yang tidak dimaksudkan untuk diquery secara terus-menerus oleh pengambil keputusan otonom.

Arsitektur tidak rusak. Ini tidak sesuai dengan kebutuhan sistem otonom.

Disiplin yang Hilang: Teknik Konteks

Memori bersama memperkenalkan masalah yang sebagian besar tim tidak siap untuk memecahkan: memutuskan pengalaman apa yang harus bertahan.

Sistem AI menghasilkan jumlah besar pengalaman mentah—transaksi, klik, pesan, tindakan, hasil. Mempertahankan semua itu tidak praktis atau berguna. Tanpa seleksi yang disengaja, memori bersama menjadi noise. Tantangan bukan mengumpulkan lebih banyak data, tetapi membentuk pengalaman menjadi konteks yang dapat digunakan agen lain.

Inilah peran teknik konteks.

Teknik konteks adalah disiplin memutuskan pengamatan mana yang menjadi sinyal yang tahan lama, bagaimana sinyal tersebut direpresentasikan, dan kapan sinyal tersebut harus diungkapkan kepada agen lain. Ini berada di antara peristiwa mentah dan alasan agen, mengubah aktivitas transien menjadi pemahaman yang berkelanjutan dan relevan dengan keputusan.

Dalam prakteknya, ini berarti meningkatkan pola, indikator, dan asosiasi kondisional sambil membiarkan sebagian besar pengalaman mentah memudar. Sinyal lemah atau kasus tepi mungkin tidak penting secara mandiri, tetapi menjadi berharga ketika diakumulasi dan disampaikan pada saat yang tepat.

Teknik konteks menentukan apakah memori bersama hanya menyimpan pengalaman—atau memungkinkan pengalaman berkompound.

Apa yang Terjadi Jika Kami Melakukan Ini dengan Benar

Ini bukanlah kekhawatiran di masa depan. Ini adalah keputusan arsitektur yang dibuat—sering secara implisit—oleh tim infrastruktur hari ini.

Jalur default adalah isolasi. Agen-agen AI bertindak secara independen, mengandalkan hanya pengalaman mereka sendiri. Setiap agen membuat keputusan yang cepat dan benar secara lokal, tetapi kecerdasan mencapai titik jenuh. Kasus tepi yang sama berulang, sinyal lemah ditemukan kembali, dan kegagalan berulang dengan kecepatan dan volume yang lebih besar.

Alternatifnya adalah lapisan memori bersama.

Ketika konteks yang diperoleh bertahan dan terlihat pada saat pengambilan keputusan, pengalaman berhenti menguap. Wawasan yang ditemukan sekali tetap tersedia. Sinyal lemah mendapatkan makna melalui akumulasi. Keputusan diperbaiki bukan karena model berubah, tetapi karena agen-agen tidak lagi berperilaku secara terisolasi.

Ini tidak memerlukan model yang lebih besar, pelatihan ulang waktu nyata, atau kontrol pusat. Ini memerlukan memperlakukan memori sebagai lapisan arsitektur kelas satu—dirancang untuk akses berlatensi rendah, persistensi, dan visibilitas bersama.

Keputusan arsitektur mengeras dengan cepat. Sistem yang dibangun tanpa memori bersama menjadi semakin sulit untuk dimodifikasi karena agen-agen berkembang. Pilihan sederhana: membangun sistem yang mengakumulasi pengalaman—atau sistem yang terus-menerus direset.

Xiaowei Jiang adalah CEO dan Chief Architect di Tacnode, di mana ia fokus pada membangun infrastruktur konteks untuk agen AI.