Connect with us

Artificial Intelligence

Backboard Menetapkan Standar Global Baru dalam Memori AI — Lompatan Menuju AI yang Benar-Benar Agenik

mm

Backboard telah melampaui ambang batas penting untuk sistem kecerdasan buatan dengan menunjukkan bahwa memori dapat diperlakukan sebagai infrastruktur inti, bukan sekadar tambahan yang rapuh. Perusahaan mengumumkan bahwa kini mereka memimpin kedua tolok ukur memori AI utama, LoCoMo dan LongMemEval, menjadi platform pertama yang melakukannya di bawah metode evaluasi akademis dan independen yang konsisten.

Dalam penilaian independen yang dilakukan oleh NewMathData, Backboard mencapai akurasi 93,4 persen pada LongMemEval, skor tertinggi yang dilaporkan publik hingga saat ini ketika dijalankan sesuai spesifikasi asli tolok ukur. Hasil ini dibangun di atas skor 90,1 persen yang sebelumnya dipublikasikan pada LoCoMo, menempatkan Backboard di antara kelompok sistem yang sangat kecil yang mampu mempertahankan presisi jangka pendek dan kontinuitas kontekstual jangka panjang.

Patut dicatat, para peninjau mengidentifikasi beberapa kasus di mana respons Backboard ditandai salah meskipun secara kontekstual lebih akurat daripada jawaban yang diharapkan oleh tolok ukur. Dalam kasus ini, sistem menggabungkan informasi faktual yang sudah ada dalam interaksi daripada berpegang pada interpretasi perintah yang lebih sempit. Akibatnya, skor yang dilaporkan mewakili baseline konservatif, bukan batas atas kinerja.

Mengapa memori telah menjadi faktor pembatas dalam AI

Sebagian besar sistem AI modern masih berperilaku seolah-olah mereka tidak memiliki masa lalu yang nyata. Sementara model bahasa besar sangat baik dalam menghasilkan respons yang lancar, mereka cenderung melupakan konteks begitu sesi berakhir atau jendela perintah terisi. Keterbatasan ini memaksa pengembang untuk berulang kali membangun kembali keadaan melalui peretasan pengambilan, rekayasa perintah, atau rantai alat yang rapuh yang sering rusak seiring sistem menjadi lebih kompleks.

Memori bukan hanya tentang mengingat. Dalam penerapan praktis, memori menentukan apakah sistem AI dapat tetap koheren dari waktu ke waktu, berkoordinasi lintas tugas, dan membangun kepercayaan dengan pengguna. Tanpa memori yang tahan lama, sistem melakukan reset, berhalusinasi, atau berkontradiksi dengan dirinya sendiri. Seiring AI bergerak dari interaksi satu putaran ke alur kerja yang berjalan lama, memori telah menjadi hambatan utama.

Backboard mendekati masalah ini dengan memperlakukan memori sebagai infrastruktur kelas satu. Alih-alih menambahkan memori ke lapisan aplikasi, platform ini mengintegrasikan persistensi, embedding, pengambilan, dan orkestrasi ke dalam platform terpadu yang diakses melalui satu API.

Pendekatan tingkat sistem, bukan penyetelan tolok ukur

Backboard tidak merancang arsitekturnya untuk mengejar skor tolok ukur. Evaluasi tersebut baik dimulai secara independen atau digunakan secara internal untuk memahami bagaimana sistem dibandingkan dengan penelitian akademis. Kinerja yang dihasilkan mencerminkan perilaku tingkat sistem dalam kondisi realistis, bukan optimasi khusus tugas.

Perbedaan ini penting karena sebagian besar tolok ukur mengukur perilaku model secara terisolasi, sementara sistem AI dunia nyata terdiri dari banyak bagian yang bergerak. Hasil Backboard menunjukkan bahwa kinerja memori bukan semata-mata fungsi dari ukuran model atau komputasi kasar, tetapi dari bagaimana memori disusun, diperbarui, dan dibagikan dari waktu ke waktu.

Platform ini menggabungkan memori jangka panjang yang persisten, embedding dan vektorisasi asli, retrieval-augmented generation bawaan, memori bersama lintas agen, dan akses ke lebih dari 17.000 model bahasa besar, termasuk dukungan bring-your-own-key. Dengan menyatukan elemen-elemen ini, Backboard menghilangkan kebutuhan perusahaan untuk menyatukan komponen sumber terbuka yang sering gagal di bawah kendala produksi.

Membuat AI agenik menjadi praktis

Minat pada AI agenik terus tumbuh, tetapi sebagian besar implementasi kesulitan untuk melampaui demo. Alasannya sederhana. Agen tanpa memori bersama yang persisten tidak dapat berkoordinasi secara efektif. Mereka terfragmentasi, kehilangan konteks, dan berperilaku tidak terduga seiring interaksi berlangsung dari waktu ke waktu.

Backboard memungkinkan memori persisten dan bersama lintas agen bahkan ketika agen-agen tersebut mengandalkan model dasar yang berbeda. Ketika memori andal, perilaku agenik muncul secara alami daripada diatur dengan skrip. Sistem dapat mengingat keputusan sebelumnya, menjaga kontinuitas lintas sesi, dan mengoordinasikan tindakan tanpa terus-menerus meminta ulang perintah.

Kerangka kerja memori dasar platform dirancang untuk melestarikan koherensi temporal daripada merekonstruksi keadaan melalui grafik statis atau pengambilan berulang. Hal ini memungkinkan sistem AI tetap konsisten dan dapat diaudit seiring kompleksitasnya bertambah.

Dibangun untuk sistem yang tidak boleh lupa

Arsitektur Backboard berakar pada pengalaman pendiri dan CEO-nya, Rob Imbeault, yang sebelumnya membantu membangun Assent dari startup tahap awal menjadi platform perusahaan global yang bernilai lebih dari $1,4 miliar. Di Assent, sistem yang dikerjakan Imbeault tertanam jauh di dalam operasi pelanggan, mendukung kepatuhan regulasi dan alur kerja rantai pasokan kompleks di mana kontinuitas, ketepatan, dan kepercayaan adalah hal yang mutlak.

Pengalaman itu membentuk keyakinan yang jelas. Infrastruktur yang paling berharga jarang yang mencolok. Ia adalah infrastruktur yang bekerja dengan tenang, konsisten, dan dalam jangka waktu yang lama. Di lingkungan tersebut, sistem tidak boleh direset ketika konteks hilang. Jika keadaan menghilang atau kepercayaan terkikis, sistem gagal secara operasional, bukan hanya secara teknis.

Imbeault melihat ketidaksesuaian struktural yang muncul dalam AI modern. Sementara model bahasa besar berkembang pesat, mereka pada dasarnya tetap tanpa keadaan. Konteks menghilang di antara sesi, memaksa pengembang untuk merekonstruksi memori melalui rantai perintah yang rapuh dan lapisan pengambilan ad hoc. Pendekatan ini mungkin berhasil dalam demo, tetapi gagal ketika sistem AI diharapkan berjalan terus-menerus, berkoordinasi lintas agen, dan berkembang dari waktu ke waktu.

Backboard dibangun untuk menutup kesenjangan itu. Memori diperlakukan sebagai infrastruktur yang tahan lama, bukan logika aplikasi, memungkinkan sistem AI mempertahankan keadaan lintas interaksi, model, dan agen. Fokus pada persistensi, ketepatan, dan keandalan jangka panjang mencerminkan keyakinan yang terbentuk jauh sebelum Backboard ada: dalam lingkungan produksi, kegagalan memori bukanlah cacat kecil. Mereka adalah risiko sistemik.

Perspektif ini mendasari filosofi desain Backboard. Tujuannya bukan untuk memamerkan kecerdasan dalam momen-momen terisolasi, tetapi untuk memungkinkan sistem AI berperilaku seperti perangkat lunak yang dapat diandalkan, bahkan ketika kompleksitas tumbuh dan cakrawala waktu memanjang.

Apa artinya ini untuk masa depan AI

Implikasi yang lebih luas dari hasil Backboard adalah bahwa fase kemajuan AI berikutnya tidak akan didorong semata-mata oleh model yang lebih besar atau jendela konteks yang lebih panjang. Ia akan didorong oleh sistem yang dapat mengingat, bernalar, dan berkembang dari waktu ke waktu.

Seiring perusahaan menerapkan AI di seluruh dukungan pelanggan, operasi, penelitian, dan kepatuhan, memori persisten menjadi fondasi untuk kepercayaan dan skalabilitas. Platform yang menyelesaikan memori di tingkat infrastruktur akan menentukan bagaimana AI agenik bergerak dari eksperimen ke penggunaan sehari-hari.

Dengan arsitektur memorinya yang kini telah divalidasi di kedua tolok ukur akademis dan independen, Backboard mengalihkan perhatiannya untuk membantu tim lebih memahami dan mengevaluasi perilaku sistem AI di bawah kendala dunia nyata. Kemampuan Switchboard yang akan datang dari perusahaan bertujuan untuk membuat konfigurasi AI yang kompleks menjadi lebih transparan dan dapat diprediksi.

Masa depan AI akan lebih sedikit dibentuk oleh trik perintah yang cerdik dan lebih banyak oleh sistem yang dapat dipercaya dari waktu ke waktu. Memori adalah fondasi dari pergeseran itu, dan hasil terbaru Backboard menunjukkan bahwa fondasi ini akhirnya mulai terbentuk.

//www.futurist.ai">futurist, ia berdedikasi untuk mengeksplorasi bagaimana inovasi-inovasi ini akan membentuk dunia kita. Selain itu, ia adalah pendiri Securities.io, sebuah platform yang berfokus pada investasi dalam teknologi-teknologi mutakhir yang mendefinisikan ulang masa depan dan membentuk ulang seluruh sektor.