Connect with us

Kecerdasan buatan

Backboard Menetapkan Standar Global Baru dalam Memori AI — Sebuah Lompatan Menuju AI yang Sungguh-Sungguh Agensi

mm

Backboard telah melewati ambang batas penting untuk sistem kecerdasan buatan dengan menunjukkan bahwa memori dapat dianggap sebagai infrastruktur inti daripada tambahan yang rapuh. Perusahaan tersebut mengumumkan bahwa mereka sekarang memimpin kedua benchmark memori AI utama, LoCoMo dan LongMemEval, menjadi platform pertama yang melakukannya di bawah metode evaluasi akademik dan independen yang konsisten.

Dalam penilaian independen yang dilakukan oleh NewMathData, Backboard mencapai akurasi 93,4 persen pada LongMemEval, skor tertinggi yang dilaporkan secara publik hingga saat ini ketika dijalankan sesuai dengan spesifikasi benchmark asli. Hasil ini membangun pada skor 90,1 persen sebelumnya yang dipublikasikan pada LoCoMo, menempatkan Backboard di antara kelompok sistem yang sangat kecil yang mampu mempertahankan presisi horizon pendek dan kontinuitas kontekstual horizon panjang.

Yang patut dicatat, para peninjau mengidentifikasi beberapa kasus di mana respons Backboard ditandai tidak benar meskipun lebih akurat secara kontekstual daripada jawaban yang diharapkan oleh benchmark. Dalam kasus-kasus tersebut, sistem tersebut menggabungkan informasi faktual yang sudah ada dalam interaksi daripada mematuhi interpretasi yang lebih sempit dari prompt. Sebagai hasilnya, skor yang dilaporkan mewakili baseline konservatif daripada batas atas kinerja.

Mengapa memori telah menjadi faktor pembatas dalam AI

Sebagian besar sistem AI modern masih berperilaku seolah-olah mereka tidak memiliki masa lalu yang nyata. Meskipun model bahasa besar sangat baik dalam menghasilkan respons yang fasih, mereka cenderung melupakan konteks sekali sesi berakhir atau jendela prompt terisi. Keterbatasan ini memaksa pengembang untuk membangun kembali status secara berulang melalui trik pengambilan, teknik prompt, atau rantai alat yang rapuh yang sering rusak ketika sistem tumbuh lebih kompleks.

Memori bukan hanya tentang mengingat. Dalam penerapan praktis, memori menentukan apakah sistem AI dapat tetap kohesif seiring waktu, mengoordinasikan tugas, dan membangun kepercayaan dengan pengguna. Tanpa memori yang tahan lama, sistem reset, mengalami halusinasi, atau bertentangan dengan diri mereka sendiri. Ketika AI bergerak dari interaksi satu putaran ke alur kerja berjalan lama, memori telah menjadi bottleneck utama.

Backboard mendekati masalah ini dengan memperlakukan memori sebagai infrastruktur kelas satu. Daripada memasang memori pada lapisan aplikasi, ia mengintegrasikan persistensi, embeddings, pengambilan, dan orkestrasi ke dalam platform terpadu yang diakses melalui API tunggal.

Pendekatan sistemik daripada penyetelan benchmark

Backboard tidak merancang arsitektur mereka untuk mengejar skor benchmark. Evaluasi tersebut baik dimulai secara independen atau digunakan secara internal untuk memahami bagaimana sistem tersebut dibandingkan dengan penelitian akademik. Kinerja yang dihasilkan mencerminkan perilaku sistemik di bawah kondisi realistis daripada optimisasi tugas spesifik.

Perbedaan ini penting karena sebagian besar benchmark mengukur perilaku model dalam isolasi, sedangkan sistem AI dunia nyata terdiri dari banyak komponen yang bergerak. Hasil Backboard menunjukkan bahwa kinerja memori tidak hanya merupakan fungsi dari ukuran model atau komputasi brute, tetapi dari bagaimana memori disusun, diperbarui, dan dibagikan seiring waktu.

Platform ini menggabungkan memori jangka panjang yang persisten, embeddings dan vektorisasi asli, generasi yang ditingkatkan dengan pengambilan, memori bersama di seluruh agen, dan akses ke lebih dari 17.000 model bahasa besar, termasuk dukungan bring-your-own-key. Dengan menggabungkan elemen-elemen ini, Backboard menghilangkan kebutuhan bagi perusahaan untuk menjahit komponen sumber terbuka yang sering gagal di bawah kendala produksi.

Mengubah AI agensi menjadi praktis

Minat pada AI agensi terus tumbuh, tetapi sebagian besar implementasi berjuang untuk bergerak melampaui demo. Alasannya sederhana. Agen tanpa memori bersama yang persisten tidak dapat mengoordinasikan secara efektif. Mereka terfragmentasi, kehilangan konteks, dan berperilaku tidak terduga ketika interaksi diperpanjang seiring waktu.

Backboard memungkinkan memori bersama yang persisten di seluruh agen bahkan ketika agen-agen tersebut bergantung pada model yang berbeda. Ketika memori dapat diandalkan, perilaku agensi muncul secara alami daripada diprogram. Sistem dapat mengingat keputusan sebelumnya, mempertahankan kontinuitas di seluruh sesi, dan mengoordinasikan tindakan tanpa perlu pengaturan ulang yang konstan.

Kerangka memori dasar platform dirancang untuk melestarikan kohesi temporal daripada merekonstruksi status melalui grafik statis atau pengambilan berulang. Ini memungkinkan sistem AI untuk tetap konsisten dan dapat diaudit ketika mereka tumbuh dalam kompleksitas.

Dibangun untuk sistem yang tidak bisa melupakan

Arsitektur Backboard berakar pada pengalaman pendiri dan CEO, Rob Imbeault, yang sebelumnya membantu membangun Assent dari startup awal menjadi platform perusahaan global yang dinilai lebih dari $1,4 miliar. Di Assent, sistem yang Imbeault kerjakan tertanam jauh di dalam operasi pelanggan, mendukung kepatuhan regulasi dan alur kerja rantai pasokan yang kompleks di mana kontinuitas, kesempurnaan, dan kepercayaan tidak dapat dinegosiasikan.

Pengalaman itu membentuk keyakinan yang jelas. Infrastruktur yang paling berharga jarang menarik perhatian. Ini adalah infrastruktur yang bekerja dengan tenang, konsisten, dan dalam jangka waktu lama. Dalam lingkungan tersebut, sistem tidak dapat direset ketika konteks hilang. Jika status menghilang atau kepercayaan rusak, sistem gagal operasional, bukan hanya secara teknis.

Imbeault melihat ketidaksesuaian struktural yang muncul dalam AI modern. Meskipun model bahasa besar berkembang pesat, mereka tetap secara fundamental tidak memiliki status. Konteks menghilang di antara sesi, memaksa pengembang untuk merekonstruksi memori melalui rantai prompt yang rapuh dan lapisan pengambilan ad hoc. Pendekatan ini mungkin berfungsi dalam demo, tetapi mereka rusak ketika sistem AI diharapkan untuk berjalan terus-menerus, mengoordinasikan di seluruh agen, dan berkembang seiring waktu.

Backboard dibangun untuk menutup kesenjangan itu. Memori diperlakukan sebagai infrastruktur yang tahan lama daripada logika aplikasi, memungkinkan sistem AI untuk mempertahankan status di seluruh interaksi, model, dan agen. Fokus pada persistensi, kesempurnaan, dan keandalan jangka panjang mencerminkan keyakinan yang terbentuk jauh sebelum Backboard ada: dalam lingkungan produksi, kegagalan memori bukanlah cacat minor. Mereka adalah risiko sistemik.

Perspektif ini mendukung filosofi desain Backboard. Tujuan bukanlah untuk menampilkan kecerdasan dalam momen yang terisolasi, tetapi untuk memungkinkan sistem AI yang berperilaku seperti perangkat lunak yang dapat diandalkan, bahkan ketika kompleksitas tumbuh dan horizon waktu diperpanjang.

Apa yang ini berarti untuk masa depan AI

Implikasi yang lebih luas dari hasil Backboard adalah bahwa fase berikutnya dari kemajuan AI tidak akan didorong hanya oleh model yang lebih besar atau jendela konteks yang lebih panjang. Ini akan didorong oleh sistem yang dapat mengingat, bernalar, dan berkembang seiring waktu.

Ketika perusahaan menggelar AI di seluruh dukungan pelanggan, operasi, penelitian, dan kepatuhan, memori yang persisten menjadi dasar untuk kepercayaan dan skalabilitas. Platform yang memecahkan memori pada tingkat infrastruktur akan mendefinisikan bagaimana AI agensi bergerak dari eksperimen ke penggunaan sehari-hari.

Dengan arsitektur memori yang sekarang divalidasi di seluruh benchmark akademik dan independen, Backboard mengalihkan perhatian untuk membantu tim memahami dan menilai perilaku sistem AI di bawah kendala dunia nyata. Kapabilitas Switchboard yang akan datang dari perusahaan bertujuan untuk membuat konfigurasi AI yang kompleks lebih transparan dan dapat diprediksi.

Masa depan AI akan dibentuk lebih sedikit oleh trik prompt yang cerdas dan lebih banyak oleh sistem yang dapat dipercaya seiring waktu. Memori adalah dasar dari pergeseran itu, dan hasil terbaru Backboard menunjukkan bahwa dasar ini akhirnya mulai terbentuk.

Antoine adalah seorang pemimpin visioner dan mitra pendiri Unite.AI, didorong oleh semangat yang tak tergoyahkan untuk membentuk dan mempromosikan masa depan AI dan robotika. Seorang wirausaha serial, ia percaya bahwa AI akan sama-sama mengganggu masyarakat seperti listrik, dan sering tertangkap berbicara tentang potensi teknologi mengganggu dan AGI.

As a futurist, ia berdedikasi untuk mengeksplorasi bagaimana inovasi ini akan membentuk dunia kita. Selain itu, ia adalah pendiri Securities.io, sebuah platform yang fokus pada investasi di teknologi-teknologi canggih yang mendefinisikan kembali masa depan dan membentuk kembali seluruh sektor.