Yapay Zekâ
Backboard Yeni Küresel Standardı AI Belleğinde Kuruyor – Gerçekten Ajans AI’ye Doğru Bir Sıçrama

Backboard yapay zeka sistemleri için önemli bir eşiği geçerek, belleğin kırılgan bir eklenti yerine temel altyapı olarak ele alınabileceğini kanıtladı. Şirket, şimdi hem LoCoMo hem de LongMemEval gibi büyük AI bellek benchmarklarını lider olduğunu açıkladı ve bu şekilde tutarlı akademik ve bağımsız değerlendirme yöntemleriyle bunu başaran ilk platform oldu.
NewMathData tarafından yapılan bağımsız bir değerlendirmede, Backboard LongMemEval üzerinde %93,4 doğruluk oranıyla, bugüne kadar bildirilen en yüksek puanı elde etti. Bu, daha önce LoCoMo üzerinde %90,1’lik bir puan elde etmiş olmasının ardından geldi ve Backboard’u kısa vadeli kesinlik ve uzun vadeli bağlamsal süreklilik arasında denge kurabilen sistemlerin çok küçük bir grubuna yerleştirdi.
Önemli olarak, incelemeciler Backboard’un cevaplarının, beklenen cevaplarla karşılaştırıldığında daha bağlamsal olarak doğru olmasına rağmen yanlış olarak işaretlenmiş birden fazla durum belirlediler. Bu durumlarda, sistem dar bir yorum yerine etkileşim sırasında zaten mevcut olan gerçek bilgileri entegre etti. Sonuç olarak, bildirilen puan, performansın üst sınırı yerine muhafazakar bir temel çizgisi temsil etmektedir.
Neden bellek AI’de sınırlayıcı faktör haline geldi
Çoğu modern AI sistemi hala gerçek bir geçmişe sahip değilmiş gibi davranıyor. Büyük dil modelleri akıcı cevaplar üretmede mükemmel olsalar da, bir oturum bittikten veya bir.prompt penceresi doldurulduktan sonra bağlamı unutma eğilimindeler. Bu sınırlama, geliştiricilerin durumu tekrar tekrar inşa etmek için geri çağırma hileleri, prompt mühendisliği veya souvent olarak kırılan ve sistemler daha karmaşık hale geldikçe kırılan araç zincirleri kullanmalarına neden oluyor.
Bellek sadece hatırlamayla ilgili değil. Pratik dağıtımlarda, bellek bir AI sisteminin zaman içinde tutarlı kalıp kalıp olmadığını, görevler arasında koordine olup olmadığını ve kullanıcılarla güven oluşturup oluşturamadığını belirler. Dayanıklı bellek olmadan, sistemler sıfırlanır, halüsinasyon görür veya birbirleriyle çelişirler. AI, tek dönüşlü etkileşimlerden uzun süreli iş akışlarına geçerken, bellek birincil tıkanıklık haline geldi.
Backboard bu sorunu, belleği ilk sınıf altyapı olarak ele alarak çözüyor. Uygulama katmanına belleği takmak yerine, kalıcılık, gömme, geri çağırma ve orkestrasyonu birleşik bir platforma entegre ediyor ve bu platforma tek bir API aracılığıyla erişiliyor.
Benchmark ayarlamasının yerine sistem düzeyinde bir yaklaşım
Backboard, mimarisini benchmark puanlarını takip etmek için tasarlamadı. Değerlendirmeler ya bağımsız olarak başlatıldı ya da sistem nasıl akademik araştırmayla karşılaştırıldığını anlamak için dahili olarak kullanıldı. Sonuç, gerçekçi koşullar altında sistem düzeyinde davranışın bir yansımasıdır, görev özgü.optimizasyon değil.
Bu ayrım önemli çünkü çoğu benchmark, model davranışını izole edilmiş olarak ölçerken, gerçek dünya AI sistemleri birçok hareketli parçadan oluşur. Backboard’un sonuçları, bellek performansının yalnızca model büyüklüğünün veya brute-force hesabının bir fonksiyonu olmadığını, aynı zamanda belleğin nasıl yapılandırıldığını, güncellendiğini ve zaman içinde paylaşıldığını gösteriyor.
Platform, kalıcı uzun vadeli bellek, yerel gömme ve vektörleştirme, yerleşik geri çağırma-arttırılmış üretim, ajanlar arası paylaşılan bellek ve 17.000’den fazla büyük dil modeline erişim gibi özellikleri birleştiriyor. Bu öğeleri birleştiren Backboard, girişimlerin üretim kısıtlamaları altında sık sık başarısız olan açık kaynaklı bileşenleri bir araya getirmeye olan ihtiyacı ortadan kaldırıyor.
Ajans AI’yi pratik hale getirmek
Ajans AI’ye ilgi devam etse de, çoğu uygulama demo aşamasının ötesine geçmekte zorlanıyor. Nedeni basittir. Paylaşılan, kalıcı belleğe sahip olmayan ajanlar etkili bir şekilde koordine edemez. Parçalanırlar, bağlamı kaybederler ve etkileşimler zaman içinde uzadıkça öngörülemez bir şekilde davranırlar.
Backboard, ajanların farklı altta yatan modellere dayanmasına rağmen, ajanlar arası kalıcı, paylaşılan belleği sağlar. Bellek güvenilir olduğunda, ajans davranışları doğal olarak ortaya çıkar, senaryolara bağlı olarak değil. Sistemler, önceki kararları hatırlayabilir, oturumlar arasında sürekliliği korur ve eylemleri koordine edebilir, sürekli yeniden yönlendirme gerektirmez.
Platformun temel bellek çerçevesi, durumun yeniden inşa edilmesi yerine zaman içinde sürekliliği korumak için tasarlanmıştır. Bu, AI sistemlerinin karmaşıklık arttıkça tutarlı ve denetlenebilir kalmasına olanak tanır.
Unutulamayacak sistemler için inşa edildi
Backboard’un mimarisi, şirketin kurucusu ve CEO’su Rob Imbeault tarafından şekillendirildi. Imbeault, daha önce Assent’i erken aşamasından küresel bir entreprise platformuna dönüştürmüş ve 1,4 milyar doların üzerinde bir değer elde etmişti. Assent’de Imbeault’un çalıştığı sistemler, müşterilerin operasyonlarının derinlerinde yer alıyor ve düzenleyici uyum ve karmaşık tedarik zinciri iş akışlarını destekliyordu. Bu ortamlarda, süreklilik, doğruluk ve güven mutlak gereksinimlerdi.
Bu deneyim, net bir ikna oluşmasına yol açtı. En değerli altyapı genellikle gösterişli değildir. Çalışan, tutarlı ve uzun süreli altyapídır. Bu ortamlarda, sistemler bağlamı kaybedildiğinde sıfırlanamaz. Durum ortadan kalkarsa veya güven aşınrsa, sistem operasyonel olarak başarısız olur, sadece teknik olarak değil.
Imbeault, modern AI’de yapısal bir uyumsuzluk ortaya çıktığını gördü. Büyük dil modelleri hızla ilerlerken, temel olarak durumsuz kaldı. Oturumlar arasında bağlam kayboldu, geliştiricilerin belleği geri çağırma zincirleri ve ad hoc geri çağırma katmanları aracılığıyla yeniden inşa etmelerine neden oldu. Bu yaklaşımlar demo için çalışabilir, ancak AI sistemleri sürekli çalıştırıldığında, ajanlar arasında koordine edildiğinde ve zaman içinde geliştirildiğinde bozulur.
Backboard, bu boşluğu kapatmak için inşa edildi. Bellek, uygulama mantığı yerine dayanıklı altyapı olarak ele alınıyor, böylece AI sistemleri etkileşimler, modeller ve ajanlar arasında durumu korur. Kalıcılık, doğruluk ve uzun vadeli güvenilirlik odaklanması, Backboard’un var olmadan önce oluşan bir inancı yansıtıyor: üretim ortamlarında bellek hataları, küçük hatalar değil, sistemsel risklerdir.
Bu bakış açısı, Backboard’un tasarım felsefesini temel alıyor. Hedef, yalnızca izole anlarda zekayı göstermek değil, büyüyen karmaşıklık ve uzayan zaman çerçeveleri karşısında güvenilir yazılımlar gibi davranan AI sistemlerini ermögilmek.
AI’nin geleceği için ne anlama geliyor
Backboard’un sonuçlarının daha geniş anlamı, AI’nin bir sonraki aşamasının yalnızca daha büyük modeller veya daha uzun bağlam pencereleri tarafından sürülmeyeceğidir. Sistemlerin hatırlayabilmesi, neden çıkarabilmesi ve zaman içinde gelişebilmesi tarafından sürülmeyecektir.
Girişimler AI’yi müşteri desteği, operasyonlar, araştırma ve uyum gibi alanlara dağıttıkça, kalıcı bellek güven ve ölçeklenebilirlik için temel haline gelir. Altyapı düzeyinde belleği çözen platformlar, ajans AI’nin deneyselden günlük kullanıma nasıl geçeceğini tanımlar.
Akademik ve bağımsız benchmark’lerde bellek mimarisi şimdi doğrulandıktan sonra, Backboard AI sistem davranışını gerçek dünya kısıtlamaları altında daha iyi anlamak ve değerlendirmek için ekiplere yardımcı olmaya odaklanıyor. Şirketin yaklaşan Switchboard yeteneği, karmaşık AI yapılandırmalarını daha şeffaf ve öngörülebilir hale getirmeyi amaçlıyor.
AI’nin geleceği, akıllıca prompt hileleri yerine zaman içinde güvenilen sistemler tarafından şekillendirilecek. Bellek, bu değişimin temelidir ve Backboard’un son sonuçları, bu temel finally şekilleniyor gibi görünüyor.












