Yapay Zeka
Backboard Yapay Zeka Belleğinde Yeni Bir Küresel Standart Belirliyor — Gerçekten Otonom Yapay Zekaya Doğru Bir Sıçrama

Arkalık Yapay zekâ sistemleri için önemli bir eşiği aşarak, belleğin kırılgan bir eklenti değil, temel bir altyapı olarak ele alınabileceğini gösterdi. Şirket, tutarlı akademik ve bağımsız değerlendirme yöntemleri altında bunu başaran ilk platform olarak, hem LoCoMo hem de LongMemEval olmak üzere iki büyük yapay zekâ bellek kıyaslama testinde lider olduğunu duyurdu.
Bağımsız bir değerlendirme sonucunda YeniMatematikVerileriBackboard, %93.4 doğruluk oranına ulaştı. LongMemEvalBu sonuç, kıyaslama testinin orijinal spesifikasyonuna göre çalıştırıldığında bugüne kadar kamuoyuna açıklanan en yüksek puandır. Bu sonuç, daha önceki başarılarının üzerine inşa edilmiştir. LoCoMo'da %90.1'lik bir puan yayınlandı.Bu durum, Backboard'u hem kısa vadeli hassasiyeti hem de uzun vadeli bağlamsal sürekliliği koruyabilen çok az sayıdaki sistem arasına yerleştiriyor.
Özellikle, değerlendiriciler, Backboard'un yanıtlarının, kıyaslama ölçütünün beklenen yanıtlarından bağlam açısından daha doğru olmasına rağmen yanlış olarak işaretlendiği birçok durum tespit etti. Bu durumlarda, sistem, istemin daha dar bir yorumuna bağlı kalmak yerine, etkileşimde zaten mevcut olan gerçek bilgilere yer verdi. Sonuç olarak, bildirilen puan, performansın üst sınırı yerine muhafazakar bir temel seviyeyi temsil etmektedir.
Yapay zekâda hafızanın neden sınırlayıcı faktör haline geldiği
Modern yapay zeka sistemlerinin çoğu hâlâ gerçek bir geçmişleri yokmuş gibi davranıyor. Büyük dil modelleri akıcı yanıtlar üretmede mükemmel olsa da, bir oturum sona erdiğinde veya bir komut istemi penceresi dolduğunda bağlamı unutma eğilimindedirler. Bu sınırlama, geliştiricileri, sistemler daha karmaşık hale geldikçe sıklıkla bozulan kırılgan araç zincirleri, komut istemi mühendisliği veya veri alma hileleri yoluyla durumu tekrar tekrar yeniden oluşturmaya zorlar.
Bellek sadece hatırlama ile ilgili değildir. Pratik uygulamalarda bellek, bir yapay zeka sisteminin zaman içinde tutarlı kalıp kalamayacağını, görevler arasında koordinasyon sağlayıp sağlayamayacağını ve kullanıcılarla güven oluşturup oluşturamayacağını belirler. Kalıcı bellek olmadan sistemler sıfırlanır, gördüğünü sanmakYa da kendi kendileriyle çelişebilirler. Yapay zeka tek seferlik etkileşimlerden uzun süreli iş akışlarına doğru ilerledikçe, bellek en önemli darboğaz haline geldi.
Backboard bu soruna, belleği birinci sınıf bir altyapı olarak ele alarak yaklaşıyor. Belleği bir uygulama katmanına eklemek yerine, kalıcılığı, yerleştirmeyi, erişimi ve düzenlemeyi tek bir API aracılığıyla erişilen birleşik bir platforma entegre ediyor.
Kıyaslama ayarlaması yerine sistem düzeyinde bir yaklaşım
Backboard, mimarisini kıyaslama puanlarını yakalamak için tasarlamadı. Değerlendirmeler ya bağımsız olarak başlatıldı ya da sistemin akademik araştırmalarla nasıl karşılaştırıldığını anlamak için dahili olarak kullanıldı. Elde edilen performans, göreve özgü optimizasyondan ziyade gerçekçi koşullar altında sistem düzeyindeki davranışı yansıtır.
Bu ayrım önemlidir çünkü çoğu kıyaslama testi model davranışını izole bir şekilde ölçerken, gerçek dünyadaki yapay zeka sistemleri birçok hareketli parçadan oluşmaktadır. Backboard'un sonuçları, bellek performansının yalnızca model boyutuna veya kaba kuvvet hesaplamasına bağlı olmadığını, aynı zamanda belleğin zaman içinde nasıl yapılandırıldığına, güncellendiğine ve paylaşıldığına da bağlı olduğunu göstermektedir.
Platform, kalıcı uzun vadeli bellek, yerel gömme ve vektörleştirme, yerleşik geri alma destekli üretim, aracılar arasında paylaşılan bellek ve kendi anahtarınızı getirme desteği de dahil olmak üzere 17,000'den fazla büyük dil modeline erişimi bir araya getiriyor. Bu unsurları birleştirerek, Backboard, işletmelerin üretim kısıtlamaları altında sıklıkla başarısız olan açık kaynaklı bileşenleri bir araya getirme ihtiyacını ortadan kaldırıyor.
Ajan tabanlı yapay zekayı pratik hale getirmek
İlgilenmek ajan yapay zeka Büyümeye devam ediyor, ancak çoğu uygulama demo aşamasının ötesine geçmekte zorlanıyor. Bunun nedeni basit. Paylaşımlı, kalıcı belleğe sahip olmayan ajanlar etkili bir şekilde koordinasyon sağlayamazlar. Parçalanırlar, bağlamlarını kaybederler ve etkileşimler zamanla uzadıkça öngörülemez davranışlar sergilerler.
Backboard, farklı temel modellere dayanan ajanlar arasında bile kalıcı, paylaşımlı bir bellek sağlar. Bellek güvenilir olduğunda, ajan davranışı önceden belirlenmiş bir senaryoya bağlı kalmak yerine doğal olarak ortaya çıkar. Sistemler önceki kararları hatırlayabilir, oturumlar arasında sürekliliği sağlayabilir ve sürekli yeniden yönlendirmeye gerek kalmadan eylemleri koordine edebilir.
Platformun temelindeki bellek çerçevesi, statik grafikler veya tekrarlanan veri alma yoluyla durumu yeniden oluşturmak yerine zamansal tutarlılığı korumak üzere tasarlanmıştır. Bu, yapay zeka sistemlerinin karmaşıklıkları arttıkça tutarlı ve denetlenebilir kalmalarını sağlar.
Unutmayı göze alamayan sistemler için tasarlandı.
Backboard'un mimarisi, kurucusu ve CEO'sunun deneyimine dayanmaktadır. Rob Imbeault, daha önce inşaya yardımcı olanlar asistan Erken aşamadaki bir girişimden, değeri 1.4 milyar doları aşan küresel bir kurumsal platforma dönüşüm. Assent'te Imbeault'un üzerinde çalıştığı sistemler, müşteri operasyonlarının derinliklerine yerleştirilmişti ve süreklilik, doğruluk ve güvenin pazarlık konusu olmadığı düzenleyici uyumluluğu ve karmaşık tedarik zinciri iş akışlarını destekliyordu.
Bu deneyim, net bir kanaat oluşturdu. En değerli altyapı nadiren gösterişlidir. Sessizce, istikrarlı bir şekilde ve uzun süreler boyunca çalışan altyapıdır. Bu ortamlarda, bağlam kaybolduğunda sistemler sıfırlanamaz. Durum ortadan kalkarsa veya güven aşınırsa, sistem yalnızca teknik olarak değil, operasyonel olarak da başarısız olur.
Imbeault, modern yapay zekada ortaya çıkan yapısal bir uyumsuzluğu fark etti. Büyük dil modelleri hızla gelişirken, temelde durumsuz kaldılar. Oturumlar arasında bağlam kayboldu ve geliştiricileri kırılgan komut zincirleri ve geçici alma katmanları aracılığıyla belleği yeniden oluşturmaya zorladı. Bu yaklaşımlar demo gösterimlerinde işe yarayabilir, ancak yapay zeka sistemlerinin sürekli çalışması, ajanlar arasında koordinasyon sağlaması ve zaman içinde gelişmesi beklendiğinde yetersiz kalırlar.
Backboard bu açığı kapatmak için geliştirildi. Bellek, uygulama mantığı yerine dayanıklı bir altyapı olarak ele alınıyor ve yapay zeka sistemlerinin etkileşimler, modeller ve ajanlar arasında durumlarını korumasına olanak tanıyor. Kalıcılık, doğruluk ve uzun vadeli güvenilirliğe odaklanma, Backboard'ın varlığından çok önce oluşmuş bir inancı yansıtıyor: üretim ortamlarında bellek arızaları küçük kusurlar değil, sistemik risklerdir.
Bu bakış açısı, Backboard'un tasarım felsefesinin temelini oluşturmaktadır. Amaç, zekayı tekil anlarda sergilemek değil, karmaşıklık arttıkça ve zaman ufukları uzadıkça bile güvenilir yazılım gibi davranan yapay zeka sistemlerini mümkün kılmaktır.
Bu durum yapay zekanın geleceği için ne anlama geliyor?
Bunun daha geniş kapsamlı sonuçları şunlardır: Pota tahtasının Sonuç olarak, yapay zekânın bir sonraki aşaması yalnızca daha büyük modeller veya daha uzun bağlam pencereleriyle yönlendirilmeyecek. Zaman içinde hatırlayabilen, akıl yürütebilen ve evrim geçirebilen sistemler tarafından yönlendirilecek.
Kurumsal işletmeler müşteri desteği, operasyonlar, araştırma ve uyumluluk alanlarında yapay zekayı kullanmaya başladıkça, kalıcı bellek güven ve ölçeklenebilirliğin temeli haline geliyor. Altyapı düzeyinde bellek sorununu çözen platformlar, ajan tabanlı yapay zekanın deneme aşamasından günlük kullanıma nasıl geçeceğini belirleyecek.
Bellek mimarisi hem akademik hem de bağımsız kıyaslama testlerinde doğrulanan Backboard, artık ekiplerin gerçek dünya kısıtlamaları altında yapay zeka sistemlerinin davranışını daha iyi anlamalarına ve değerlendirmelerine yardımcı olmaya odaklanıyor. Şirketin yakında piyasaya sürülecek Switchboard özelliği, karmaşık yapay zeka yapılandırmalarını daha şeffaf ve tahmin edilebilir hale getirmeyi amaçlıyor.
Yapay zekanın geleceği, zekice hazırlanmış komut istemi hilelerinden ziyade, zaman içinde güvenilebilecek sistemler tarafından şekillendirilecek. Bellek, bu değişimin temelini oluşturuyor ve Backboard'un son sonuçları, bu temelin nihayet şekillenmeye başladığını gösteriyor.












