Inteligență artificială
Backboard Sets New Global Standard in AI Memory — A Leap Toward Truly Agentic AI

Backboard a depășit un prag important pentru sistemele de inteligență artificială, demonstrând că memoria poate fi tratată ca o infrastructură de bază, în loc de un adaos fragil. Compania a anunțat că acum conduce ambele benchmark-uri majore de memorie AI, LoCoMo și LongMemEval, devenind prima platformă care face acest lucru în condiții de evaluare academică și independentă consecventă.
În cadrul unei evaluări independente efectuate de NewMathData, Backboard a obținut o acuratețe de 93,4 la sută la LongMemEval, cel mai ridicat scor raportat public până în prezent, atunci când este rulat conform specificației originale a benchmark-ului. Acest rezultat se bazează pe scorul său anterior publicat de 90,1 la sută pe LoCoMo, plasând Backboard într-un grup foarte mic de sisteme capabile să mențină atât precizia pe termen scurt, cât și continuitatea contextuală pe termen lung.
În mod remarcabil, reviewerii au identificat mai multe cazuri în care răspunsurile Backboard au fost marcate ca incorecte, în ciuda faptului că erau mai contextual corecte decât răspunsurile așteptate de benchmark. În aceste cazuri, sistemul a incorporat informații factuale deja prezente în interacțiune, în loc să se conformeze unei interpretări mai înguste a prompt-ului. Ca rezultat, scorul raportat reprezintă o bază conservatoare, mai degrabă decât limita superioară a performanței.
De ce memoria a devenit factorul limitativ în IA
Majoritatea sistemelor de IA moderne se comportă încă ca și cum nu ar avea un trecut real. În timp ce modelele de limbaj mare sunt excelente la generarea de răspunsuri fluente, ele tind să uite contextul odată ce o sesiune se încheie sau o fereastră de prompt se umple. Această limitare forțează dezvoltatorii să reconstruiască starea repetat prin hacks de recuperare, inginerie de prompt sau lanțuri de unelte fragile care adesea se sparg pe măsură ce sistemele cresc în complexitate.
Memoria nu este doar despre reamintire. În implementări practice, memoria determină dacă un sistem de IA poate rămâne coerent în timp, coordona pe traversul sarcinilor și construi încredere cu utilizatorii. Fără o memorie durabilă, sistemele resetează, halucinează sau se contrazic. Pe măsură ce IA se mută de la interacțiuni pe termen scurt la fluxuri de lucru pe termen lung, memoria a devenit principala blocaj.
Backboard abordează această problemă prin tratarea memoriei ca o infrastructură de clasă întâi. Mai degrabă decât să atașeze memoria la un strat de aplicație, el integrează persistența, încorporările, recuperarea și orchestrarea într-o platformă unificată accesată printr-un singur API.
O abordare la nivel de sistem, mai degrabă decât ajustarea benchmark-ului
Backboard nu și-a proiectat arhitectura pentru a urmări scoruri de benchmark. Evaluările au fost inițiate fie independent, fie utilizate intern pentru a înțelege cum sistemul se compară cu cercetarea academică. Performanța rezultată reflectă comportamentul la nivel de sistem în condiții realiste, mai degrabă decât optimizarea specifică unei sarcini.
Acest lucru este important, deoarece majoritatea benchmark-urilor măsoară comportamentul modelului în izolare, în timp ce sistemele de IA reale sunt compuse din multe părți mobile. Rezultatele Backboard sugerează că performanța memoriei nu este doar o funcție a dimensiunii modelului sau a calculului prin forță brută, ci a modului în care memoria este structurată, actualizată și partajată în timp.
Platforma combină memoria pe termen lung persistentă, încorporările native și vectorizarea, generarea augmentată de recuperare încorporată, memoria partajată între agenți și acces la peste 17.000 de modele de limbaj mare, inclusiv suport pentru aducerea cheii tale. Prin unificarea acestor elemente, Backboard elimină nevoia ca întreprinderile să coasă împreună componente deschise care adesea eşuează sub constrângerile de producție.
Făcând IA agentică practică
Interesul pentru IA agentică continuă să crească, dar majoritatea implementărilor se luptă să treacă dincolo de demo-uri. Motivul este simplu. Agenții fără memorie partajată și persistentă nu pot coordona eficient. Ei se fragmentează, pierd contextul și se comportă imprevizibil pe măsură ce interacțiunile se extind în timp.
Backboard permite memorie partajată și persistentă între agenți, chiar și atunci când acești agenți se bazează pe modele subiacente diferite. Atunci când memoria este fiabilă, comportamentul agentic apare în mod natural, mai degrabă decât fiind scriptat. Sistemele pot reține deciziile anterioare, menține continuitatea pe sesiuni și coordona acțiuni fără re-promptarea constantă.
Cadru de memorie subiacent al platformei este proiectat pentru a păstra coerența temporală, mai degrabă decât a reconstrui starea prin grafice statice sau recuperări repetate. Acest lucru permite sistemelor de IA să rămână consistente și auditabile pe măsură ce cresc în complexitate.
Construit pentru sisteme care nu își pot permite să uite
Arhitectura Backboard are rădăcini în experiența fondatorului și CEO-ului său, Rob Imbeault, care a ajutat anterior la construirea Assent de la o fază incipientă de startup la o platformă globală de întreprindere evaluată la peste 1,4 miliarde de dolari. La Assent, sistemele cu care lucra Imbeault erau încorporate profund în operațiunile clienților, sprijinind conformitatea regulamentară și fluxurile de aprovizionare complexe, unde continuitatea, corectitudinea și încrederea erau negociabile.
Această experiență a modelat o convingere clară. Cea mai valoroasă infrastructură este rareori strălucitoare. Este infrastructura care funcționează liniștit, consistent și pe perioade lungi de timp. În acele medii, sistemele nu pot resetă atunci când contextul este pierdut. Dacă starea dispare sau încrederea se erodează, sistemul eşuează operațional, nu doar tehnic.
Imbeault a văzut o discrepanță structurală care apare în IA modernă. În timp ce modelele de limbaj mare au evoluat rapid, ele au rămas fundamental fără stare. Contextul a dispărut între sesiuni, forțând dezvoltatorii să reconstruiască memoria prin lanțuri de prompt fragile și straturi de recuperare ad-hoc. Aceste abordări ar putea funcționa în demo-uri, dar se sparg atunci când sistemele de IA sunt așteptate să ruleze continuu, să coordoneze pe traversul agenților și să evolueze în timp.
Backboard a fost construit pentru a închide această lacună. Memoria este tratată ca o infrastructură durabilă, mai degrabă decât logică de aplicație, permițând sistemelor de IA să rețină starea pe interacțiuni, modele și agenți. Accentul pe persistență, corectitudine și fiabilitate pe termen lung reflectă o convingere formată cu mult timp înainte de a exista Backboard: în medii de producție, eșecurile de memorie nu sunt defecte minore. Sunt riscuri sistemice.
Această perspectivă stă la baza filozofiei de proiectare a Backboard. Scopul nu este de a demonstra inteligență în momente izolate, ci de a permite sisteme de IA care se comportă ca software de încredere, chiar și pe măsură ce complexitatea crește și orizonturile temporale se extind.
Ce înseamnă acest lucru pentru viitorul IA
Implicația mai largă a rezultatelor Backboard este că următoarea fază a progresului IA nu va fi condusă doar de modele mai mari sau ferestre de context mai lungi. Va fi condusă de sisteme care pot reține, raționa și evolua în timp.
Pe măsură ce întreprinderile implementează IA în suportul clienților, operațiuni, cercetare și conformitate, memoria persistentă devine baza pentru încredere și scalabilitate. Platformele care rezolvă memoria la nivel de infrastructură vor defini cum IA agentică se mută de la experimentare la utilizare de zi cu zi.
Cu arhitectura de memorie acum validată atât în benchmark-uri academice, cât și independente, Backboard se concentrează pe ajutarea echipelor să înțeleagă și să evalueze mai bine comportamentul sistemelor de IA în condiții reale. Capacitatea viitoare Switchboard a companiei urmărește să facă configurațiile complexe de IA mai transparente și previzibile.
Viitorul IA va fi modelat mai puțin de trucuri de prompt inteligente și mai mult de sisteme care pot fi încredințate în timp. Memoria este baza acestei schimbări, iar rezultatele recente ale Backboard sugerează că această bază este în sfârșit în curs de formare.












