Connect with us

Intelligenza artificiale

Backboard Stabilisce Un Nuovo Standard Globale Nella Memoria AI — Un Salto Verso Un’AI Veramente Agente

mm

Backboard ha superato una soglia importante per i sistemi di intelligenza artificiale dimostrando che la memoria può essere trattata come infrastruttura di base piuttosto che come un’aggiunta fragile. L’azienda ha annunciato che ora è leader in entrambi i principali benchmark di memoria AI, LoCoMo e LongMemEval, diventando la prima piattaforma a farlo con metodi di valutazione accademica e indipendente coerenti.

In una valutazione indipendente condotta da NewMathData, Backboard ha raggiunto il 93,4 percento di precisione su LongMemEval, il punteggio più alto segnalato pubblicamente fino ad ora quando eseguito secondo le specifiche originali del benchmark. Questo risultato si basa sul suo precedente punteggio pubblicato del 90,1 percento su LoCoMo, ponendo Backboard tra un piccolo gruppo di sistemi in grado di mantenere sia la precisione a breve termine che la continuità contestuale a lungo termine.

In particolare, i revisori hanno identificato più casi in cui le risposte di Backboard sono state contrassegnate come errate nonostante fossero più contestualmente accurate delle risposte attese del benchmark. In questi casi, il sistema ha incorporato informazioni fattuali già presenti nell’interazione piuttosto che aderire a un’interpretazione più ristretta del prompt. Di conseguenza, il punteggio segnalato rappresenta una baseline conservativa piuttosto che il limite superiore delle prestazioni.

Perché la memoria è diventata il fattore limitante nell’AI

La maggior parte dei sistemi di intelligenza artificiale moderni si comporta ancora come se non avessero un vero passato. Mentre i grandi modelli linguistici sono eccellenti nel generare risposte fluide, tendono a dimenticare il contesto una volta terminata una sessione o riempito una finestra di prompt. Questa limitazione costringe gli sviluppatori a ricostruire lo stato ripetutamente attraverso hack di recupero, ingegneria di prompt o catene di strumenti fragili che spesso si rompono man mano che i sistemi crescono di complessità.

La memoria non è solo questione di richiamo. Nelle distribuzioni pratiche, la memoria determina se un sistema di intelligenza artificiale possa rimanere coerente nel tempo, coordinare attraverso attività e costruire fiducia con gli utenti. Senza una memoria duratura, i sistemi si azzerano, allucinano o si contraddicono. Man mano che l’AI si sposta da interazioni a turno singolo a flussi di lavoro a lungo termine, la memoria è diventata il collo di bottiglia principale.

Backboard affronta questo problema trattando la memoria come infrastruttura di prima classe. Piuttosto che aggiungere la memoria a un livello di applicazione, integra persistenza, incorporamenti, recupero e orchestrazione in una piattaforma unificata accessibile attraverso un’unica API.

Un approccio a livello di sistema piuttosto che di ottimizzazione del benchmark

Backboard non ha progettato la sua architettura per inseguire i punteggi del benchmark. Le valutazioni sono state avviate in modo indipendente o utilizzate internamente per capire come il sistema si confrontava con la ricerca accademica. Le prestazioni risultanti riflettono il comportamento a livello di sistema in condizioni realistiche piuttosto che un’ottimizzazione specifica del compito.

Questa distinzione è importante perché la maggior parte dei benchmark misura il comportamento del modello in isolamento, mentre i sistemi di intelligenza artificiale reali sono composti da molte parti in movimento. I risultati di Backboard suggeriscono che le prestazioni della memoria non sono solo una funzione della dimensione del modello o del calcolo brutale, ma di come la memoria è strutturata, aggiornata e condivisa nel tempo.

La piattaforma combina memoria a lungo termine persistente, incorporamenti nativi e vettorizzazione, generazione aumentata dal recupero, memoria condivisa tra agenti e accesso a oltre 17.000 grandi modelli linguistici, compreso il supporto per portare la propria chiave. Unificando questi elementi, Backboard rimuove la necessità per le aziende di cucire insieme componenti open-source che spesso falliscono sotto vincoli di produzione.

Rendere l’AI agente pratica

L’interesse per l’AI agente continua a crescere, ma la maggior parte delle implementazioni lotta per andare oltre le demo. Il motivo è semplice. Gli agenti senza memoria condivisa e persistente non possono coordinare efficacemente. Si frammentano, perdono il contesto e si comportano in modo imprevedibile man mano che le interazioni si estendono nel tempo.

Backboard consente la memoria condivisa e persistente tra agenti anche quando questi agenti si basano su modelli sottostanti diversi. Quando la memoria è affidabile, il comportamento agente emerge naturalmente piuttosto che essere scriptato. I sistemi possono ricordare decisioni precedenti, mantenere la continuità tra sessioni e coordinare azioni senza riprompt costanti.

La struttura di memoria sottostante della piattaforma è progettata per preservare la coerenza temporale piuttosto che ricostruire lo stato attraverso grafici statici o recupero ripetuto. Ciò consente ai sistemi di intelligenza artificiale di rimanere coerenti e verificabili man mano che crescono di complessità.

Costruito per sistemi che non possono permettersi di dimenticare

L’architettura di Backboard è radicata nell’esperienza del suo fondatore e CEO, Rob Imbeault, che in precedenza ha aiutato a costruire Assent da una startup in fase iniziale a una piattaforma aziendale globale valutata oltre 1,4 miliardi di dollari. In Assent, i sistemi su cui Imbeault ha lavorato erano profondamente integrati nelle operazioni dei clienti, supportando la conformità normativa e complessi flussi di lavoro della catena di approvvigionamento dove coerenza, correttezza e fiducia erano innegoziali.

Quell’esperienza ha plasmato una convinzione chiara. L’infrastruttura più preziosa è raramente appariscente. È l’infrastruttura che funziona silenziosamente, coerentemente e nel lungo periodo. In quegli ambienti, i sistemi non possono azzerarsi quando il contesto è perso. Se lo stato scompare o la fiducia si erode, il sistema fallisce operativamente, non solo tecnicamente.

Imbeault ha visto un divario strutturale emergere nell’AI moderna. Mentre i grandi modelli linguistici avanzavano rapidamente, rimanevano fondamentalmente senza stato. Il contesto svaniva tra le sessioni, costringendo gli sviluppatori a ricostruire la memoria attraverso catene di prompt fragili e strati di recupero ad hoc. Questi approcci potrebbero funzionare nelle demo, ma si rompono quando i sistemi di intelligenza artificiale sono attesi per eseguire in modo continuo, coordinare tra agenti ed evolversi nel tempo.

Backboard è stato costruito per colmare quella lacuna. La memoria è trattata come infrastruttura duratura piuttosto che logica di applicazione, consentendo ai sistemi di intelligenza artificiale di mantenere lo stato tra interazioni, modelli e agenti. L’attenzione alla persistenza, correttezza e affidabilità a lungo termine riflette una convinzione formata molto prima che Backboard esistesse: negli ambienti di produzione, i fallimenti della memoria non sono difetti minori. Sono rischi sistemici.

Questa prospettiva sottostà alla filosofia di progettazione di Backboard. L’obiettivo non è dimostrare intelligenza in momenti isolati, ma abilitare sistemi di intelligenza artificiale che si comportino come software affidabile, anche man mano che la complessità cresce ed i orizzonti temporali si estendono.

Cosa significa questo per il futuro dell’AI

L’implicazione più ampia dei risultati di Backboard è che la prossima fase del progresso dell’AI non sarà guidata solo da modelli più grandi o finestre di contesto più lunghe. Sarà guidata da sistemi che possono ricordare, ragionare ed evolversi nel tempo.

Man mano che le aziende distribuiscono l’AI attraverso il supporto clienti, operazioni, ricerca e conformità, la memoria persistente diventa la base per la fiducia e la scalabilità. Le piattaforme che risolvono la memoria a livello di infrastruttura definiranno come l’AI agente si sposta dall’esperimento all’uso quotidiano.

Con la sua architettura di memoria ora convalidata su entrambi i benchmark accademici e indipendenti, Backboard sta rivolgendo la sua attenzione ad aiutare i team a comprendere e valutare meglio il comportamento dei sistemi di intelligenza artificiale sotto vincoli reali. La prossima funzionalità Switchboard della società mira a rendere le configurazioni di intelligenza artificiale complesse più trasparenti e prevedibili.

Il futuro dell’AI sarà plasmato meno da trucchi di prompt intelligenti e più da sistemi che possono essere affidabili nel tempo. La memoria è la base di questo spostamento, e gli ultimi risultati di Backboard suggeriscono che questa base sta finalmente prendendo forma.

Antoine è un leader visionario e socio fondatore di Unite.AI, guidato da una passione incrollabile per plasmare e promuovere il futuro dell'AI e della robotica. Un imprenditore seriale, crede che l'AI sarà altrettanto disruptiva per la società quanto l'elettricità, e spesso viene colto a parlare con entusiasmo del potenziale delle tecnologie disruptive e dell'AGI.
Come futurist, è dedicato a esplorare come queste innovazioni plasmeranno il nostro mondo. Inoltre, è il fondatore di Securities.io, una piattaforma focalizzata sugli investimenti in tecnologie all'avanguardia che stanno ridefinendo il futuro e ridisegnando interi settori.