Seguici sui social

Backboard stabilisce un nuovo standard globale nella memoria AI: un passo avanti verso un'intelligenza artificiale veramente agentiva

Intelligenza Artificiale

Backboard stabilisce un nuovo standard globale nella memoria AI: un passo avanti verso un'intelligenza artificiale veramente agentiva

mm

piano di sostegno ha superato un'importante soglia per i sistemi di intelligenza artificiale, dimostrando che la memoria può essere considerata un'infrastruttura di base piuttosto che un fragile componente aggiuntivo. L'azienda ha annunciato di essere ora leader in entrambi i principali benchmark di memoria per l'intelligenza artificiale, LoCoMo e LongMemEval, diventando la prima piattaforma a raggiungere questo risultato con metodi di valutazione accademici e indipendenti coerenti.

In una valutazione indipendente condotta da NewMathData, Backboard ha raggiunto una precisione del 93.4 percento su LongMemEval, il punteggio più alto riportato pubblicamente fino ad oggi se eseguito secondo le specifiche originali del benchmark. Questo risultato si basa sul suo precedente ha pubblicato un punteggio del 90.1% su LoCoMo, collocando Backboard tra un gruppo molto ristretto di sistemi in grado di mantenere sia la precisione a breve termine sia la continuità contestuale a lungo termine.

In particolare, i revisori hanno identificato diversi casi in cui le risposte di Backboard sono state contrassegnate come errate, pur essendo contestualmente più accurate delle risposte attese dal benchmark. In questi casi, il sistema ha incorporato informazioni fattuali già presenti nell'interazione, anziché attenersi a un'interpretazione più restrittiva del prompt. Di conseguenza, il punteggio riportato rappresenta una base di riferimento conservativa, anziché il limite superiore della prestazione.

Perché la memoria è diventata il fattore limitante dell'intelligenza artificiale

La maggior parte dei moderni sistemi di intelligenza artificiale si comporta ancora come se non avesse un vero passato. Sebbene i modelli linguistici di grandi dimensioni siano eccellenti nel generare risposte fluide, tendono a dimenticare il contesto una volta terminata una sessione o completata una finestra di prompt. Questa limitazione costringe gli sviluppatori a ricostruire ripetutamente lo stato tramite hack di recupero, progettazione di prompt o fragili catene di strumenti che spesso si interrompono con l'aumentare della complessità dei sistemi.

La memoria non riguarda solo il ricordo. Nelle implementazioni pratiche, la memoria determina se un sistema di intelligenza artificiale può rimanere coerente nel tempo, coordinarsi tra le attività e creare fiducia con gli utenti. Senza una memoria durevole, i sistemi si ripristinano, allucinazioni, o contraddirsi. Con l'evoluzione dell'intelligenza artificiale dalle interazioni a singolo turno ai flussi di lavoro di lunga durata, la memoria è diventata il principale collo di bottiglia.

Backboard affronta questo problema trattando la memoria come un'infrastruttura di prima classe. Anziché vincolarla a un livello applicativo, integra persistenza, incorporamenti, recupero e orchestrazione in una piattaforma unificata accessibile tramite un'unica API.

Un approccio a livello di sistema piuttosto che una messa a punto del benchmark

Backboard non ha progettato la sua architettura per inseguire punteggi di riferimento. Le valutazioni sono state avviate in modo indipendente o utilizzate internamente per comprendere come il sistema si confrontasse con la ricerca accademica. Le prestazioni risultanti riflettono il comportamento a livello di sistema in condizioni realistiche, piuttosto che l'ottimizzazione specifica di un'attività.

Questa distinzione è importante perché la maggior parte dei benchmark misura il comportamento del modello in modo isolato, mentre i sistemi di intelligenza artificiale del mondo reale sono composti da molte parti mobili. I risultati di Backboard suggeriscono che le prestazioni della memoria non dipendono esclusivamente dalle dimensioni del modello o dal calcolo a forza bruta, ma da come la memoria viene strutturata, aggiornata e condivisa nel tempo.

La piattaforma combina memoria persistente a lungo termine, incorporamenti nativi e vettorizzazione, generazione integrata con recupero aumentato, memoria condivisa tra agenti e accesso a oltre 17,000 modelli linguistici di grandi dimensioni, incluso il supporto Bring-Your-Own-Key. Unificando questi elementi, Backboard elimina la necessità per le aziende di assemblare componenti open source che spesso falliscono a causa dei vincoli di produzione.

Rendere pratica l'intelligenza artificiale agentiva

L'interesse per IA agentica continua a crescere, ma la maggior parte delle implementazioni fatica ad andare oltre le demo. Il motivo è semplice. Gli agenti senza memoria condivisa e persistente non possono coordinarsi efficacemente. Si frammentano, perdono contesto e si comportano in modo imprevedibile man mano che le interazioni si estendono nel tempo.

Backboard consente una memoria persistente e condivisa tra gli agenti, anche quando questi si basano su modelli sottostanti diversi. Quando la memoria è affidabile, il comportamento degli agenti emerge in modo naturale anziché essere programmato. I sistemi possono ricordare decisioni precedenti, mantenere la continuità tra le sessioni e coordinare le azioni senza doverle ripetere continuamente.

Il framework di memoria sottostante alla piattaforma è progettato per preservare la coerenza temporale anziché ricostruire lo stato attraverso grafici statici o recuperi ripetuti. Ciò consente ai sistemi di intelligenza artificiale di rimanere coerenti e verificabili man mano che la loro complessità aumenta.

Progettato per sistemi che non possono permettersi di dimenticare

L'architettura di Backboard affonda le sue radici nell'esperienza del suo fondatore e CEO, Rob Imbeault, che in precedenza ha contribuito a costruire Assenso Da una startup in fase iniziale a una piattaforma aziendale globale valutata oltre 1.4 miliardi di dollari. In Assent, i sistemi su cui Imbeault ha lavorato erano profondamente integrati nelle operazioni dei clienti, supportando la conformità normativa e i complessi flussi di lavoro della supply chain in cui continuità, correttezza e fiducia erano imprescindibili.

Quell'esperienza ha plasmato una convinzione chiara. L'infrastruttura più preziosa raramente è appariscente. È l'infrastruttura che funziona in modo silenzioso, costante e per lunghi periodi di tempo. In questi ambienti, i sistemi non riescono a ripristinarsi quando si perde il contesto. Se lo stato scompare o la fiducia si indebolisce, il sistema fallisce operativamente, non solo tecnicamente.

Imbeault notò l'emergere di una discrepanza strutturale nell'intelligenza artificiale moderna. Sebbene i modelli linguistici di grandi dimensioni progredissero rapidamente, rimanevano fondamentalmente privi di stato. Il contesto svaniva tra una sessione e l'altra, costringendo gli sviluppatori a ricostruire la memoria attraverso catene di prompt fragili e livelli di recupero ad hoc. Questi approcci potrebbero funzionare nelle demo, ma falliscono quando si prevede che i sistemi di intelligenza artificiale funzionino in modo continuo, si coordinino tra gli agenti e si evolvano nel tempo.

Backboard è stato creato per colmare questa lacuna. La memoria è trattata come un'infrastruttura durevole piuttosto che come logica applicativa, consentendo ai sistemi di intelligenza artificiale di mantenere lo stato in interazioni, modelli e agenti. L'attenzione alla persistenza, alla correttezza e all'affidabilità a lungo termine riflette una convinzione consolidata ben prima dell'esistenza di Backboard: negli ambienti di produzione, i guasti di memoria non sono difetti minori. Sono rischi sistemici.

Questa prospettiva è alla base della filosofia progettuale di Backboard. L'obiettivo non è quello di mettere in mostra l'intelligenza in momenti isolati, ma di abilitare sistemi di intelligenza artificiale che si comportino come software affidabili, anche quando la complessità aumenta e gli orizzonti temporali si estendono.

Cosa significa questo per il futuro dell'intelligenza artificiale

L'implicazione più ampia di Tabellone Il risultato è che la prossima fase del progresso dell'intelligenza artificiale non sarà guidata esclusivamente da modelli più grandi o finestre contestuali più ampie. Sarà guidata da sistemi in grado di ricordare, ragionare ed evolversi nel tempo.

Man mano che le aziende implementano l'intelligenza artificiale nell'assistenza clienti, nelle operazioni, nella ricerca e nella conformità, la memoria persistente diventa la base per l'affidabilità e la scalabilità. Le piattaforme che risolvono la memoria a livello di infrastruttura definiranno il modo in cui l'intelligenza artificiale agentica passerà dalla sperimentazione all'uso quotidiano.

Con la sua architettura di memoria ora convalidata da benchmark accademici e indipendenti, Backboard si sta concentrando sull'aiutare i team a comprendere e valutare meglio il comportamento dei sistemi di intelligenza artificiale in condizioni reali. La futura funzionalità Switchboard dell'azienda mira a rendere le configurazioni di intelligenza artificiale complesse più trasparenti e prevedibili.

Il futuro dell'intelligenza artificiale sarà plasmato meno da trucchi intelligenti e più da sistemi affidabili nel tempo. La memoria è il fondamento di questo cambiamento e gli ultimi risultati di Backboard suggeriscono che questa base sta finalmente prendendo forma.

Antoine è un leader visionario e socio fondatore di Unite.AI, spinto da una passione incrollabile per la definizione e la promozione del futuro dell'intelligenza artificiale e della robotica. Imprenditore seriale, ritiene che l'intelligenza artificiale sarà dirompente per la società quanto l'elettricità, e spesso viene colto a delirare sul potenziale delle tecnologie dirompenti e dell'AGI.

Come futurista, si dedica a esplorare come queste innovazioni plasmeranno il nostro mondo. Inoltre, è il fondatore di Titoli.io, una piattaforma focalizzata sugli investimenti in tecnologie all'avanguardia che stanno ridefinendo il futuro e rimodellando interi settori.