Connect with us

Backboard sætter ny global standard for AI-hukommelse — Et spring mod sandt agensbaseret AI

Kunstig intelligens

Backboard sætter ny global standard for AI-hukommelse — Et spring mod sandt agensbaseret AI

mm

Backboard har overskredet en vigtig grænse for kunstig intelligens-systemer ved at demonstrere, at hukommelse kan behandles som kerneinfrastruktur i stedet for en skrøbelig tilføjelse. Virksomheden annoncerede, at den nu leder både store AI-hukommelsesbenchmarks, LoCoMo og LongMemEval, og blev dermed det første platform til at gøre det under konsekvente akademiske og uafhængige evalueringsmetoder.

I en uafhængig vurdering gennemført af NewMathData, opnåede Backboard 93,4 procents nøjagtighed på LongMemEval, den højeste offentligt rapporterede score til dato, når den køres i overensstemmelse med benchmarkets oprindelige specifikation. Dette resultat bygger på dens tidligere offentliggjorte 90,1 procents score på LoCoMo, hvilket placerer Backboard blandt en meget lille gruppe systemer, der kan opretholde både kort-horizontalt præcision og lang-horizontalt kontekstuel kontinuitet.

Bemærkelsesværdigt var, at anmelderne identificerede flere tilfælde, hvor Backboards svar blev markeret som forkert, selvom de var mere kontekstuel nøjagtige end benchmarkets forventede svar. I disse tilfælde integrerede systemet faktuelle oplysninger, der allerede var til stede i interaktionen, i stedet for at holde fast ved en snævrere fortolkning af prompten. Som resultat heraf repræsenterer den rapporterede score en konservativ baseline snarere end en øvre grænse for ydeevne.

Hvorfor hukommelse er blevet den begrænsende faktor i AI

De fleste moderne AI-systemer opfører sig stadig, som om de ikke har nogen reel fortid. Mens store sprogmodeller er fremragende til at generere flydende svar, har de tendens til at glemme kontekst, når en session sluttes eller et prompt-vindue fyldes. Denne begrænsning tvinger udviklere til at genopbygge tilstand gentagne gange gennem hentningshacks, prompt-teknik eller skrøbelige værktøjskæder, der ofte bryder, når systemerne bliver mere komplekse.

Hukommelse handler ikke kun om genkald. I praktiske installationer bestemmer hukommelse, om et AI-system kan forblive koherent over tid, koordinere på tværs af opgaver og opbygge tillid hos brugerne. Uden varig hukommelse nulstiller systemer, hallucinerer eller modsiger sig selv. Da AI bevæger sig fra enkelt-vending-interaktioner til langvarige arbejdsgange, er hukommelse blevet den primære flaskehals.

Backboard tilgår dette problem ved at behandle hukommelse som førsteklasses-infrastructure. I stedet for at montere hukommelse på et applikationslag integrerer det persistence, indlejring, henting og orkestrering i en samlet platform, der kan tilgås gennem en enkelt API.

En systemniveau-tilgang snarere end benchmark-justering

Backboard designede ikke sin arkitektur til at jagte benchmark-scores. Evalueringerne blev enten initieret uafhængigt eller brugt internt til at forstå, hvordan systemet sammenlignedes med akademisk forskning. Den resulterende ydeevne reflekterer systemniveau-opførsel under realistiske betingelser snarere end opgave-specifik optimering.

Denne forskel er vigtig, fordi de fleste benchmarks måler model-opførsel i isolation, mens virkelige AI-systemer består af mange bevægelige dele. Backboards resultater antyder, at hukommelses-ydeevne ikke udelukkende er en funktion af model-størrelse eller brutto-regnekapacitet, men af, hvordan hukommelse er struktureret, opdateret og delt over tid.

Platformen kombinerer varig langtids-hukommelse, nativ indlejring og vektorisering, indbygget hentnings-forstærket generering, delt hukommelse på tværs af agenter og adgang til mere end 17.000 store sprogmodeller, herunder bring-your-own-key-understøttelse. Ved at samle disse elementer fjerner Backboard behovet for virksomheder at sy sammen åbne kilde-komponenter, der ofte fejler under produktionsbegrænsninger.

At gøre agensbaseret AI praktisk

Interessen for agensbaseret AI fortsætter med at vokse, men de fleste implementeringer kæmper med at bevæge sig ud over demoer. Årsagen er simpel. Agenter uden delt, varig hukommelse kan ikke koordinere effektivt. De fragmenteres, mister kontekst og opfører sig upredicabelt, når interaktioner udstrækkes over tid.

Backboard aktiverer varig, delt hukommelse på tværs af agenter, selv når disse agenter afhænger af forskellige underliggende modeller. Når hukommelse er pålidelig, opstår agensbaseret adfærd naturligt snarere end at være skriptet. Systemer kan huske tidligere beslutninger, opretholde kontinuitet på tværs af sessioner og koordinere handlinger uden konstant gen-promptning.

Platformens underliggende hukommelses-rammeværk er designet til at bevare temporal koherens snarere end at genskabe tilstand gennem statiske grafer eller gentagen henting. Dette tillader AI-systemer at forblive konsekvente og revisionssikre, når de vokser i kompleksitet.

Bygget til systemer, der ikke kan tillade sig at glemme

Backboards arkitektur er rod i erfaringen fra dets grundlægger og administrerende direktør, Rob Imbeault, der tidligere hjalp med at bygge Assent fra en tidlig start-up til en global virksomhedsplatform vurderet til mere end 1,4 milliarder dollars. Hos Assent arbejdede de systemer, Imbeault arbejdede med, dybt indlejret i kundernes operationer, der understøttede lovmæssig overholdelse og komplekse leverandør-kæde-arbejdsgange, hvor kontinuitet, korrekthed og tillid var uafviselige.

Denne erfaring formede en klar overbevisning. Den mest værdifulde infrastructure er sjældent flashy. Det er den infrastructure, der fungerer stille, konsekvent og over lange perioder. I disse miljøer får systemer ikke lov til at nulstille, når kontekst går tabt. Hvis tilstand forsvinder eller tillid undergraves, fejler systemet operationelt, ikke kun teknisk.

Imbeault så en strukturel mislighed opstå i moderne AI. Mens store sprogmodeller fremskred hurtigt, forblev de grundlæggende statiske. Kontekst forsvandt mellem sessioner, og tvang udviklere til at genskabe hukommelse gennem skrøbelige prompt-kæder og ad hoc-hentningslag. Disse tilgange kan fungere i demoer, men de bryder sammen, når AI-systemer forventes at køre kontinuerligt, koordinere på tværs af agenter og udvikle sig over tid.

Backboard blev bygget til at lukke denne lukke. Hukommelse behandles som varig infrastructure snarere end applikationslogik, hvilket tillader AI-systemer at fastholde tilstand på tværs af interaktioner, modeller og agenter. Fokus på persistence, korrekthed og langtids-reliabilitet reflekterer en overbevisning, der blev dannet lang tid før Backboard eksisterede: I produktionsmiljøer er hukommelsesfejl ikke mindre fejl. De er systemiske risici.

Denne perspektiv danner grundlag for Backboards designfilosofi. Målet er ikke at demonstrere intelligens i isolerede øjeblikke, men at aktivere AI-systemer, der opfører sig som pålidelig software, selv når kompleksitet vokser og tids-horisonter udvides.

Hvad dette betyder for AI’s fremtid

Den bredere implikation af Backboards resultater er, at den næste fase af AI-fremgang ikke udelukkende vil blive drevet af større modeller eller længere kontekst-vinduer. Det vil blive drevet af systemer, der kan huske, resonere og udvikle sig over tid.

Da virksomheder implementerer AI på tværs af kundesupport, operationer, forskning og overholdelse, bliver varig hukommelse grundlaget for tillid og skalerbarhed. Platforme, der løser hukommelse på infrastrukturniveau, vil definere, hvordan agensbaseret AI bevæger sig fra eksperimenter til hverdagsbrug.

Med sin hukommelses-arkitektur nu valideret på tværs af både akademiske og uafhængige benchmarks, retter Backboard sin opmærksomhed mod at hjælpe hold med bedre at forstå og evaluere AI-system-adfærd under realverdens-begrænsninger. Virksomhedens kommende Switchboard-funktion sigter mod at gøre komplekse AI-konfigurationer mere gennemsigtige og forudsigelige.

Fremtiden for AI vil blive formet mindre af clever prompt-tricks og mere af systemer, der kan tillides over tid. Hukommelse er grundlaget for denne ændring, og Backboards seneste resultater antyder, at dette grundlag endelig tager form.

Antoine er en visionær leder og medstifter af Unite.AI, drevet af en urokkelig passion for at forme og fremme fremtiden for AI og robotteknologi. En serieiværksætter, han tror, at AI vil være lige så omvæltende for samfundet som elektricitet, og bliver ofte fanget i at tale begejstret om potentialet for omvæltende teknologier og AGI.

Som en futurist, er han dedikeret til at udforske, hvordan disse innovationer vil forme vores verden. Derudover er han grundlægger af Securities.io, en platform, der fokuserer på at investere i skærende teknologier, der gendefinerer fremtiden og omformer hele sektorer.