Connect with us

Backboard Ustanawia Nowy Światowy Standard Pamięci AI — Skok Ku Prawdziwej AI Agentynej

Sztuczna inteligencja

Backboard Ustanawia Nowy Światowy Standard Pamięci AI — Skok Ku Prawdziwej AI Agentynej

mm

Backboard przekroczył ważną granicę dla systemów sztucznej inteligencji, demonstrując, że pamięć może być traktowana jako podstawowa infrastruktura, a nie delikatny dodatek. Firma ogłosiła, że obecnie prowadzi oba główne benchmarki pamięci AI, LoCoMo i LongMemEval, stając się pierwszą platformą, która to osiągnęła podczas spójnych i niezależnych metod oceny akademickiej.

W niezależnej ocenie przeprowadzonej przez NewMathData, Backboard osiągnął 93,4 procentową dokładność w LongMemEval, najwyższy publicznie zgłoszony wynik do tej pory, przy wykonaniu zgodnie z oryginalną specyfikacją benchmarku. Ten wynik opiera się na wcześniej opublikowanym wyniku 90,1 procent w LoCoMo, umieszczając Backboard w bardzo wąskiej grupie systemów, które mogą utrzymywać zarówno precyzję krótkoterminową, jak i kontynuację kontekstualną długoterminową.

Godne uwagi jest to, że recenzenci zidentyfikowali wiele przypadków, w których odpowiedzi Backboard zostały oznaczone jako niepoprawne, pomimo że były one bardziej kontekstowo dokładne niż oczekiwane odpowiedzi benchmarku. W tych przypadkach system uwzględnił już istniejące informacje faktograficzne w interakcji, zamiast przestrzegać węższej interpretacji podpowiedzi. W rezultacie zgłoszony wynik reprezentuje konserwatywną bazę, a nie górny limit wydajności.

Dlaczego pamięć stała się czynnikiem ograniczającym w AI

Większość nowoczesnych systemów AI nadal zachowuje się, jakby nie miały prawdziwej przeszłości. Chociaż duże modele językowe są doskonałe w generowaniu płynnych odpowiedzi, mają tendencję do zapominania kontekstu, gdy sesja kończy się lub okno podpowiedzi wypełnia się. To ograniczenie zmusza deweloperów do odbudowy stanu za pomocą haków odzyskiwania, inżynierii podpowiedzi lub kruchych łańcuchów narzędzi, które często ulegają awariom, gdy systemy stają się bardziej złożone.

Pamięć nie jest tylko sprawą przypomnienia. W praktycznych wdrożeniach pamięć determinuje, czy system AI może pozostać spójny w czasie, koordynować zadania i budować zaufanie z użytkownikami. Bez trwałej pamięci systemy resetują się, halucynują lub sprzeciwiają się sobie. Gdy AI przechodzi od interakcji jednorazowych do długotrwałych przepływów pracy, pamięć stała się głównym czynnikiem ograniczającym.

Backboard podejmuje ten problem, traktując pamięć jako podstawową infrastrukturę. Zamiast montowania pamięci na warstwie aplikacji, integruje trwałość, osadzanie, odzyskiwanie i orchestrację w zjednoczonej platformie dostępnej za pośrednictwem jednego API.

Podejście systemowe, a nie dostosowanie do benchmarku

Backboard nie zaprojektował swojej architektury, aby gonić wyniki benchmarków. Oceny były albo inicjowane niezależnie, albo wykorzystywane wewnętrznie, aby zrozumieć, jak system porównuje się do badań akademickich. Rezultat ten odzwierciedla zachowanie systemu w realistycznych warunkach, a nie optymalizację specyficznej dla zadania.

Ta różnica jest istotna, ponieważ większość benchmarków mierzy zachowanie modelu w izolacji, podczas gdy rzeczywiste systemy AI składają się z wielu ruchomych części. Wyniki Backboard sugerują, że wydajność pamięci nie jest wyłącznie funkcją rozmiaru modelu lub obliczeń siłowych, ale sposobu, w jaki pamięć jest strukturyzowana, aktualizowana i udostępniana w czasie.

Platforma łączy trwałą pamięć długoterminową, rodzime osadzanie i wektorowanie, wbudowane generowanie z odzyskiwaniem, współdzieloną pamięć między agentami oraz dostęp do ponad 17 000 dużych modeli językowych, w tym obsługę przyniesienia-własnego-klucza. Poprzez połączenie tych elementów, Backboard usuwa potrzebę, aby przedsiębiorstwa zszywały składniki open-source, które często zawodzą w produkcji.

Praktyczna AI Agentyjna

Zainteresowanie AI agentyjnym nadal rośnie, ale większość wdrożeń ma trudności z przejściem poza demonstracje. Powodem jest prosta. Agenci bez współdzielonej, trwałej pamięci nie mogą skutecznie koordynować. Fragmentują się, tracą kontekst i zachowują się nieprzewidywalnie, gdy interakcje rozciągają się w czasie.

Backboard umożliwia trwałą, współdzieloną pamięć między agentami, nawet gdy agenci opierają się na różnych podstawowych modelach. Gdy pamięć jest niezawodna, zachowanie agentyjne pojawia się naturalnie, zamiast być skryptowane. Systemy mogą pamiętać poprzednie decyzje, utrzymywać ciągłość między sesjami i koordynować działania bez ciągłego ponownego podpowiadania.

Podstawowa struktura pamięci platformy jest zaprojektowana, aby zachować spójność czasową, zamiast odtwarzać stan za pomocą statycznych grafów lub powtarzalnego odzyskiwania. Pozwala to systemom AI na pozostanie spójnymi i audytowalnymi, gdy rosną w złożoności.

Zbudowane dla systemów, które nie mogą pozwolić sobie na zapomnienie

Architektura Backboard opiera się na doświadczeniu jej założyciela i dyrektora generalnego, Roba Imbeaulta, który wcześniej pomógł zbudować Assent od wczesnego etapu startupu do globalnej platformy przedsiębiorstwa o wartości ponad 1,4 miliarda dolarów. W Assent systemy, nad którymi pracował Imbeault, były głęboko osadzone w operacjach klientów, wspierając zgodność z przepisami i złożone łańcuchy dostaw, gdzie ciągłość, poprawność i zaufanie były niepodważalne.

To doświadczenie ukształtowało wyraźne przekonanie. Najcenniejsza infrastruktura rzadko jest efektowna. Jest to infrastruktura, która działa cicho, konsekwentnie i przez długi czas. W takich środowiskach systemy nie mają prawa resetować, gdy kontekst zostaje utracony. Jeśli stan znika lub zaufanie ulega erozji, system zawodzi operacyjnie, a nie tylko technicznie.

Imbeault dostrzegł pojawiający się strukturalny dysonans w nowoczesnej AI. Chociaż duże modele językowe rozwijały się szybko, pozostały one fundamentalnie pozbawione stanu. Kontekst znikał między sesjami, zmuszając deweloperów do odtwarzania pamięci za pomocą kruchych łańcuchów podpowiedzi i warstw odzyskiwania. Te podejścia mogą działać w demonstracjach, ale zawodzą, gdy systemy AI są oczekiwane, aby działać nieprzerwanie, koordynować między agentami i ewoluować w czasie.

Backboard został zbudowany, aby zamknąć tę lukę. Pamięć jest traktowana jako trwała infrastruktura, a nie logika aplikacji, pozwalając systemom AI na utrzymanie stanu między interakcjami, modelami i agentami. Koncentracja na trwałości, poprawności i długoterminowej niezawodności odzwierciedla przekonanie ukształtowane długo przed powstaniem Backboard: w środowiskach produkcyjnych awarie pamięci nie są mniejszymi defektami, ale ryzykiem systemowym.

To przekonanie leży u podstaw filozofii projektowej Backboard. Celem nie jest pokazywanie inteligencji w izolowanych momentach, ale umożliwienie systemom AI, które zachowują się jak niezawodne oprogramowanie, nawet gdy złożoność rośnie, a horyzonty czasowe się wydłużają.

Co to oznacza dla przyszłości AI

Szersze implikacje wyników Backboard polegają na tym, że następna faza postępu AI nie będzie napędzana wyłącznie przez większe modele lub dłuższe okna kontekstowe. Będzie napędzana przez systemy, które mogą pamiętać, rozumieć i ewoluować w czasie.

Gdy przedsiębiorstwa wdrażają AI w obszarach takich jak wsparcie klienta, operacje, badania i zgodność, trwała pamięć staje się podstawą zaufania i skalowalności. Platformy, które rozwiązują pamięć na poziomie infrastruktury, zdefiniują, jak AI agentyjna przechodzi od eksperymentów do codziennego użycia.

Z architekturą pamięci teraz zweryfikowaną w obu benchmarkach akademickich i niezależnych, Backboard zwraca uwagę na pomoc zespołom w lepszym zrozumieniu i ocenianiu zachowania systemów AI w warunkach rzeczywistych. Nadchodząca funkcja Switchboard ma na celu uczynienie złożonych konfiguracji AI bardziej przejrzystymi i przewidywalnymi.

Przyszłość AI będzie kształtowana mniej przez sprytne sztuczki podpowiedzi, a bardziej przez systemy, które mogą być ufańe w czasie. Pamięć jest podstawą tej zmiany, a najnowsze wyniki Backboard sugerują, że ta podstawa zaczyna się kształtować.

Antoine jest wizjonerskim liderem i współzałożycielem Unite.AI, z niezachwianą pasją do kształtowania i promowania przyszłości sztucznej inteligencji i robotyki. Jako serialowy przedsiębiorca, uważa, że sztuczna inteligencja będzie tak samo przełomowa dla społeczeństwa, jak elektryczność, i często zachwycany jest potencjałem technologie przełomowych i AGI. Jako futurysta, poświęca się badaniu, jak te innowacje ukształtują nasz świat. Ponadto jest założycielem Securities.io, platformy skupiającej się na inwestowaniu w najnowocześniejsze technologie, które przeobrażają przyszłość i zmieniają całe sektory.