Connect with us

Backboard Sets New Global Standard in AI Memory — A Leap Toward Truly Agentic AI

Искусственный интеллект

Backboard Sets New Global Standard in AI Memory — A Leap Toward Truly Agentic AI

mm

Backboard пересекла важный порог для систем искусственного интеллекта, продемонстрировав, что память может быть рассмотрена как основная инфраструктура, а не как хрупкое дополнение. Компания объявила, что теперь она лидирует в обоих основных тестах на память ИИ, LoCoMo и LongMemEval, став первой платформой, которая сделала это под постоянными академическими и независимыми методами оценки.

В независимой оценке, проведенной NewMathData, Backboard достигла 93,4 процента точности на LongMemEval, самого высокого публично заявленного результата на данный момент при выполнении в соответствии с исходной спецификацией теста. Этот результат основан на ее предыдущем опубликованном результате 90,1 процента на LoCoMo, что ставит Backboard в число очень небольшой группы систем, способных поддерживать как точность на коротком горизонте, так и контекстную непрерывность на длинном горизонте.

Заметно, что рецензенты выявили несколько случаев, когда ответы Backboard были отмечены как неправильные, несмотря на то, что они были более контекстно точными, чем ожидаемые ответы теста. В этих случаях система включила фактическую информацию, уже присутствующую в взаимодействии, а не придерживалась более узкого толкования подсказки. В результате заявленный результат представляет собой консервативную базовую линию, а не верхний предел производительности.

Почему память стала ограничивающим фактором в ИИ

Большинство современных систем ИИ все еще ведут себя так, как если бы у них не было реального прошлого. Хотя крупные языковые модели отлично справляются с генерацией связных ответов, они склонны забывать контекст после окончания сессии или заполнения окна подсказки. Это ограничение заставляет разработчиков повторно восстанавливать состояние через хитрости извлечения, инжиниринг подсказок или хрупкие цепочки инструментов, которые часто ломаются, когда системы становятся более сложными.

Память не только о воспоминании. В практических развертываниях память определяет, может ли система ИИ оставаться связной во времени, координировать задачи и строить доверие с пользователями. Без прочной памяти системы сбрасываются, заллучают, или противоречат себе. Когда ИИ переходит от однократных взаимодействий к долгосрочным рабочим процессам, память становится основным узким местом.

Backboard подходит к этой проблеме, рассматривая память как первоклассную инфраструктуру. Вместо того, чтобы прикреплять память к слою приложения, она интегрирует постоянство, вложения, извлечение и оркестровку в единую платформу, доступную через единственный API.

Системный подход, а не настройка тестов

Backboard не проектировала свою архитектуру для преследования результатов тестов. Оценки либо были инициированы независимо, либо использовались внутри для понимания того, как система сравнивается с академическими исследованиями. Результативная производительность отражает системное поведение в реалистичных условиях, а не оптимизацию для конкретных задач.

Этот различие имеет значение, поскольку большинство тестов измеряют поведение модели в изоляции, тогда как реальные системы ИИ состоят из многих движущихся частей. Результаты Backboard предполагают, что производительность памяти не является только функцией размера модели или вычислительной силы, а также того, как память структурируется, обновляется и делится во времени.

Платформа объединяет постоянную долгосрочную память, родные вложения и векторизацию, встроенное генерирование с помощью извлечения, общую память между агентами и доступ к более чем 17 000 крупным языковым моделям, включая поддержку привлечения собственных ключей. Объединив эти элементы, Backboard удаляет необходимость для предприятий шить вместе открытые компоненты, которые часто терпят неудачу под производственными ограничениями.

Сделать агентный ИИ практичным

Интерес к агентному ИИ продолжает расти, но большинство реализаций борются за то, чтобы выйти за рамки демонстраций. Причина проста. Агенты без общей, постоянной памяти не могут эффективно координировать. Они фрагментируются, теряют контекст и ведут себя непредсказуемо, когда взаимодействия распространяются во времени.

Backboard позволяет постоянную, общую память между агентами, даже когда эти агенты полагаются на разные основные модели. Когда память надежна, агентное поведение возникает естественно, а не является сценарным. Системы могут помнить предыдущие решения, поддерживать непрерывность между сессиями и координировать действия без постоянного повторного запроса.

Базовая структура памяти платформы предназначена для сохранения временной связности, а не для восстановления состояния через статические графы или повторное извлечение. Это позволяет системам ИИ оставаться последовательными и аудиторными, когда они растут в сложности.

Построено для систем, которые не могут позволить себе забыть

Архитектура Backboard основана на опыте ее основателя и генерального директора, Rob Imbeault,, который ранее помог построить Assent из ранней стадии стартапа в глобальную корпоративную платформу, оцененную более чем в 1,4 миллиарда долларов. В Assent системы, над которыми работал Imbeault, были встроены глубоко в операции клиентов, поддерживая соблюдение нормативных требований и сложные цепочки поставок, где непрерывность, правильность и доверие были незаменимыми.

Этот опыт сформировал четкое убеждение. Самая ценная инфраструктура редко является привлекательной. Это инфраструктура, которая работает тихо, последовательно и в течение длительного времени. В таких средах системы не могут сбрасывать контекст, когда он теряется. Если состояние исчезает или доверие разрушается, система терпит неудачу операционно, а не только технически.

Imbeault увидел структурное несоответствие, возникающее в современном ИИ. Хотя крупные языковые модели быстро продвигались вперед, они оставались фундаментально безсостоятельными. Контекст исчезал между сессиями, заставляя разработчиков восстанавливать память через хрупкие цепочки подсказок и ад-хок слои извлечения. Эти подходы могут работать в демонстрациях, но они ломаются, когда системы ИИ должны работать непрерывно, координировать между агентами и эволюционировать во времени.

Backboard была построена для закрытия этого разрыва. Память рассматривается как прочная инфраструктура, а не как логика приложения, что позволяет системам ИИ сохранять состояние между взаимодействиями, моделями и агентами. Сосредоточение на постоянстве, правильности и долгосрочной надежности отражает убеждение, сформированное задолго до существования Backboard: в производственных средах неудачи памяти не являются незначительными дефектами. Они являются системными рисками.

Это убеждение лежит в основе философии дизайна Backboard. Цель не состоит в том, чтобы демонстрировать интеллект в изолированных моментах, а в том, чтобы позволить системам ИИ вести себя как надежное программное обеспечение, даже когда сложность растет и горизонты времени расширяются.

Что это значит для будущего ИИ

Более широкое значение результатов Backboard заключается в том, что следующая фаза прогресса ИИ не будет обусловлена исключительно более крупными моделями или более длинными контекстными окнами. Она будет обусловлена системами, которые могут помнить, рассуждать и эволюционировать во времени.

Когда предприятия развертывают ИИ в поддержку клиентов, операций, исследований и соблюдения нормативных требований, постоянная память становится основой для доверия и масштабируемости. Платформы, которые решают проблему памяти на уровне инфраструктуры, определят, как агентный ИИ переходит от экспериментов к повседневному использованию.

С теперь уже подтвержденной архитектурой памяти на обоих академических и независимых тестах, Backboard обращает внимание на то, чтобы помочь командам лучше понять и оценить поведение систем ИИ под реальными ограничениями. Предстоящая возможность Switchboard компании направлена на то, чтобы сделать сложные конфигурации ИИ более прозрачными и предсказуемыми.

Будущее ИИ будет формироваться не умными трюками с подсказками, а системами, которым можно доверять во времени. Память является основой этого сдвига, и последние результаты Backboard предполагают, что эта основа наконец начинает принимать форму.

Антуан - видный лидер и сооснователь Unite.AI, движимый непоколебимой страстью к формированию и продвижению будущего ИИ и робототехники. Как серийный предприниматель, он считает, что ИИ будет столь же разрушительным для общества, как электричество, и часто увлекается потенциалом разрушительных технологий и ИИ.

Как футуролог, он посвящен изучению того, как эти инновации изменят наш мир. Кроме того, он является основателем Securities.io, платформы, ориентированной на инвестиции в передовые технологии, которые переопределяют будущее и меняют целые сектора.

Раскрытие информации о рекламе: Unite.AI придерживается строгих редакционных стандартов, чтобы предоставлять читателям точную информацию и новости. Мы можем получать вознаграждение, если вы переходите по ссылкам на продукты, которые мы рассмотрели.