Connect with us

Backboard établit une nouvelle norme mondiale en matière de mémoire IA — Un bond en avant vers une véritable IA agente

Intelligence artificielle

Backboard établit une nouvelle norme mondiale en matière de mémoire IA — Un bond en avant vers une véritable IA agente

mm

Backboard a franchi un seuil important pour les systèmes d’intelligence artificielle en démontrant que la mémoire peut être traitée comme une infrastructure de base plutôt que comme un ajout fragile. L’entreprise a annoncé qu’elle mène désormais les deux principaux benchmarks de mémoire IA, LoCoMo et LongMemEval, devenant ainsi la première plate-forme à le faire selon des méthodes d’évaluation académiques et indépendantes cohérentes.

Dans une évaluation indépendante menée par NewMathData, Backboard a obtenu un score de 93,4 % sur LongMemEval, le score le plus élevé jamais rapporté à ce jour lorsqu’il est exécuté conformément à la spécification d’origine du benchmark. Ce résultat s’appuie sur son score précédemment publié de 90,1 % sur LoCoMo, plaçant Backboard parmi un très petit groupe de systèmes capables de maintenir à la fois la précision à court terme et la continuité contextuelle à long terme.

Notamment, les examinateurs ont identifié plusieurs cas où les réponses de Backboard ont été marquées comme incorrectes malgré le fait qu’elles étaient plus précises sur le plan contextuel que les réponses attendues par le benchmark. Dans ces cas, le système a incorporé des informations factuelles déjà présentes dans l’interaction plutôt que de s’en tenir à une interprétation plus étroite de la invite. Par conséquent, le score rapporté représente une ligne de base conservatrice plutôt que la limite supérieure des performances.

Pourquoi la mémoire est devenue le facteur limitant de l’IA

La plupart des systèmes d’IA modernes se comportent encore comme s’ils n’avaient pas de véritable passé. Alors que les grands modèles de langage sont excellents pour générer des réponses fluides, ils ont tendance à oublier le contexte une fois que la session se termine ou que la fenêtre d’invite se remplit. Cette limitation oblige les développeurs à reconstruire l’état à plusieurs reprises à l’aide de hacks de récupération, d’ingénierie d’invite ou de chaînes d’outils fragiles qui se cassent souvent à mesure que les systèmes deviennent plus complexes.

La mémoire ne concerne pas seulement la rappel. Dans les déploiements pratiques, la mémoire détermine si un système d’IA peut rester cohérent dans le temps, coordonner les tâches et établir la confiance avec les utilisateurs. Sans mémoire durable, les systèmes se réinitialisent, hallucinent ou se contredisent. Alors que l’IA passe des interactions à court terme aux flux de travail à long terme, la mémoire est devenue le goulet d’étranglement principal.

Backboard aborde ce problème en traitant la mémoire comme une infrastructure de premier plan. Plutôt que de greffer la mémoire sur une couche d’application, elle intègre la persistance, les embeddings, la récupération et l’orchestration dans une plate-forme unifiée accessible via une seule API.

Une approche au niveau du système plutôt que de l’ajustement du benchmark

Backboard n’a pas conçu son architecture pour poursuivre les scores de benchmark. Les évaluations ont été soit initiées de manière indépendante, soit utilisées internement pour comprendre comment le système se comparait à la recherche académique. Les performances qui en résultent reflètent le comportement au niveau du système dans des conditions réalistes plutôt que l’optimisation spécifique à la tâche.

Cette distinction est importante car la plupart des benchmarks mesurent le comportement du modèle en isolation, tandis que les systèmes d’IA réels sont composés de nombreuses parties mobiles. Les résultats de Backboard suggèrent que les performances de la mémoire ne sont pas uniquement une fonction de la taille du modèle ou du calcul brut, mais de la façon dont la mémoire est structurée, mise à jour et partagée dans le temps.

La plate-forme combine une mémoire à long terme persistante, des embeddings et une vectorisation natives, une génération augmentée de récupération intégrée, une mémoire partagée entre les agents et un accès à plus de 17 000 grands modèles de langage, y compris la prise en charge de l’apport de votre propre clé. En unifiant ces éléments, Backboard élimine la nécessité pour les entreprises de coudre ensemble des composants open source qui échouent souvent sous les contraintes de production.

Rendre l’IA agente pratique

L’intérêt pour l’IA agente continue de croître, mais la plupart des mises en œuvre peinent à aller au-delà des démos. La raison est simple. Les agents sans mémoire partagée et persistante ne peuvent pas coordonner efficacement. Ils se fragmentent, perdent le contexte et se comportent de manière imprévisible à mesure que les interactions s’étendent dans le temps.

Backboard permet une mémoire partagée et persistante entre les agents, même lorsque ces agents s’appuient sur des modèles sous-jacents différents. Lorsque la mémoire est fiable, le comportement agente émerge naturellement plutôt que d’être scripté. Les systèmes peuvent se souvenir des décisions antérieures, maintenir la continuité entre les sessions et coordonner les actions sans réinviter constamment.

Le cadre de mémoire sous-jacent de la plate-forme est conçu pour préserver la cohérence temporelle plutôt que de reconstruire l’état via des graphiques statiques ou une récupération répétée. Cela permet aux systèmes d’IA de rester cohérents et auditable à mesure qu’ils grandissent en complexité.

Construit pour les systèmes qui ne peuvent pas se permettre d’oublier

L’architecture de Backboard est enracinée dans l’expérience de son fondateur et PDG, Rob Imbeault, qui a précédemment aidé à construire Assent à partir d’une startup en phase précoce en une plate-forme d’entreprise mondiale valorisée à plus de 1,4 milliard de dollars. Chez Assent, les systèmes sur lesquels Imbeault a travaillé étaient profondément intégrés dans les opérations des clients, en soutenant la conformité réglementaire et les flux de travail de chaîne d’approvisionnement complexes où la continuité, l’exactitude et la confiance étaient incontournables.

Cela a forgé une conviction claire. L’infrastructure la plus précieuse est rarement tape-à-l’œil. Il s’agit de l’infrastructure qui fonctionne discrètement, de manière cohérente et sur de longues périodes. Dans ces environnements, les systèmes ne peuvent pas se réinitialiser lorsque le contexte est perdu. Si l’état disparaît ou si la confiance s’érode, le système échoue opérationnellement, et non seulement techniquement.

Imbeault a vu une discordance structurelle émerger dans l’IA moderne. Alors que les grands modèles de langage progressaient rapidement, ils sont restés fondamentalement sans état. Le contexte disparaissait entre les sessions, forçant les développeurs à reconstruire la mémoire à l’aide de chaînes d’invites fragiles et de couches de récupération ad hoc. Ces approches pourraient fonctionner dans les démos, mais elles se cassent lorsqu’on attend des systèmes d’IA qu’ils fonctionnent en continu, qu’ils coordonnent entre les agents et qu’ils évoluent dans le temps.

Backboard a été construit pour combler cette lacune. La mémoire est traitée comme une infrastructure durable plutôt que comme une logique d’application, permettant aux systèmes d’IA de conserver l’état entre les interactions, les modèles et les agents. L’accent mis sur la persistance, l’exactitude et la fiabilité à long terme reflète une conviction formée longtemps avant que Backboard n’existe : dans les environnements de production, les défaillances de mémoire ne sont pas des défauts mineurs. Ce sont des risques systémiques.

Cette perspective sous-tend la philosophie de conception de Backboard. L’objectif n’est pas de mettre en valeur l’intelligence dans des moments isolés, mais de permettre aux systèmes d’IA de se comporter comme des logiciels fiables, même à mesure que la complexité augmente et que les horizons temporels s’étendent.

Ce que cela signifie pour l’avenir de l’IA

L’implication plus large des résultats de Backboard est que la prochaine phase de progrès de l’IA ne sera pas uniquement motivée par des modèles plus grands ou des fenêtres de contexte plus longues. Elle sera motivée par des systèmes capables de se souvenir, de raisonner et d’évoluer dans le temps.

Alors que les entreprises déployeront l’IA dans le soutien à la clientèle, les opérations, la recherche et la conformité, la mémoire persistante deviendra la fondation de la confiance et de la scalabilité. Les plate-formes qui résolvent la mémoire au niveau de l’infrastructure définiront la façon dont l’IA agente passe de l’expérimentation à l’utilisation quotidienne.

Avec son architecture de mémoire désormais validée à la fois par des benchmarks académiques et indépendants, Backboard se tourne vers l’aide aux équipes pour mieux comprendre et évaluer le comportement des systèmes d’IA sous des contraintes réelles. La fonctionnalité Switchboard à venir de l’entreprise vise à rendre les configurations d’IA complexes plus transparentes et prévisibles.

L’avenir de l’IA sera façonné moins par des astuces d’invite ingénieuses et plus par des systèmes qui peuvent être fiables dans le temps. La mémoire est la fondation de ce changement, et les résultats les plus récents de Backboard suggèrent que cette fondation est enfin en train de prendre forme.

Antoine est un leader visionnaire et partenaire fondateur de Unite.AI, animé par une passion inébranlable pour façonner et promouvoir l'avenir de l'IA et de la robotique. Un entrepreneur en série, il croit que l'IA sera aussi perturbatrice pour la société que l'électricité, et se fait souvent prendre en train de vanter le potentiel des technologies perturbatrices et de l'AGI.
En tant que futurist, il se consacre à explorer comment ces innovations vont façonner notre monde. En outre, il est le fondateur de Securities.io, une plateforme axée sur l'investissement dans les technologies de pointe qui redéfinissent l'avenir et remodelent des secteurs entiers.