Intelligence artificielle

Sapient Intelligence présente HRM-Text, un modèle d’IA inspiré du cerveau conçu pour remettre en question la course à l’échelle

mm

Alors que l’industrie de l’IA continue à investir des milliards dans des modèles de langage de plus en plus grands et des centres de données de plus en plus massifs, la société de recherche en IA basée à Singapour, Sapient Intelligence, adopte une approche très différente.

La société a annoncé HRM-Text, un nouveau modèle de langage de raisonnement de 1 milliard de paramètres conçu autour d’une architecture récurrente hiérarchique inspirée de la façon dont le cerveau sépare la raison lente et délibérée de la traitement rapide et de niveau inférieur.

Au lieu d’essayer de gagner par la pure échelle, Sapient positionne HRM-Text comme preuve que la profondeur de raisonnement et l’efficacité computationnelle pourraient devenir plus importantes que les comptes de paramètres bruts dans la prochaine phase du développement de l’IA.

Le lancement continue une tendance plus large émergeant dans le secteur de l’IA : un scepticisme croissant selon lequel l’augmentation simple des transformateurs ne suffira pas à atteindre des formes plus générales d’intelligence.

Dépasser le livre de jeu des transformateurs

La plupart des grands modèles de langage modernes reposent sur des architectures de transformateurs qui traitent les informations à travers un système principalement feed-forward axé sur la prédiction du prochain jeton. Le cadre HRM de Sapient introduit une structure récurrente hiérarchique où plusieurs couches de raisonnement interagissent internement avant que toute sortie ne soit générée.

La société décrit l’architecture comme fonctionnant à travers deux systèmes interconnectés : un contrôleur lent de niveau supérieur responsable de la planification et de la raison abstraite, et un travailleur rapide de niveau inférieur qui gère les calculs détaillés.

Ceci diffère des méthodes de chaîne de pensée largement utilisées dans les systèmes d’IA actuels, où la raison est exprimée à travers de longues séquences de texte visibles. HRM-Text effectue une grande partie de sa raison internement dans l’espace latent avant de générer des réponses.

Sapient soutient que cette structure permet à des systèmes plus petits d’effectuer des raisonnements multi-étapes plus sophistiqués sans s’appuyer sur des tailles de modèle énormes ou des coûts d’inférence massifs.

Selon les résultats de référence fournis par la société, HRM-Text a obtenu 56,2 % sur MATH, 81,9 % sur ARC-Challenge, 82,2 % sur DROP et 60,7 % sur MMLU malgré son empreinte relativement petite.

L’efficacité devient un champ de bataille stratégique pour l’IA

Le lancement arrive à un moment où les préoccupations concernant les coûts d’infrastructure d’IA, la consommation d’énergie et la disponibilité des ressources de calcul deviennent des problèmes centraux de l’industrie.

La formation et le déploiement de systèmes d’IA de pointe nécessitent désormais souvent des grappes de GPU massives, des centres de données hyperscale et des niveaux de consommation d’énergie de plus en plus examinés par les gouvernements et les fournisseurs d’infrastructure. L’argument de Sapient est que les prochains progrès pourraient ne pas provenir de l’augmentation de la taille des systèmes, mais d’une réflexion fondamentale sur l’architecture elle-même.

La société affirme que HRM-Text peut être formé en environ un jour en utilisant 16 GPU sur deux machines à un coût d’environ 1 000 $. À titre de comparaison, les modèles de langage à la pointe de la technologie peuvent nécessiter des budgets de formation atteignant des centaines de millions de dollars.

Le profil de déploiement compact du modèle est également notable. À la quantification int4, HRM-Text occupe environ 0,6 GiB, ce qui rend théoriquement possible le déploiement local sur les smartphones et les appareils de bord.

Cette focalisation sur des systèmes plus petits et plus déployables pourrait devenir de plus en plus importante à mesure que les entreprises se tournent vers l’IA sur appareil, l’inférence sensible à la vie privée et les systèmes de raisonnement hors ligne qui ne dépendent pas entièrement de l’infrastructure cloud.

Le mouvement plus large vers l’IA inspirée du cerveau

Le travail de Sapient reflète un mouvement plus large au sein de la recherche en IA qui explore des alternatives à la mise à l’échelle traditionnelle des transformateurs.

L’architecture HRM de la société s’inspire fortement de concepts de neurosciences tels que le traitement hiérarchique, la séparation temporelle et le calcul récurrent.

Sur son site Web, Sapient décrit son objectif à long terme comme la poursuite de l’intelligence artificielle générale à travers des architectures capables de raisonnement, de planification et d’apprentissage adaptatif plutôt que de s’appuyer principalement sur la mémorisation statistique.

L’équipe de recherche de la société comprend d’anciens contributeurs d’organisations telles que DeepMind, DeepSeek et xAI, ainsi que des chercheurs liés à des institutions telles que le MIT, l’Université Carnegie Mellon, l’Université Tsinghua et l’Université de Cambridge.

Des versions antérieures du modèle de raisonnement hiérarchique de Sapient avaient déjà attiré l’attention dans les cercles de recherche en IA pour leur solide performance de raisonnement en utilisant des comptes de paramètres dramatiquement plus petits que les LLM conventionnels.

Un changement dans la façon dont les progrès de l’IA sont mesurés

Que les architectures comme HRM finissent par rivaliser avec les plus grands modèles de frontière reste une question ouverte. L’industrie de l’IA a vu à plusieurs reprises des alternatives prometteuses émerger avant d’être dépassées par l’économie implacable de l’échelle.

Cependant, le lancement de Sapient arrive à un moment où l’industrie est de plus en plus confrontée aux limites de l’expansion brutale. Les pénuries de GPU, les goulets d’étranglement de puissance, les coûts d’inférence et les rendements décroissants des jeux de données plus grands obligent les chercheurs à reconsidérer les hypothèses qui ont dominé les dernières années de développement de l’IA.

Si des systèmes comme HRM-Text continuent à s’améliorer, ils pourraient redéfinir la façon dont les progrès de l’IA sont mesurés — en déplaçant l’attention loin des comptes de paramètres et vers l’efficacité, la profondeur de raisonnement et l’adaptabilité.

La société a ouvert la source de HRM-Text via GitHub dans le cadre du lancement.

Antoine est un leader visionnaire et partenaire fondateur de Unite.AI, animé par une passion inébranlable pour façonner et promouvoir l'avenir de l'IA et de la robotique. Un entrepreneur en série, il croit que l'IA sera aussi perturbatrice pour la société que l'électricité, et se fait souvent prendre en train de vanter le potentiel des technologies perturbatrices et de l'AGI.
En tant que futurist, il se consacre à explorer comment ces innovations vont façonner notre monde. En outre, il est le fondateur de Securities.io, une plateforme axée sur l'investissement dans les technologies de pointe qui redéfinissent l'avenir et remodelent des secteurs entiers.