Kunstmatige intelligentie
Sapient Intelligence onthult HRM-Text, een door het brein geïnspireerd AI-model dat de schaal-eerst-race uitdaagt

Terwijl de AI-industrie miljarden blijft investeren in steeds grotere taalmodellen en enorm grote datacenters, neemt het in Singapore gevestigde AI-onderzoeksbedrijf Sapient Intelligence een heel andere aanpak.
Het bedrijf heeft HRM-Text aangekondigd, een nieuw 1-miljard-parameter-redenerend taalmodel ontworpen rond een hiërarchische recursieve architectuur geïnspireerd door de manier waarop de hersenen langzame, bewuste redenering scheiden van snelle, lagere verwerking.
In plaats van te proberen te winnen door pure schaal, positioneert Sapient HRM-Text als bewijs dat redeneringsdiepte en computationele efficiëntie belangrijker kunnen worden dan pure parameteraantallen in de volgende fase van AI-ontwikkeling.
De lancering zet een bredere trend voort die opkomt in de AI-sector: een groeiende scepsis dat het eindeloos schalen van transformatoren alone voldoende zal zijn om meer algemene vormen van intelligentie te bereiken.
Verder gaan dan het Transformer-playbook
De meeste moderne grote taalmodellen vertrouwen op Transformer-architecturen die informatie verwerken via een grotendeels feed-forward-systeem gericht op next-token-predictie. Sapient’s HRM-framework introduceert daarentegen een hiërarchische recursieve structuur waarin meerdere redeneringslagen intern interactie aangaan voordat er uitvoer wordt gegenereerd.
Het bedrijf beschrijft de architectuur als opererend via twee verbonden systemen: een hoger “slow controller” verantwoordelijk voor abstracte planning en redenering, en een lager “fast worker” dat gedetailleerde berekeningen afhandelt.
Dit verschilt van de chain-of-thought-methoden die breed worden gebruikt in huidige AI-systemen, waar redenering wordt uitgedrukt via lange zichtbare tekstsequenties. HRM-Text voert daarentegen een groot deel van zijn redenering intern uit in latent space voordat het antwoorden genereert.
Sapient stelt dat deze structuur het mogelijk maakt dat kleinere systemen meer geavanceerde multi-step-redenering kunnen uitvoeren zonder te vertrouwen op enorme modelgroottes of massale inferentiekosten.
Volgens de door het bedrijf verstrekte benchmarkresultaten behaalde HRM-Text 56,2% op MATH, 81,9% op ARC-Challenge, 82,2% op DROP en 60,7% op MMLU ondanks zijn relatief kleine voetafdruk.
Efficiëntie wordt een strategisch AI-slagveld
De lancering vindt plaats op een moment waarop zorgen over AI-infrastructuurkosten, energieverbruik en compute-beschikbaarheid centrale industrieissues worden.
Het trainen en implementeren van state-of-the-art AI-systemen vereist nu vaak enorme GPU-clusters, hyperscale-datacenters en energieverbruiksniveaus die steeds meer onder de loep worden genomen door overheden en infrastructuuraanbieders. Sapient’s argument is dat toekomstige doorbraken mogelijk niet zullen komen van het schalen van grotere systemen, maar van het fundamenteel heroverwegen van de architectuur zelf.
Het bedrijf stelt dat HRM-Text kan worden getraind in ongeveer één dag met 16 GPU’s op twee machines tegen een kosten van ongeveer $1.000. In vergelijking daarmee kunnen frontier-schaal-taalmodellen trainingsbudgetten vereisen die in de honderden miljoenen dollars lopen.
Het compacte implementatieprofiel van het model is eveneens opmerkelijk. Bij int4-quantificatie neemt HRM-Text ongeveer 0,6 GiB in beslag, waardoor lokale implementatie op smartphones en edge-apparaten theoreticsch mogelijk is.
Die focus op kleinere, meer implementeerbare systemen kan steeds belangrijker worden naarmate ondernemingen pushen naar on-device AI, privacy-gevoelige inferentie en offline-redeneringssystemen die niet volledig afhankelijk zijn van cloud-infrastructuur.
De bredere push naar door het brein geïnspireerde AI
Sapient’s werk weerspiegelt een bredere beweging binnen AI-onderzoek naar alternatieven voor traditioneel transformer-schalen.
Het bedrijf’s HRM-architectuur put uit neurowetenschappelijke concepten zoals hiërarchische verwerking, temporale scheiding en recursieve berekening.
Op zijn website beschrijft Sapient zijn langetermijndoelstelling als het nastreven van kunstmatige algehele intelligentie via architectuur die redenering, planning en adaptief leren mogelijk maakt, in plaats van te vertrouwen op statistische memorisatie.
Het onderzoeksteam van het bedrijf omvat voormalige bijdragers van organisaties zoals DeepMind, DeepSeek en xAI, evenals onderzoekers verbonden aan instellingen zoals MIT, Carnegie Mellon University, Tsinghua University en de University of Cambridge.
Eerdere versies van Sapient’s Hiërarchisch Redeneringsmodel hadden reeds aandacht getrokken in AI-onderzoekskringen vanwege hun sterke redeneringsprestaties met aanzienlijk kleinere parameteraantallen dan conventionele LLM’s.
Een verschuiving in hoe AI-vooruitgang wordt gemeten
Of architectuur zoals HRM uiteindelijk de grootste frontier-modellen zal evenaren, blijft een open vraag. De AI-industrie heeft herhaaldelijk veelbelovende alternatieven zien opkomen die uiteindelijk zijn ingehaald door de onverbiddelijke economie van schaal.
Toch vindt Sapient’s lancering plaats op een moment waarop de industrie steeds meer de grenzen van brute-force-uitbreiding confronteert. GPU-gebrek, energiekrapte, inferentiekosten en afnemende rendementen van grotere datasets dwingen onderzoekers ertoe hun aannamen te heroverwegen die de afgelopen jaren AI-ontwikkeling hebben gedomineerd.
Als systemen zoals HRM-Text blijven verbeteren, kunnen ze de manier waarop AI-vooruitgang wordt gemeten herschikken — de aandacht verschuiven van parameteraantallen naar efficiëntie, redeneringsdiepte en adaptiviteit.
Het bedrijf heeft HRM-Text volledig open-source gemaakt via GitHub als onderdeel van de lancering.












