Kunstig intelligens

Sapient Intelligence lanserer HRM-Text, en hjernen-inspirert AI-modell bygget for å utfordre skala-først-kappløpet

mm

Mens AI-industrien fortsetter å øse milliarder i stadig større språkmodeller og massive datacenter, tar det Singapore-baserte AI-forskningsfirmaet Sapient Intelligence en helt annen tilnærming.

Selskapet har annonsert HRM-Text, en ny 1-milliard-parameter resoneringsspråkmodell designet rundt en hierarkisk rekurrerende arkitektur inspirert av hvordan hjernen skiller mellom langsom, bevisst resonering og rask, lavere-nivå-behandling.

I stedet for å prøve å vinne gjennom ren skala, stiller Sapient HRM-Text som bevis på at resoneringens dybde og beregnings-effektivitet kan bli viktigere enn rå parameter-tell i den neste fasen av AI-utvikling.

Lanseringen fortsetter en bredere trend som oppstår i AI-sektoren: økende skepsis til at skaling av transformatorer uendelig vil være nok til å oppnå mer generelle former for intelligens.

Beveger seg bort fra Transformer-spillboken

De fleste moderne store språkmodeller avhenger av Transformer-arkitekturer som prosesserer informasjon gjennom et hovedsakelig feed-forward-system fokusert på neste-token-prediksjon. Sapients HRM-ramverk innfører i stedet en hierarkisk rekurrerende struktur hvor flere resoneringsslag interagerer internalt før noen output genereres.

Selskapet beskriver arkitekturen som opererende gjennom to sammenkoblede systemer: et høyere-nivå “langsom kontroller” ansvarlig for abstrakt planlegging og resonering, og et lavere-nivå “raske arbeider” som håndterer detaljerte beregninger.

Dette skiller seg fra chain-of-thought-metodene som er vidt utbredt i nåværende AI-systemer, hvor resonering uttrykkes gjennom lange synlige tekstsekvenser. HRM-Text utfører i stedet mye av sin resonering internt i latent rom før respons genereres.

Sapient hevder at denne strukturen tillater mindre systemer å utføre mer sofistikert multi-trinn-resonering uten å avhenge av enorme modell-størrelser eller massive inferens-kostnader.

Ifølge benchmark-resultater levert av selskapet, oppnådde HRM-Text 56,2% på MATH, 81,9% på ARC-Challenge, 82,2% på DROP og 60,7% på MMLU til tross for sin relativt små fotavtrykk.

Effektivitet blir et strategisk AI-slagfelt

Lanseringen kommer på et tidspunkt når bekymringer rundt AI-infrastruktur-kostnader, strømforbruk og beregnings-tilgjengelighet blir sentrale bransje-problemer.

Trening og deployering av state-of-the-art AI-systemer krever nå ofte massive GPU-kluster, hyperskala-datacenter og energiforbruk på nivåer som stadig mer granskes av myndigheter og infrastruktur-tilbydere. Sapients argument er at fremtidige gjennombrudd kan komme ikke fra skaling av større systemer, men fra å grundig omdefinere arkitekturen selv.

Selskapet hevder at HRM-Text kan trenes på omtrent en dag ved å bruke 16 GPU-er over to maskiner til en kostnad på omtrent 1 000 dollar. I sammenligning kan grense-tilstand-språkmodeller kreve trenings-budsjett som når inn i hundred-millioner dollar.

Modellens kompakte deployerings-profil er også bemerkelsesverdig. Ved int4-kvantifisering, rapporteres HRM-Text å okkupere omtrent 0,6 GiB, noe som gjør lokal deployering på smarttelefoner og kant-enheter teoretisk mulig.

Den fokuset på mindre, mer deployerbare systemer kan bli stadig viktigere når bedrifter presses mot på-enhet-AI, personvern-sensitiv inferens og offline-resoneringssystemer som ikke avhenger fullstendig av sky-infrastruktur.

Den bredere bevegelsen mot hjernen-inspirert AI

Sapients arbeid reflekterer en bredere bevegelse innen AI-forskning som utforsker alternativer til tradisjonell transformer-skaling.

Selskapets HRM-arkitektur trekker tungt fra nevrovitenskapelige konsepter som hierarkisk prosessering, tids-separasjon og rekurrerende beregning.

På sin nettside beskriver Sapient sin langsiktige mål som å drive kunstig generell intelligens gjennom arkitekturer i stand til å resonere, planlegge og adaptivt lære, i stedet for å avhenge primært av statistisk memorering.

Selskapets forskningsteam inkluderer tidligere bidragsytere fra organisasjoner som DeepMind, DeepSeek og xAI, samt forskere tilknyttet institusjoner som MIT, Carnegie Mellon University, Tsinghua University og University of Cambridge.

Tidligere versjoner av Sapients Hierarkisk Resonering-Modell hadde allerede tiltrukket seg oppmerksomhet i AI-forsknings-kretser for å oppnå sterk resonering-prestasjon ved å bruke dramatisk mindre parameter-tell enn konvensjonelle LLM-er.

En endring i hvordan AI-fremgang måles

Om arkitekturer som HRM til slutt vil kunne rivalisere de største grense-tilstand-modellene, er åpen. AI-industrien har gjentatte ganger sett lovende alternativer dukke opp før de blir overgått av den uavbrutte økonomien av skala.

Likevel kommer Sapients lansering på et tidspunkt når industrien stadig mer konfronterer grensene for brutt-kraft-utvidelse. GPU-mangel, strøm-bottlenecks, inferens-kostnader og avtagende avkastning fra større datasett tvinger forskerne til å omdefinere antakelser som har dominert de siste årene av AI-utvikling.

Hvis systemer som HRM-Text fortsetter å forbedre seg, kan de omdefinere hvordan fremgang i AI måles — og flytte fokus bort fra parameter-tell og mot effektivitet, resoneringens dybde og adaptivitet.

Selskapet har fullstendig åpnet HRM-Text-kilden via GitHub som en del av lanseringen.

Antoine er en visjonær leder og grunnleggende partner i Unite.AI, drevet av en urokkelig lidenskap for å forme og fremme fremtiden for AI og robotikk. En seriegründer, han tror at AI vil være like disruptiv for samfunnet som elektrisitet, og blir ofte tatt i å tale om potensialet for disruptiv teknologi og AGI.
Som en futurist, er han dedikert til å utforske hvordan disse innovasjonene vil forme vår verden. I tillegg er han grunnleggeren av Securities.io, en plattform som fokuserer på å investere i banebrytende teknologier som omdefinerer fremtiden og omformer hele sektorer.