KĂŒnstliche Intelligenz
Sapient Intelligence prÀsentiert HRM-Text, ein auf dem Gehirn inspiriertes KI-Modell, das den Wettlauf um die Skalierung in Frage stellt

Während die KI-Branche Milliarden in immer größere Sprachmodelle und massive Rechenzentren investiert, geht das in Singapur ansässige KI-Forschungsunternehmen Sapient Intelligence einen ganz anderen Weg.
Das Unternehmen hat HRM-Text angekündigt, ein neues 1-Milliarden-Parameter-Reasoning-Sprachmodell, das auf einer hierarchischen rekurrenten Architektur basiert, die von der Art und Weise inspiriert ist, wie das Gehirn langsames, bewusstes Reasoning von schnellem, niedrigem Prozessieren trennt.
Statt zu versuchen, durch reine Skalierung zu gewinnen, positioniert Sapient HRM-Text als Beweis dafür, dass Reasoning-Tiefe und Rechen-effizienz wichtiger werden könnten als rohe Parameterzahlen in der nächsten Phase der KI-Entwicklung.
Der Launch setzt einen breiteren Trend in der KI-Branche fort: die wachsende Skepsis, dass das einfache Skalieren von Transformern unendlich ausreichen wird, um allgemeinere Formen der Intelligenz zu erreichen.
Jenseits des Transformer-Playbooks
Die meisten modernen großen Sprachmodelle basieren auf Transformer-Architekturen, die Informationen durch ein weitgehend feed-forward-System verarbeiten, das auf die Vorhersage des nächsten Tokens fokussiert ist. Sapients HRM-Framework introduceiert hingegen eine hierarchische rekurrente Struktur, in der mehrere Reasoning-Schichten intern interagieren, bevor irgendeine Ausgabe generiert wird.
Das Unternehmen beschreibt die Architektur als ein System, das durch zwei miteinander verbundene Systeme operiert: ein höheres “langsames Kontrollsystem”, das für abstraktes Planen und Reasoning verantwortlich ist, und ein niedrigeres “schnelles Arbeits-system”, das detaillierte Berechnungen ausführt.
Das unterscheidet sich von den chain-of-thought-Methoden, die in aktuellen KI-Systemen weit verbreitet sind, bei denen Reasoning durch lange sichtbare Textsequenzen ausgedrückt wird. HRM-Text führt hingegen viel von seinem Reasoning intern im latenten Raum durch, bevor es Antworten generiert.
Sapient argumentiert, dass diese Struktur es ermöglicht, kleinere Systeme auszuführen, die komplexeres multi-schrittiges Reasoning durchführen können, ohne auf enorme Modellgrößen oder massive Inferenzkosten angewiesen zu sein.
Laut den vom Unternehmen bereitgestellten Benchmark-Ergebnissen erzielte HRM-Text 56,2 % bei MATH, 81,9 % bei ARC-Challenge, 82,2 % bei DROP und 60,7 % bei MMLU, trotz seiner vergleichsweise kleinen Fußabdruck.
Effizienz wird zum strategischen KI-Schlachtfeld
Der Launch erfolgt zu einem Zeitpunkt, an dem Bedenken hinsichtlich der KI-Infrastrukturkosten, des Energieverbrauchs und der Verfügbarkeit von Rechenleistung zentrale Branchenprobleme werden.
Das Training und Bereitstellen von KI-Systemen auf dem neuesten Stand erfordert nun oft massive GPU-Cluster, Hyperscale-Rechenzentren und Energieverbrauchsniveaus, die zunehmend von Regierungen und Infrastrukturanbietern überwacht werden. Sapients Argument ist, dass zukünftige Durchbrüche nicht durch das Skalieren größerer Systeme erreicht werden, sondern durch eine grundlegende Neukonzeption der Architektur selbst.
Das Unternehmen behauptet, HRM-Text könne in etwa einem Tag mit 16 GPUs auf zwei Maschinen zu einem Kostenpunkt von etwa 1.000 US-Dollar trainiert werden. Im Vergleich dazu können Sprachmodelle auf dem neuesten Stand Trainingsbudgets erfordern, die in die Hunderte von Millionen US-Dollar reichen.
Das kompakte Bereitstellungsprofil des Modells ist ebenfalls bemerkenswert. Bei int4-Quantisierung soll HRM-Text etwa 0,6 GiB einnehmen, was eine lokale Bereitstellung auf Smartphones und Edge-Geräten theoretisch möglich macht.
Diese Fokussierung auf kleinere, bereitstellbare Systeme könnte zunehmend wichtig werden, da Unternehmen auf Device-KI, datenschutzsensitive Inferenz und Offline-Reasoning-Systeme drängen, die nicht vollständig auf Cloud-Infrastruktur angewiesen sind.
Der breitere Push hin zu gehirninspirierter KI
Sapients Arbeit spiegelt eine breitere Bewegung in der KI-Forschung wider, die Alternativen zum traditionellen Transformer-Skalieren erforscht.
Die HRM-Architektur des Unternehmens basiert stark auf Konzepten der Neurowissenschaft wie hierarchischer Verarbeitung, zeitlicher Trennung und rekurrenter Berechnung.
Auf seiner Website beschreibt Sapient sein langfristiges Ziel als die Verfolgung von künstlicher allgemeiner Intelligenz durch Architekturen, die Reasoning, Planung und adaptives Lernen ermöglichen, anstatt sich hauptsächlich auf statistische Memorierung zu verlassen.
Das Forschungsteam des Unternehmens umfasst ehemalige Mitarbeiter von Organisationen wie DeepMind, DeepSeek und xAI sowie Forscher, die mit Institutionen wie MIT, Carnegie Mellon University, Tsinghua University und der University of Cambridge verbunden sind.
Frühere Versionen von Sapients Hierarchischem Reasoning-Modell hatten bereits in KI-Forschungskreisen Aufmerksamkeit für ihre starke Reasoning-Leistung mit dramatisch kleineren Parameterzahlen als herkömmliche LLMs erregt.
Ein Wandel in der Messung des KI-Fortschritts
Ob Architekturen wie HRM letztendlich die größten Frontier-Modelle rivalisieren, bleibt eine offene Frage. Die KI-Branche hat wiederholt vielversprechende Alternativen gesehen, die dann von der unerbittlichen Ökonomie der Skalierung überholt wurden.
Dennoch erfolgt der Launch von Sapient zu einem Zeitpunkt, an dem die Branche zunehmend die Grenzen der reinen Expansion konfrontiert. GPU-Engpässe, Leistungsbottlenecks, Inferenzkosten und abnehmende Erträge von größeren Datensätzen zwingen Forscher, Annahmen zu überdenken, die die letzten Jahre der KI-Entwicklung dominiert haben.
Wenn Systeme wie HRM-Text weiter verbessert werden, könnten sie die Art und Weise verändern, wie der Fortschritt in der KI gemessen wird – die Aufmerksamkeit von Parameterzahlen weg und hin zu Effizienz, Reasoning-Tiefe und Anpassungsfähigkeit lenken.
Das Unternehmen hat HRM-Text vollständig über GitHub als Teil des Launchs open-source gemacht.












