KĂŒnstliche Intelligenz

Sapient Intelligence prÀsentiert HRM-Text, ein auf dem Gehirn inspiriertes KI-Modell, das den Wettlauf um die Skalierung in Frage stellt

mm

Während die KI-Branche Milliarden in immer größere Sprachmodelle und massive Rechenzentren investiert, geht das in Singapur ansässige KI-Forschungsunternehmen Sapient Intelligence einen ganz anderen Weg.

Das Unternehmen hat HRM-Text angekündigt, ein neues 1-Milliarden-Parameter-Reasoning-Sprachmodell, das auf einer hierarchischen rekurrenten Architektur basiert, die von der Art und Weise inspiriert ist, wie das Gehirn langsames, bewusstes Reasoning von schnellem, niedrigem Prozessieren trennt.

Statt zu versuchen, durch reine Skalierung zu gewinnen, positioniert Sapient HRM-Text als Beweis dafür, dass Reasoning-Tiefe und Rechen-effizienz wichtiger werden könnten als rohe Parameterzahlen in der nächsten Phase der KI-Entwicklung.

Der Launch setzt einen breiteren Trend in der KI-Branche fort: die wachsende Skepsis, dass das einfache Skalieren von Transformern unendlich ausreichen wird, um allgemeinere Formen der Intelligenz zu erreichen.

Jenseits des Transformer-Playbooks

Die meisten modernen großen Sprachmodelle basieren auf Transformer-Architekturen, die Informationen durch ein weitgehend feed-forward-System verarbeiten, das auf die Vorhersage des nächsten Tokens fokussiert ist. Sapients HRM-Framework introduceiert hingegen eine hierarchische rekurrente Struktur, in der mehrere Reasoning-Schichten intern interagieren, bevor irgendeine Ausgabe generiert wird.

Das Unternehmen beschreibt die Architektur als ein System, das durch zwei miteinander verbundene Systeme operiert: ein höheres “langsames Kontrollsystem”, das für abstraktes Planen und Reasoning verantwortlich ist, und ein niedrigeres “schnelles Arbeits-system”, das detaillierte Berechnungen ausführt.

Das unterscheidet sich von den chain-of-thought-Methoden, die in aktuellen KI-Systemen weit verbreitet sind, bei denen Reasoning durch lange sichtbare Textsequenzen ausgedrückt wird. HRM-Text führt hingegen viel von seinem Reasoning intern im latenten Raum durch, bevor es Antworten generiert.

Sapient argumentiert, dass diese Struktur es ermöglicht, kleinere Systeme auszuführen, die komplexeres multi-schrittiges Reasoning durchführen können, ohne auf enorme Modellgrößen oder massive Inferenzkosten angewiesen zu sein.

Laut den vom Unternehmen bereitgestellten Benchmark-Ergebnissen erzielte HRM-Text 56,2 % bei MATH, 81,9 % bei ARC-Challenge, 82,2 % bei DROP und 60,7 % bei MMLU, trotz seiner vergleichsweise kleinen Fußabdruck.

Effizienz wird zum strategischen KI-Schlachtfeld

Der Launch erfolgt zu einem Zeitpunkt, an dem Bedenken hinsichtlich der KI-Infrastrukturkosten, des Energieverbrauchs und der Verfügbarkeit von Rechenleistung zentrale Branchenprobleme werden.

Das Training und Bereitstellen von KI-Systemen auf dem neuesten Stand erfordert nun oft massive GPU-Cluster, Hyperscale-Rechenzentren und Energieverbrauchsniveaus, die zunehmend von Regierungen und Infrastrukturanbietern überwacht werden. Sapients Argument ist, dass zukünftige Durchbrüche nicht durch das Skalieren größerer Systeme erreicht werden, sondern durch eine grundlegende Neukonzeption der Architektur selbst.

Das Unternehmen behauptet, HRM-Text könne in etwa einem Tag mit 16 GPUs auf zwei Maschinen zu einem Kostenpunkt von etwa 1.000 US-Dollar trainiert werden. Im Vergleich dazu können Sprachmodelle auf dem neuesten Stand Trainingsbudgets erfordern, die in die Hunderte von Millionen US-Dollar reichen.

Das kompakte Bereitstellungsprofil des Modells ist ebenfalls bemerkenswert. Bei int4-Quantisierung soll HRM-Text etwa 0,6 GiB einnehmen, was eine lokale Bereitstellung auf Smartphones und Edge-Geräten theoretisch möglich macht.

Diese Fokussierung auf kleinere, bereitstellbare Systeme könnte zunehmend wichtig werden, da Unternehmen auf Device-KI, datenschutzsensitive Inferenz und Offline-Reasoning-Systeme drängen, die nicht vollständig auf Cloud-Infrastruktur angewiesen sind.

Der breitere Push hin zu gehirninspirierter KI

Sapients Arbeit spiegelt eine breitere Bewegung in der KI-Forschung wider, die Alternativen zum traditionellen Transformer-Skalieren erforscht.

Die HRM-Architektur des Unternehmens basiert stark auf Konzepten der Neurowissenschaft wie hierarchischer Verarbeitung, zeitlicher Trennung und rekurrenter Berechnung.

Auf seiner Website beschreibt Sapient sein langfristiges Ziel als die Verfolgung von künstlicher allgemeiner Intelligenz durch Architekturen, die Reasoning, Planung und adaptives Lernen ermöglichen, anstatt sich hauptsächlich auf statistische Memorierung zu verlassen.

Das Forschungsteam des Unternehmens umfasst ehemalige Mitarbeiter von Organisationen wie DeepMind, DeepSeek und xAI sowie Forscher, die mit Institutionen wie MIT, Carnegie Mellon University, Tsinghua University und der University of Cambridge verbunden sind.

Frühere Versionen von Sapients Hierarchischem Reasoning-Modell hatten bereits in KI-Forschungskreisen Aufmerksamkeit für ihre starke Reasoning-Leistung mit dramatisch kleineren Parameterzahlen als herkömmliche LLMs erregt.

Ein Wandel in der Messung des KI-Fortschritts

Ob Architekturen wie HRM letztendlich die größten Frontier-Modelle rivalisieren, bleibt eine offene Frage. Die KI-Branche hat wiederholt vielversprechende Alternativen gesehen, die dann von der unerbittlichen Ökonomie der Skalierung überholt wurden.

Dennoch erfolgt der Launch von Sapient zu einem Zeitpunkt, an dem die Branche zunehmend die Grenzen der reinen Expansion konfrontiert. GPU-Engpässe, Leistungsbottlenecks, Inferenzkosten und abnehmende Erträge von größeren Datensätzen zwingen Forscher, Annahmen zu überdenken, die die letzten Jahre der KI-Entwicklung dominiert haben.

Wenn Systeme wie HRM-Text weiter verbessert werden, könnten sie die Art und Weise verändern, wie der Fortschritt in der KI gemessen wird – die Aufmerksamkeit von Parameterzahlen weg und hin zu Effizienz, Reasoning-Tiefe und Anpassungsfähigkeit lenken.

Das Unternehmen hat HRM-Text vollständig über GitHub als Teil des Launchs open-source gemacht.

Antoine ist ein visionĂ€rer FĂŒhrer und GrĂŒndungspartner von Unite.AI, getrieben von einer unerschĂŒtterlichen Leidenschaft fĂŒr die Gestaltung und Förderung der Zukunft von KI und Robotik. Ein Serienunternehmer, glaubt er, dass KI so disruptiv fĂŒr die Gesellschaft sein wird wie ElektrizitĂ€t, und wird oft dabei ertappt, wie er ĂŒber das Potenzial disruptiver Technologien und AGI schwĂ€rmt.

Als futurist ist er darauf fokussiert, zu erforschen, wie diese Innovationen unsere Welt formen werden. ZusĂ€tzlich ist er der GrĂŒnder von Securities.io, einer Plattform, die sich auf Investitionen in hochmoderne Technologien konzentriert, die die Zukunft neu definieren und ganze Branchen umgestalten.