Inteligencia artificial
Sapient Intelligence presenta HRM-Text, un modelo de inteligencia artificial inspirado en el cerebro diseñado para desafiar la carrera de escalabilidad

Mientras que la industria de la inteligencia artificial sigue invirtiendo miles de millones en modelos de lenguaje cada vez más grandes y centros de datos masivos, la empresa de investigación de inteligencia artificial con sede en Singapur, Sapient Intelligence, está adoptando un enfoque muy diferente.
La empresa ha anunciado HRM-Text, un nuevo modelo de lenguaje de razonamiento de 1.000 millones de parámetros diseñado alrededor de una arquitectura recurrente jerárquica inspirada en la forma en que el cerebro separa el razonamiento lento y deliberado del procesamiento rápido y de bajo nivel.
En lugar de intentar ganar mediante la mera escala, Sapient está posicionando HRM-Text como evidencia de que la profundidad del razonamiento y la eficiencia computacional pueden ser más importantes que las cuentas de parámetros brutos en la próxima fase del desarrollo de la inteligencia artificial.
El lanzamiento también continúa una tendencia más amplia que emerge en todo el sector de la inteligencia artificial: un escepticismo creciente de que simplemente escalar los transformadores de manera indefinida será suficiente para lograr formas más generales de inteligencia.
Más allá del libro de jugadas de los transformadores
La mayoría de los modelos de lenguaje grande modernos dependen de arquitecturas de transformadores que procesan la información a través de un sistema principalmente de alimentación directa centrado en la predicción de token siguiente. El marco HRM de Sapient introduce una estructura recurrente jerárquica donde múltiples capas de razonamiento interactúan internamente antes de que se genere cualquier salida.
La empresa describe la arquitectura como operando a través de dos sistemas interconectados: un controlador “lento” de nivel superior responsable de la planificación y el razonamiento abstractos, y un “trabajador rápido” de nivel inferior que maneja cálculos detallados.
Esto difiere de los métodos de cadena de pensamiento ampliamente utilizados en los sistemas de inteligencia artificial actuales, donde el razonamiento se expresa a través de secuencias de texto visibles largas. HRM-Text realiza la mayor parte de su razonamiento internamente dentro del espacio latente antes de generar respuestas.
Sapient argumenta que esta estructura permite que los sistemas más pequeños realicen un razonamiento multi-paso más sofisticado sin depender de tamaños de modelo enormes o costos de inferencia masivos.
Según los resultados de las pruebas proporcionados por la empresa, HRM-Text logró un 56,2% en MATH, un 81,9% en ARC-Challenge, un 82,2% en DROP y un 60,7% en MMLU a pesar de su huella relativamente pequeña.
La eficiencia se convierte en un campo de batalla estratégico de la inteligencia artificial
El lanzamiento llega en un momento en que las preocupaciones sobre los costos de la infraestructura de la inteligencia artificial, el consumo de energía y la disponibilidad de cómputo se están convirtiendo en cuestiones centrales de la industria.
Entrenar y desplegar sistemas de inteligencia artificial de vanguardia ahora a menudo requiere clústeres de GPU masivos, centros de datos de hipercalado y niveles de consumo de energía cada vez más sometidos a escrutinio por parte de los gobiernos y los proveedores de infraestructura. El argumento de Sapient es que los avances futuros pueden provenir no de escalar sistemas más grandes, sino de replantear fundamentalmente la arquitectura en sí.
La empresa afirma que HRM-Text se puede entrenar en aproximadamente un día utilizando 16 GPU en dos máquinas a un costo de aproximadamente $1,000. En comparación, los modelos de lenguaje de vanguardia pueden requerir presupuestos de entrenamiento que alcanzan los cientos de millones de dólares.
El perfil de despliegue compacto del modelo también es notable. En la cuantización int4, HRM-Text ocupa aproximadamente 0,6 GiB, lo que hace que el despliegue local en teléfonos inteligentes y dispositivos de borde sea teóricamente posible.
Ese enfoque en sistemas más pequeños y desplegables puede volverse cada vez más importante a medida que las empresas empujan hacia la inteligencia artificial en el dispositivo, la inferencia sensible a la privacidad y los sistemas de razonamiento sin conexión que no dependen enteramente de la infraestructura en la nube.
El impulso más amplio hacia la inteligencia artificial inspirada en el cerebro
El trabajo de Sapient refleja un movimiento más amplio dentro de la investigación de la inteligencia artificial que explora alternativas a la escalada tradicional de los transformadores.
La arquitectura HRM de la empresa se basa en gran medida en conceptos de neurociencia como el procesamiento jerárquico, la separación temporal y el cálculo recurrente.
En su sitio web, Sapient describe su objetivo a largo plazo como la búsqueda de la inteligencia artificial general a través de arquitecturas capaces de razonamiento, planificación y aprendizaje adaptativo en lugar de confiar principalmente en la memorización estadística.
El equipo de investigación de la empresa incluye ex contribuyentes de organizaciones como DeepMind, DeepSeek y xAI, junto con investigadores conectados a instituciones como MIT, la Universidad Carnegie Mellon, la Universidad Tsinghua y la Universidad de Cambridge.
Versiones anteriores del Modelo de Razonamiento Jerárquico de Sapient ya habían atraído la atención en los círculos de investigación de la inteligencia artificial por lograr un rendimiento de razonamiento sólido utilizando cuentas de parámetros dramáticamente más pequeñas que los LLM convencionales.
Un cambio en la forma en que se mide el progreso de la inteligencia artificial
Si las arquitecturas como HRM eventualmente rivalizan con los modelos de vanguardia más grandes, sigue siendo una pregunta abierta. La industria de la inteligencia artificial ha visto repetidamente surgir alternativas prometedoras antes de ser superadas por la economía implacable de la escala.
Aún así, el lanzamiento de Sapient llega en un momento en que la industria se enfrenta cada vez más a los límites de la expansión a la fuerza bruta. La escasez de GPU, los cuellos de botella de energía, los costos de inferencia y los rendimientos decrecientes de los conjuntos de datos más grandes están obligando a los investigadores a replantear las suposiciones que han dominado los últimos años de desarrollo de la inteligencia artificial.
Si sistemas como HRM-Text siguen mejorando, podrían cambiar la forma en que se mide el progreso de la inteligencia artificial —desviando la atención de las cuentas de parámetros hacia la eficiencia, la profundidad del razonamiento y la adaptabilidad.
La empresa ha abierto completamente HRM-Text a través de GitHub como parte del lanzamiento.












