Inteligência artificial

Sapient Intelligence Apresenta o HRM-Text, um Modelo de IA Inspirado no Cérebro Projetado para Desafiar a Corrida de Escala

mm

À medida que a indústria de IA continua investindo bilhões em modelos de linguagem cada vez maiores e centros de dados cada vez mais massivos, a empresa de pesquisa de IA com sede em Cingapura, Sapient Intelligence, está adotando uma abordagem muito diferente.

A empresa anunciou o HRM-Text, um novo modelo de linguagem de raciocínio de 1 bilhão de parâmetros projetado em torno de uma arquitetura recorrente hierárquica inspirada na forma como o cérebro separa o raciocínio lento e deliberado do processamento rápido e de nível inferior.

Ao invés de tentar vencer através da mera escala, a Sapient está posicionando o HRM-Text como evidência de que a profundidade do raciocínio e a eficiência computacional podem se tornar mais importantes do que as contagens brutas de parâmetros na próxima fase do desenvolvimento de IA.

O lançamento também continua uma tendência mais ampla que está surgindo em todo o setor de IA: um ceticismo crescente de que simplesmente escalar os transformadores indefinidamente será suficiente para alcançar formas mais gerais de inteligência.

Além do Livro de Receitas do Transformer

A maioria dos modelos de linguagem grandes modernos depende de arquiteturas de Transformer que processam informações por meio de um sistema basicamente feed-forward focado na previsão do próximo token. O framework HRM da Sapient introduz, em vez disso, uma estrutura recorrente hierárquica onde múltiplas camadas de raciocínio interagem internamente antes que qualquer saída seja gerada.

A empresa descreve a arquitetura como operando por meio de dois sistemas interconectados: um controlador “lento” de nível superior responsável por planejamento e raciocínio abstrato, e um “trabalhador rápido” de nível inferior que lida com cálculos detalhados.

Isso difere dos métodos de “cadeia de pensamento” amplamente utilizados nos sistemas de IA atuais, onde o raciocínio é expresso por meio de longas sequências de texto visíveis. O HRM-Text, em vez disso, realiza grande parte de seu raciocínio internamente no espaço latente antes de gerar respostas.

A Sapient argumenta que essa estrutura permite que sistemas menores realizem raciocínio multi-etapas mais sofisticado sem depender de tamanhos de modelo enormes ou custos de inferência massivos.

De acordo com os resultados de benchmark fornecidos pela empresa, o HRM-Text alcançou 56,2% no MATH, 81,9% no ARC-Desafio, 82,2% no DROP e 60,7% no MMLU, apesar de sua pegada comparativamente pequena.

A Eficiência se Torna um Campo de Batalha Estratégico para a IA

O lançamento chega em um momento em que as preocupações em torno dos custos de infraestrutura de IA, consumo de energia e disponibilidade de computação estão se tornando questões centrais da indústria.

O treinamento e implantação de sistemas de IA de ponta agora frequentemente exigem clusters de GPU massivos, centros de dados de hiperscale e níveis de consumo de energia cada vez mais examinados por governos e provedores de infraestrutura. O argumento da Sapient é que os avanços futuros podem vir não do escalonamento de sistemas maiores, mas da reestruturação fundamental da arquitetura em si.

A empresa afirma que o HRM-Text pode ser treinado em aproximadamente um dia usando 16 GPUs em duas máquinas, a um custo de aproximadamente $1.000. Em comparação, os modelos de linguagem de ponta podem exigir orçamentos de treinamento que alcançam dezenas de milhões de dólares.

O perfil de implantação compacto do modelo também é notável. Com quantização int4, o HRM-Text ocupa aproximadamente 0,6 GiB, tornando a implantação local em smartphones e dispositivos de borda teoricamente possível.

Essa ênfase em sistemas menores e mais implantáveis pode se tornar cada vez mais importante à medida que as empresas impulsionam a IA no dispositivo, a inferência sensível à privacidade e os sistemas de raciocínio offline que não dependem inteiramente da infraestrutura em nuvem.

O Impulso Mais Amplo em Direção à IA Inspirada no Cérebro

O trabalho da Sapient reflete um movimento mais amplo dentro da pesquisa de IA que explora alternativas ao escalonamento tradicional do transformer.

A arquitetura HRM da empresa se baseia fortemente em conceitos de neurociência, como processamento hierárquico, separação temporal e computação recorrente.

No site da empresa, a Sapient descreve seu objetivo de longo prazo como perseguir a Inteligência Artificial Geral por meio de arquiteturas capazes de raciocínio, planejamento e aprendizado adaptativo, em vez de depender principalmente da memorização estatística.

A equipe de pesquisa da empresa inclui ex-contribuintes de organizações como DeepMind, DeepSeek e xAI, além de pesquisadores ligados a instituições como MIT, Carnegie Mellon University, Tsinghua University e a Universidade de Cambridge.

Versões anteriores do Modelo de Raciocínio Hierárquico da Sapient já haviam atraído atenção nos círculos de pesquisa de IA por alcançar um desempenho de raciocínio forte usando contagens de parâmetros dramaticamente menores do que os LLMs convencionais.

Uma Mudança na Maneira como o Progresso da IA é Medido

Se arquiteturas como a HRM eventualmente rivalizam com os maiores modelos de fronteira, permanece uma questão aberta. A indústria de IA repetidamente viu alternativas promissoras surgirem antes de serem ultrapassadas pela economia implacável da escala.

No entanto, o lançamento da Sapient chega em um momento em que a indústria está cada vez mais confrontando os limites da expansão bruta. A escassez de GPUs, gargalos de energia, custos de inferência e retornos decrescentes de conjuntos de dados maiores estão forçando os pesquisadores a reavaliar suposições que dominaram os últimos anos de desenvolvimento de IA.

Se sistemas como o HRM-Text continuam melhorando, eles poderiam redefinir como o progresso da IA é medido — deslocando a atenção para longe das contagens de parâmetros e em direção à eficiência, profundidade do raciocínio e adaptabilidade.

A empresa disponibilizou totalmente o HRM-Text por meio do GitHub como parte do lançamento.

Antoine é um líder visionário e sócio-fundador da Unite.AI, impulsionado por uma paixão inabalável em moldar e promover o futuro da IA e da robótica. Um empreendedor serial, ele acredita que a IA será tão disruptiva para a sociedade quanto a eletricidade, e é frequentemente pego falando sobre o potencial das tecnologias disruptivas e da AGI. Como um futurista, ele está dedicado a explorar como essas inovações moldarão nosso mundo. Além disso, ele é o fundador da Securities.io, uma plataforma focada em investir em tecnologias de ponta que estão redefinindo o futuro e remodelando setores inteiros.