Anúncios
Kumo Lança KumoRFM-2, um Modelo de Fundação Projetado para Substituir a Aprendizagem de Máquina Tradicional Empresarial

Kumo lançou KumoRFM-2, um modelo de fundação de próxima geração projetado especificamente para dados empresariais estruturados — marcando uma mudança fundamental na forma como as organizações geram previsões a partir de seus armazéns de dados. Ao contrário dos pipelines de aprendizagem de máquina tradicionais que exigem meses de engenharia de recursos e desenvolvimento de modelos personalizados, o KumoRFM-2 permite que as equipes gerem previsões instantaneamente usando linguagem natural, sem treinamento ou especialização.
No seu núcleo, o modelo representa uma nova categoria de IA: um modelo de fundação relacional que opera diretamente em estruturas de dados empresariais, em vez de achatá-las em tabelas simplificadas. Essa distinção aborda uma das limitações mais persistentes na IA empresarial, onde as relações valiosas entre conjuntos de dados são frequentemente perdidas antes que o modelamento comece.
De Pipelines Estáticos para Sistemas de Previsão em Tempo Real
A análise de previsão empresarial tem historicamente sido lenta e intensiva em recursos. Cada novo caso de uso — seja previsão de churn, detecção de fraude ou previsão de demanda — normalmente exige um pipeline separado, envolvendo limpeza de dados, engenharia de recursos, treinamento de modelos e ajuste.
O KumoRFM-2 substitui toda a fluxo de trabalho com um único sistema pré-treinado.
Em vez de construir modelos, os usuários definem o que desejam prever. O modelo interpreta o pedido, constrói o contexto necessário a partir do banco de dados subjacente e produz previsões em uma única passagem. Isso é possível por meio de uma combinação de aprendizado em contexto e uma interface declarativa chamada Linguagem de Consulta Previsiva (PQL), onde os usuários expressam o resultado que lhes importa, em vez dos passos necessários para computá-lo.
O resultado é uma mudança de “construir modelos” para “fazer perguntas” — uma alteração que reduz significativamente a barreira para usar IA previsiva em toda a organização.
Por Que os Dados Relacionais Foram Tão Difíceis
A maioria dos sistemas de IA existentes luta com dados empresariais estruturados por um motivo simples: eles os tratam incorretamente.
Modelos tradicionais, incluindo muitos sistemas de IA tabulares e até mesmo grandes modelos de linguagem, dependem de achatamento de dados em uma única tabela. Mas os dados empresariais do mundo real existem como sistemas interconectados — clientes vinculados a transações, transações vinculadas a produtos, produtos vinculados a estoque, tudo evoluindo ao longo do tempo.
O achatamento dessa estrutura remove as relações que frequentemente contêm os sinais previsivos mais valiosos. Isso também força as equipes a recriar manualmente esses sinais por meio da engenharia de recursos, um processo que é tanto demorado quanto propenso a erros.
O KumoRFM-2 evita isso completamente operando diretamente em bancos de dados relacionais, preservando conexões entre tabelas, carimbos de data/hora e entidades.
Dentro da Arquitetura: Como o KumoRFM-2 Funciona
A inovação-chave por trás do KumoRFM-2 é sua arquitetura de Transformador Gráfico Relacional hierárquica, que processa dados em vários níveis simultaneamente.
No primeiro nível, o modelo analisa tabelas individuais usando uma combinação de atenção de linha e coluna. Isso permite que ele entenda como os recursos se relacionam dentro de uma tabela, enquanto filtra dados irrelevantes ou barulhentos cedo no processo. Importante, o alvo de previsão é introduzido nessa etapa, significando que o modelo é condicionado à tarefa desde o início.
No segundo nível, o modelo realiza raciocínio baseado em grafos entre tabelas. Usando chaves estrangeiras, ele conecta dados de diferentes partes do banco de dados — como vincular um perfil de cliente a histórico de compras ou padrões comportamentais — e identifica sinais entre tabelas que de outra forma seriam perdidos.
No terceiro nível, o modelo incorpora atenção entre amostras, permitindo que ele aprenda com várias amostras de uma vez. Isso permite que ele generalize a partir de um número relativamente pequeno de exemplos de contexto, em vez de exigir conjuntos de dados de treinamento completos.
Essa design em estágios é crítica. Ele evita a explosão computacional que viria do processamento de todos os pontos de dados simultaneamente, enquanto também melhora a precisão filtrando o ruído antes que o raciocínio mais profundo ocorra.
Aprendizado em Contexto Substitui Treinamento
Uma característica definidora do KumoRFM-2 é sua dependência de aprendizado em contexto em vez de treinamento tradicional.
Em vez de treinar um modelo para cada tarefa, o KumoRFM-2 é pré-treinado uma vez em uma grande mistura de dados relacionais sintéticos e do mundo real. Quando um usuário envia um pedido de previsão, o sistema gera automaticamente um conjunto de exemplos de contexto — pequenos subgrafos do banco de dados emparelhados com resultados conhecidos.
Esses exemplos atuam como orientação para o modelo, permitindo que ele infira padrões e produza previsões sem atualizar seus pesos. Na prática, isso significa:
- Nenhum treinamento específico de tarefa
- Nenhuma engenharia de recursos
- Nenhum ajuste de modelo
Mesmo com apenas 0,2% dos dados normalmente necessários para aprendizado supervisionado, o modelo pode alcançar desempenho de ponta.
Desempenho em Benchmarks do Mundo Real
O KumoRFM-2 foi avaliado em 41 tarefas previsivas que abrangem indústrias como comércio eletrônico, saúde, plataformas sociais e sistemas empresariais.
O modelo consistentemente supera abordagens de aprendizado de máquina supervisionado tradicionais, incluindo conjuntos de engenharia e sistemas de aprendizado de máquina relacional. Em benchmarks empresariais, ele supera soluções amplamente usadas por margens significativas, enquanto também melhora ainda mais quando ajustado.
Além da precisão bruta, o modelo demonstra forte robustez:
- Mantém o desempenho mesmo quando grandes porções de links relacionais estão faltando
- Lida com dados barulhentos ou incompletos com degradação mínima
- Desempenha bem em cenários de inicialização a frio onde os dados históricos são limitados
Essa resistência é particularmente importante em ambientes empresariais, onde a qualidade dos dados é frequentemente inconsistente.
Projetado para Escala: Até 500 Bilhões de Linhas
O KumoRFM-2 é projetado para operar na escala da infraestrutura de dados moderna.
O sistema pode processar conjuntos de dados que excedem 500 bilhões de linhas, combinando execução nativa de banco de dados com um mecanismo de grafos personalizado capaz de acesso de dados de alta taxa de transferência. Em vez de mover os dados para um sistema de ML separado, a computação é empurrada diretamente para onde os dados residem — seja em bancos de dados SQL ou armazéns de dados em nuvem.
Essa abordagem reduz a latência, simplifica a implantação e permite que as organizações integrem capacidades previsivas diretamente em fluxos de trabalho existentes.
Linguagem Natural como Interface
Outra característica definidora é a interface de linguagem natural do modelo.
Os usuários podem fazer perguntas como:
- Quais clientes provavelmente abandonarão nos próximos 30 dias?
- Quais leads são mais prováveis de se converter?
- Quais produtos verão uma demanda aumentada?
O sistema traduz essas consultas em lógica previsiva estruturada, executa-as nos dados subjacentes e retorna tanto previsões quanto explicações.
Isso não apenas torna a análise previsiva mais acessível, mas também permite a integração com agentes de IA, onde as previsões podem ser incorporadas em fluxos de trabalho de tomada de decisão automatizados.
Rumo à Inteligência Empresarial Impulsionada por Agentes
O KumoRFM-2 é projetado com agentes em mente.
Suas capacidades previsivas podem ser expostas como “habilidades” modulares que os agentes de IA podem chamar como parte de fluxos de trabalho mais amplos. Isso transforma a modelagem previsiva em um bloco de construção componível — algo que pode ser combinado com recuperação, raciocínio e execução em sistemas autônomos.
Nesse contexto, o modelo não é apenas uma ferramenta para analistas, mas uma camada fundamental para a automação empresarial de próxima geração.
Redefinindo o Papel da Ciência de Dados
O KumoRFM-2 sinaliza uma mudança mais ampla na forma como as organizações abordam a ciência de dados.
Em vez de construir e manter dezenas de modelos específicos de tarefa, as equipes podem confiar em um único sistema de propósito geral que se adapta a novos problemas instantaneamente. Isso reduz a necessidade de especialização em engenharia de recursos e ajuste de modelo, enquanto permite experimentação e iteração mais rápidas.
Para muitas organizações, isso pode significar mudar de uma função de ciência de dados centralizada para um modelo mais distribuído, onde as informações previsivas são acessíveis em vários departamentos.
Uma Nova Categoria de Modelos de Fundação
Enquanto os modelos de fundação já transformaram domínios como linguagem e visão, os dados empresariais estruturados permanecem uma das últimas fronteiras.
KumoRFM-2 representa um exemplo inicial do que os modelos de fundação especializados para dados estruturados podem alcançar. Ao combinar raciocínio relacional, aprendizado em contexto e interação de linguagem natural, ele introduz um novo paradigma para IA previsiva.
Se amplamente adotado, essa abordagem poderia redefinir como os negócios interagem com seus dados — transformando a análise previsiva de um processo complexo e atrasado em uma capacidade em tempo real e organizacional.












