Anuncios
Kumo lanza KumoRFM-2, un modelo de base diseñado para reemplazar el aprendizaje automático empresarial tradicional

Kumo ha presentado KumoRFM-2, un modelo de base de próxima generación diseñado específicamente para datos empresariales estructurados, lo que marca un cambio fundamental en la forma en que las organizaciones generan predicciones a partir de sus almacenes de datos. A diferencia de las canalizaciones de aprendizaje automático tradicionales que requieren meses de ingeniería de características y desarrollo de modelos personalizados, KumoRFM-2 permite a los equipos generar predicciones instantáneamente utilizando lenguaje natural, sin necesidad de capacitación o experiencia especializada.
En su núcleo, el modelo representa una nueva categoría de IA: un modelo de base relacional que opera directamente en estructuras de datos empresariales en lugar de aplanarlas en tablas simplificadas. Esta distinción aborda una de las limitaciones más persistentes en la IA empresarial, donde las relaciones valiosas entre conjuntos de datos a menudo se pierden antes de que comience el modelado.
De canalizaciones estáticas a sistemas predictivos en tiempo real
Análisis predictivo empresarial ha sido históricamente lento y consume muchos recursos. Cada nuevo caso de uso, ya sea la predicción de abandono, la detección de fraude o la previsión de la demanda, generalmente requiere una canalización separada, que implica limpieza de datos, ingeniería de características, capacitación de modelos y ajuste.
KumoRFM-2 reemplaza toda esa canalización con un solo sistema preentrenado.
En lugar de construir modelos, los usuarios definen lo que desean predecir. El modelo interpreta la solicitud, construye el contexto necesario a partir de la base de datos subyacente y produce predicciones en un solo paso. Esto es posible gracias a una combinación de aprendizaje en contexto y una interfaz declarativa llamada Lenguaje de Consulta Predictiva (PQL), donde los usuarios expresan el resultado que les importa en lugar de los pasos necesarios para calcularlo.
El resultado es un cambio de “construir modelos” a “hacer preguntas”, un cambio que reduce significativamente la barrera para utilizar la IA predictiva en toda la organización.
Por qué los datos relacionales han sido tan difíciles
La mayoría de los sistemas de IA existentes luchan con datos empresariales estructurados por una razón simple: los tratan de manera incorrecta.
Los modelos tradicionales, incluidos muchos sistemas de IA tabulares y incluso grandes modelos de lenguaje, confían en aplanar los datos en una sola tabla. Pero los datos empresariales del mundo real existen como sistemas interconectados, clientes vinculados a transacciones, transacciones vinculadas a productos, productos vinculados a inventario, todo evoluciona con el tiempo.
Aplanar esta estructura elimina las relaciones que a menudo contienen las señales predictivas más valiosas. También fuerza a los equipos a recrear manualmente esas señales a través de la ingeniería de características, un proceso que es tanto tiempo-consuming como propenso a errores.
KumoRFM-2 evita esto por completo al operar directamente en bases de datos relacionales, preservando conexiones a través de tablas, marcas de tiempo y entidades.
Dentro de la arquitectura: Cómo funciona KumoRFM-2
La innovación clave detrás de KumoRFM-2 es su arquitectura de Transformador de Grafo Relacional jerárquico, que procesa los datos a múltiples niveles simultáneamente.
En el primer nivel, el modelo analiza las tablas individuales utilizando una combinación de atención de fila y columna. Esto le permite entender cómo se relacionan las características dentro de una tabla mientras se filtran los datos irrelevantes o ruidosos al comienzo del proceso. Es importante destacar que el objetivo de predicción se introduce en esta etapa, lo que significa que el modelo se condiciona en la tarea desde el principio.
En el segundo nivel, el modelo realiza razonamiento basado en grafos a través de tablas. Utilizando relaciones de claves foráneas, conecta los datos de diferentes partes de la base de datos, como vincular un perfil de cliente a su historial de compras o patrones de comportamiento, e identifica señales entre tablas que de otro modo se perderían.
En el tercer nivel, el modelo incorpora atención entre muestras, lo que le permite aprender de múltiples ejemplos al mismo tiempo. Esto le permite generalizar a partir de un número relativamente pequeño de ejemplos de contexto, en lugar de requerir conjuntos de datos de entrenamiento completos.
Este diseño por etapas es fundamental. Evita la explosión computacional que ocurriría al procesar todos los puntos de datos simultáneamente, mientras también mejora la precisión al filtrar el ruido antes de que ocurra un razonamiento más profundo.
Aprendizaje en contexto reemplaza la capacitación
Una característica definitoria de KumoRFM-2 es su dependencia del aprendizaje en contexto en lugar de la capacitación tradicional.
En lugar de capacitar un modelo para cada tarea, KumoRFM-2 se preentrena una sola vez en una gran mezcla de datos sintéticos y datos del mundo real relacionales. Cuando un usuario envía una solicitud de predicción, el sistema genera automáticamente un conjunto de ejemplos de contexto, subgrafos de la base de datos emparejados con resultados conocidos.
Estos ejemplos actúan como orientación para el modelo, lo que le permite inferir patrones y producir predicciones sin actualizar sus pesos. En la práctica, esto significa:
- Ninguna capacitación específica de tarea
- Ninguna ingeniería de características
- Ningún ajuste de modelo
Incluso con tan solo el 0,2% de los datos que normalmente se requieren para el aprendizaje supervisado, el modelo puede lograr un rendimiento de clase mundial.
Rendimiento en benchmarks del mundo real
KumoRFM-2 ha sido evaluado en 41 tareas predictivas que abarcan industrias como el comercio electrónico, la atención médica, las plataformas sociales y los sistemas empresariales.
El modelo supera consistentemente los enfoques de aprendizaje automático supervisado tradicionales, incluidos conjuntos de modelos diseñados y sistemas de aprendizaje profundo relacionales. En benchmarks empresariales, supera las soluciones ampliamente utilizadas por márgenes significativos, y también mejora cuando se ajusta.
Más allá de la precisión cruda, el modelo demuestra una gran robustez:
- Mantiene el rendimiento incluso cuando se pierden grandes porciones de enlaces relacionales
- Maneja datos ruidosos o incompletos con una degradación mínima
- Funciona bien en escenarios de inicio en frío donde los datos históricos son limitados
Esta resistencia es particularmente importante en entornos empresariales, donde la calidad de los datos a menudo es inconsistente.
Construido para escala: hasta 500 mil millones de filas
KumoRFM-2 está diseñado para operar a la escala de la infraestructura de datos moderna.
El sistema puede procesar conjuntos de datos que exceden los 500 mil millones de filas combinando la ejecución nativa de la base de datos con un motor de grafos personalizado capaz de acceso de datos de alta velocidad. En lugar de mover los datos a un sistema de ML separado, la computación se ejecuta directamente donde reside la base de datos, ya sea en bases de datos SQL o almacenes de datos en la nube.
Este enfoque reduce la latencia, simplifica la implementación y permite a las organizaciones integrar capacidades predictivas directamente en los flujos de trabajo existentes.
Lenguaje natural como interfaz
Otra característica definitoria es la interfaz de lenguaje natural del modelo.
Los usuarios pueden hacer preguntas como:
- ¿Qué clientes probablemente abandonarán en los próximos 30 días?
- ¿Qué prospectos son más propensos a convertirse?
- ¿Qué productos verán una mayor demanda?
El sistema traduce estas consultas en lógica predictiva estructurada, las ejecuta en los datos subyacentes y devuelve tanto predicciones como explicaciones.
Esto no solo hace que el análisis predictivo sea más accesible, sino que también permite la integración con agentes de IA, donde las predicciones se pueden incrustar en flujos de trabajo de toma de decisiones automatizados.
Hacia la inteligencia empresarial impulsada por agentes
KumoRFM-2 está diseñado con agentes en mente.
Sus capacidades predictivas se pueden exponer como “habilidades” modulares que los agentes de IA pueden llamar como parte de flujos de trabajo más grandes. Esto convierte el modelado predictivo en un bloque de construcción componible, algo que se puede combinar con recuperación, razonamiento y ejecución en sistemas autónomos.
En este contexto, el modelo no es solo una herramienta para analistas, sino una capa fundamental para la automatización empresarial de próxima generación.
Redefiniendo el papel de la ciencia de datos
KumoRFM-2 señala un cambio más amplio en la forma en que las organizaciones abordan la ciencia de datos.
En lugar de construir y mantener docenas de modelos específicos de tarea, los equipos pueden confiar en un solo sistema general que se adapta a nuevos problemas instantáneamente. Esto reduce la necesidad de experiencia especializada en ingeniería de características y ajuste de modelos, mientras permite una experimentación y iteración más rápidas.
Para muchas organizaciones, esto podría significar moverse de una función de ciencia de datos centralizada a un modelo más distribuido, donde las perspectivas predictivas son accesibles en varios departamentos.
Una nueva categoría de modelos de base
Si bien los modelos de base ya han transformado dominios como el lenguaje y la visión, los datos empresariales estructurados han seguido siendo una de las últimas fronteras.
KumoRFM-2 representa un ejemplo temprano de lo que pueden lograr los modelos de base especializados para datos estructurados. Al combinar razonamiento relacional, aprendizaje en contexto y interacción de lenguaje natural, introduce un nuevo paradigma para la IA predictiva.
Si se adopta ampliamente, este enfoque podría redefinir la forma en que las empresas interactúan con sus datos, convirtiendo el análisis predictivo de un proceso complejo y demorado en una capacidad en tiempo real y organizacional.










