Aankondigingen
Kumo lanceert KumoRFM-2, een foundation model ontwikkeld om traditionele enterprise machine learning te vervangen

Kumo heeft KumoRFM-2 onthuld, een next-generation foundation model speciaal ontwikkeld voor gestructureerde enterprise data—wat een fundamentele verschuiving markeert in hoe organisaties voorspellingen genereren uit hun data warehouses. In tegenstelling tot traditionele machine learning-pijplijnen die maanden van feature engineering en aangepaste modelontwikkeling vereisen, maakt KumoRFM-2 het mogelijk voor teams om voorspellingen instant te genereren met behulp van natuurlijke taal, zonder training of gespecialiseerde expertise.
Aan de basis vertegenwoordigt het model een nieuwe categorie van AI: een relationeel foundation model dat rechtstreeks op enterprise data structuren werkt in plaats van deze te vereenvoudigen tot vereenvoudigde tabellen. Dit onderscheid adresseert een van de meest persistente beperkingen in enterprise AI, waardevolle relaties tussen datasets vaak verloren gaan voordat het modelleren zelfs maar begint.
Van statische pijplijnen naar real-time predictieve systemen
Enterprise predictieve analytics is historisch gezien langzaam en resource-intensief geweest. Elk nieuw gebruikscase—of het nu om churn predictie, fraude detectie of vraagvoorspelling gaat—vereist typisch een aparte pijplijn, met data schoonmaken, feature engineering, model training en afstemming.
KumoRFM-2 vervangt die hele workflow met een enkel, vooraf getraind systeem.
In plaats van modellen te bouwen, definiëren gebruikers wat ze willen voorspellen. Het model interpreteert de aanvraag, construeert de noodzakelijke context uit de onderliggende database en produceert voorspellingen in één pas. Dit wordt mogelijk gemaakt door een combinatie van in-context leren en een declaratieve interface genaamd Predictive Query Language (PQL), waarin gebruikers het resultaat uitdrukken dat ze belangrijk vinden in plaats van de stappen die nodig zijn om het te berekenen.
Het resultaat is een verschuiving van “modellen bouwen” naar “vragen stellen”—een verandering die de drempel voor het gebruik van predictieve AI binnen een organisatie aanzienlijk verlaagt.
Waarom relationele data zo moeilijk is geweest
De meeste bestaande AI-systemen hebben moeite met gestructureerde enterprise data om een eenvoudige reden: ze behandelen het onjuist.
Traditionele modellen, waaronder veel tabulaire AI-systemen en zelfs grote taalmodellen, vertrouwen op het vereenvoudigen van data tot één tabel. Maar echte enterprise data bestaat als verbonden systemen—klanten gekoppeld aan transacties, transacties gekoppeld aan producten, producten gekoppeld aan voorraad, allemaal in de loop van de tijd evoluerend.
Het vereenvoudigen van deze structuur verwijdert de relaties die vaak de meest waardevolle predictieve signalen bevatten. Het dwingt teams ook om deze signalen handmatig te herscheppen door middel van feature engineering, een proces dat zowel tijdrovend als gevoelig voor fouten is.
KumoRFM-2 vermijdt dit volledig door rechtstreeks op relationele databases te werken, waardoor verbindingen tussen tabellen, tijdstempels en entiteiten behouden blijven.
Binnen de architectuur: hoe KumoRFM-2 werkt
De sleutelinnovatie achter KumoRFM-2 is zijn hiërarchische Relational Graph Transformer architectuur, die data op meerdere niveaus tegelijk verwerkt.
Op het eerste niveau analyseert het model individuele tabellen met behulp van een combinatie van rij- en kolom aandacht. Dit stelt het in staat om te begrijpen hoe functies binnen een tabel samenhangen, terwijl onbelangrijke of lawaaierige data vroeg in het proces worden gefilterd. Belangrijk is dat het predictie doel op dit stadium wordt geïntroduceerd, wat betekent dat het model vanaf het begin wordt geconditioneerd op de taak.
Op het tweede niveau voert het model grafische redenering uit over tabellen. Met behulp van foreign key-relaties verbindt het data uit verschillende delen van de database—zoals het koppelen van een klantprofiel aan aankoopgeschiedenis of gedragspatronen—and identificeert het cross-table signalen die anders verloren zouden gaan.
Op het derde niveau incorporeert het model cross-sample aandacht, waardoor het in staat is om van meerdere voorbeelden tegelijk te leren. Dit stelt het in staat om te generaliseren van een relatief klein aantal context voorbeelden, in plaats van volledige trainingsdatasets te vereisen.
Dit gefaseerde ontwerp is kritiek. Het voorkomt de computationele explosie die zou optreden bij het verwerken van elke datapunt tegelijk, en verbetert de nauwkeurigheid door ruis te filteren voordat dieper redeneren plaatsvindt.
In-context leren vervangt training
Een kenmerkend kenmerk van KumoRFM-2 is zijn vertrouwen op in-context leren in plaats van traditionele training.
In plaats van een model voor elke taak te trainen, is KumoRFM-2 eenmaal vooraf getraind op een grote mix van synthetische en echte relationele data. Wanneer een gebruiker een predictie aanvraag indient, genereert het systeem automatisch een set context voorbeelden—kleine subgrafieken van de database gekoppeld aan bekende resultaten.
Deze voorbeelden dienen als richtlijn voor het model, waardoor het patronen kan afleiden en voorspellingen kan produceren zonder zijn gewichten bij te werken. In de praktijk betekent dit:
- Geen taak-specifieke training
- Geen feature engineering
- Geen model afstemming
Zelfs met zo weinig als 0,2% van de data die typisch nodig is voor supervised learning, kan het model state-of-the-art prestaties bereiken.
Prestaties over real-world benchmarks
KumoRFM-2 is geëvalueerd over 41 predictieve taken die zich uitstrekken over industrieën zoals e-commerce, gezondheidszorg, sociale platforms en enterprise systemen.
Het model presteert consistent beter dan traditionele supervised machine learning benaderingen, waaronder geëngineerde ensembles en relationele deep learning systemen. Op enterprise benchmarks overtreft het breed gebruikt oplossingen met aanzienlijke marges, en verbetert het zich verder wanneer het wordt gefinetuned.
Naast brute nauwkeurigheid toont het model sterke robuustheid:
- Blijft presteren zelfs wanneer grote delen van relationele links ontbreken
- Verwerkt lawaaierige of onvolledige data met minimale degradatie
- Presteert goed in cold-start scenario’s waar historische data beperkt is
Deze veerkracht is vooral belangrijk in enterprise omgevingen, waar datakwaliteit vaak inconsistent is.
Ontworpen voor schaal: tot 500 miljard rijen
KumoRFM-2 is ontworpen om te functioneren op de schaal van moderne data-infrastructuur.
Het systeem kan datasets verwerken die meer dan 500 miljard rijen bevatten door database-native uitvoering te combineren met een aangepaste grafische engine die hoogdoorvoer data-toegang mogelijk maakt. In plaats van data te verplaatsen naar een apart ML-systeem, wordt de berekening rechtstreeks naar de locatie van de data verplaatst—of het nu in SQL-databases of cloud data warehouses zit.
Deze benadering vermindert latentie, vereenvoudigt implementatie en stelt organisaties in staat om predictieve functionaliteiten rechtstreeks in bestaande workflows te integreren.
Natuurlijke taal als interface
Een ander kenmerkend kenmerk is het natuurlijke taal interface van het model.
Gebruikers kunnen vragen stellen zoals:
- Welke klanten zullen waarschijnlijk binnen 30 dagen churnen?
- Welke leads zijn het meest waarschijnlijk om te converteren?
- Welke producten zullen een toename van de vraag zien?
Het systeem vertaalt deze queries naar gestructureerde predictieve logica, voert ze uit op de onderliggende data en retourneert zowel voorspellingen als verklaringen.
Dit maakt niet alleen predictieve analytics meer toegankelijk, maar stelt ook integratie met AI-agents mogelijk, waar voorspellingen kunnen worden ingebed in geautomatiseerde beslissingswerkstromen.
Naar agent-gedreven enterprise intelligentie
KumoRFM-2 is ontworpen met agents in gedachten.
De predictieve capaciteiten kunnen worden blootgesteld als modulaire “vaardigheden” die AI-agents kunnen aanroepen als onderdeel van grotere workflows. Dit verandert predictief modelleren in een componeren bouwsteen—iets dat kan worden samengesteld met retrieval, redenering en uitvoering in autonome systemen.
In deze context is het model niet alleen een instrument voor analisten, maar een fundamentale laag voor next-generation enterprise automatisering.
De rol van data science herdefiniëren
KumoRFM-2 markeert een bredere verschuiving in hoe organisaties data science benaderen.
In plaats van tientallen taak-specifieke modellen te bouwen en te onderhouden, kunnen teams vertrouwen op een enkel, algemeen doel systeem dat zich aanpast aan nieuwe problemen in een oogwenk. Dit vermindert de behoefte aan gespecialiseerde expertise in feature engineering en model afstemming, en maakt snellere experimenten en iteratie mogelijk.
Voor veel organisaties kan dit betekenen dat ze overstappen van een centrale data science functie naar een meer gedistribueerd model, waar predictieve inzichten toegankelijk zijn voor meerdere afdelingen.
Een nieuwe categorie van foundation modellen
Terwijl foundation modellen al domeinen zoals taal en visie hebben getransformeerd, is gestructureerde enterprise data een van de laatste frontiers gebleven.
KumoRFM-2 vertegenwoordigt een vroeg voorbeeld van wat gespecialiseerde foundation modellen voor gestructureerde data kunnen bereiken. Door relationele redenering, in-context leren en natuurlijke taal interactie te combineren, introduceert het een nieuw paradigma voor predictieve AI.
Als dit breed wordt geadopteerd, kan deze benadering bepalen hoe bedrijven met hun data omgaan—predictieve analytics veranderen van een complex, vertraagd proces naar een real-time, organisatie-brede capaciteit.










