Анонсы
Kumo Запускает KumoRFM-2, Основную Модель, Созданную для Замены Традиционного Энтерпрайз-Машинного Обучения

Kumo представила KumoRFM-2, модель следующего поколения, предназначенную специально для структурированных энтерпрайз-данных, что означает фундаментальный сдвиг в том, как организации генерируют прогнозы из своих хранилищ данных. В отличие от традиционных конвейеров машинного обучения, которые требуют месяцев для инженерии функций и разработки пользовательских моделей, KumoRFM-2 позволяет командам генерировать прогнозы мгновенно с помощью естественного языка, без обучения или специализированных знаний.
В своей основе модель представляет собой новую категорию ИИ: реляционную основную модель, которая работает直接 с энтерпрайз-структурами данных, а не упрощает их в таблицы. Это различие устраняет одно из наиболее постоянных ограничений в энтерпрайз-ИИ, где ценные отношения между наборами данных часто теряются до начала моделирования.
От Статических Конвейеров к Системам Реального Времени
Энтерпрайз-предсказательный анализ исторически был медленным и ресурсоемким. Каждый новый случай — будь то прогноз оттока, обнаружение мошенничества или прогноз спроса — обычно требует отдельного конвейера, включающего очистку данных, инженерию функций, обучение модели и настройку.
KumoRFM-2 заменяет весь этот рабочий процесс на одну, предварительно обученную систему.
Вместо построения моделей пользователи определяют, что они хотят предсказать. Модель интерпретирует запрос,构рует необходимый контекст из базы данных и производит прогнозы в один проход. Это становится возможным благодаря комбинации обучения в контексте и декларативного интерфейса, называемого Предсказательным Запросом (PQL), где пользователи выражают результат, который их интересует, а не шаги, необходимые для его вычисления.
Результатом является сдвиг от «построения моделей» к «задаванию вопросов» — изменение, которое значительно снижает барьер для использования предсказательного ИИ во всей организации.
Почему Реляционные Данные Были Так Трудны
Большинство существующих систем ИИ испытывают трудности со структурированными энтерпрайз-данными по простой причине: они обрабатывают их неправильно.
Традиционные модели, включая многие табличные системы ИИ и даже большие языковые модели, полагаются на упрощение данных в одну таблицу. Но реальные энтерпрайз-данные существуют как взаимосвязанные системы — клиенты, связанные с транзакциями, транзакции, связанные с продуктами, продукты, связанные с запасами, все меняющиеся со временем.
Упрощение этой структуры удаляет отношения, которые часто содержат наиболее ценные предсказательные сигналы. Это также заставляет команды вручную воссоздавать эти сигналы через инженерию функций, процесс, который является как thờiязатным, так и склонным к ошибкам.
KumoRFM-2 избегает этого полностью, работая напрямую с реляционными базами данных, сохраняя связи между таблицами, метками времени и сущностями.
Внутри Архитектуры: Как Работает KumoRFM-2
Ключевым нововведением за KumoRFM-2 является его иерархическая Реляционная Граф-Трансформерная Архитектура, которая обрабатывает данные на нескольких уровнях одновременно.
На первом уровне модель анализирует отдельные таблицы с помощью комбинации строкового и столбцового внимания. Это позволяет ей понять, как функции относятся внутри таблицы, фильтруя ненужные или шумовые данные на ранней стадии. Важно, что цель прогноза вводится на этом этапе, что означает, что модель обусловлена задачей с самого начала.
На втором уровне модель выполняет графическое рассуждение между таблицами. Используя внешние ключевые отношения, она соединяет данные из разных частей базы данных — такие как связь профиля клиента с историей покупок или поведенческими закономерностями — и выявляет межтаблицные сигналы, которые в противном случае были бы потеряны.
На третьем уровне модель включает межобразцовое внимание, позволяя ей учиться на нескольких примерах одновременно. Это позволяет ей обобщать из относительно небольшого числа контекстных примеров, а не требовать полных обучающих наборов данных.
Этот ступенчатый дизайн является критическим. Он избегает вычислительного взрыва, который возник бы при обработке каждого данных одновременно, а также улучшает точность, фильтруя шум до более глубокого рассуждения.
Обучение в Контексте Заменяет Обучение
Определяющей особенностью KumoRFM-2 является его зависимость от обучения в контексте вместо традиционного обучения.
Вместо обучения модели для каждой задачи KumoRFM-2 предварительно обучается один раз на большом наборе синтетических и реальных реляционных данных. Когда пользователь отправляет запрос на прогноз, система автоматически генерирует набор контекстных примеров — небольшие подграфы базы данных, объединенные с известными результатами.
Эти примеры служат руководством для модели, позволяя ей вывести закономерности и производить прогнозы без обновления своих весов. На практике это означает:
- Нет задачеспецифического обучения
- Нет инженерии функций
- Нет настройки модели
Даже с таким небольшим количеством данных, как 0,2% от того, что обычно требуется для обучения с учителем, модель может достичь результатов на уровне состояния искусства.
Производительность на Реальных Бенчмарках
KumoRFM-2 был оценен на 41 предсказательной задаче, охватывающей отрасли, такие как электронная коммерция, здравоохранение, социальные платформы и энтерпрайз-системы.
Модель последовательно превосходит традиционные подходы к машинному обучению с учителем, включая разработанные ансамбли и реляционные глубокие системы обучения. На энтерпрайз-бенчмарках она превосходит широко используемые решения на значительные отрывы, а также улучшает результаты при тонкой настройке.
Помимо сырой точности, модель демонстрирует сильную устойчивость:
- Сохраняет производительность даже при отсутствии больших частей реляционных связей
- Обрабатывает шумовые или неполные данные с минимальным ухудшением
- Работает хорошо в холодных стартовых сценариях, где исторические данные ограничены
Эта устойчивость особенно важна в энтерпрайз-средах, где качество данных часто бывает непоследовательным.
Создан для Масштаба: До 500 Миллиардов Строк
KumoRFM-2 предназначен для работы на уровне современной инфраструктуры данных.
Система может обрабатывать наборы данных, превышающие 500 миллиардов строк, сочетая выполнение, родное для базы данных, с пользовательским графическим движком, способным обеспечить высокопроизводительный доступ к данным. Вместо перемещения данных в отдельную систему машинного обучения вычисления передаются напрямую туда, где находятся данные — будь то SQL-базы данных или облачные хранилища данных.
Этот подход снижает задержку, упрощает развертывание и позволяет организациям интегрировать предсказательные возможности непосредственно в существующие рабочие процессы.
Естественный Язык в качестве Интерфейса
Другой определяющей особенностью является естественно-языковый интерфейс модели.
Пользователи могут задавать вопросы, такие как:
- Какие клиенты, вероятно, откажутся в течение следующих 30 дней?
- Какие лиды наиболее вероятно конвертируются?
- Какие продукты увидят увеличение спроса?
Система переводит эти запросы в структурированную предсказательную логику, выполняет их на базе данных и возвращает как прогнозы, так и объяснения.
Это не только делает предсказательный анализ более доступным, но и позволяет интегрировать его с агентами ИИ, где прогнозы могут быть встроены в автоматические рабочие процессы принятия решений.
К Энтерпрайз-Интеллекту, Основанному на Агентах
KumoRFM-2 предназначен с учетом агентов.
Его предсказательные возможности могут быть представлены как модульные «навыки», которые агенты ИИ могут вызывать в рамках более крупных рабочих процессов. Это превращает предсказательное моделирование в составную строительную блок — что-то, что можно объединить с извлечением, рассуждением и выполнением в автономных системах.
В этом контексте модель не является просто инструментом для аналитиков, но и основным слоем для следующего поколения энтерпрайз-автоматизации.
Переопределение Роли Науки о Данных
KumoRFM-2 сигнализирует о более широком сдвиге в том, как организации подходят к науке о данных.
Вместо построения и поддержания десятков задачеспецифических моделей команды могут полагаться на одну, общую систему, которая адаптируется к новым проблемам мгновенно. Это снижает необходимость в специализированных знаниях в области инженерии функций и настройки модели, а также позволяет быстрее экспериментировать и итерировать.
Для многих организаций это может означать переход от централизованной функции науки о данных к более распределенной модели, где предсказательные идеи доступны во множестве отделов.
Новая Категория Основных Моделей
Хотя основные модели уже преобразовали области, такие как язык и зрение, структурированные энтерпрайз-данные остаются одной из последних границ.
KumoRFM-2 представляет собой ранний пример того, чего могут достичь специализированные основные модели для структурированных данных. Объединив реляционное рассуждение, обучение в контексте и естественно-языковое взаимодействие, он вводит новую парадигму для предсказательного ИИ.
Если он будет широко принят, этот подход может переопределить, как бизнес взаимодействует со своими данными — превращая предсказательный анализ из сложного, задержанного процесса в реальное, организационное умение.










