Анонсы
Kumo Запускает KumoRFM-2, Основную Модель, Созданную для Замены Традиционного Энтерпрайз-Машинного Обучения

Kumo представила KumoRFM-2, следующее поколение основной модели, специально разработанной для структурированных энтерпрайз-данных — что означает фундаментальный сдвиг в том, как организации генерируют прогнозы из своих хранилищ данных. В отличие от традиционных машинных обучающих конвейеров, которые требуют месяцев для инженерии функций и разработки настраиваемых моделей, KumoRFM-2 позволяет командам генерировать прогнозы мгновенно с помощью естественного языка, без обучения или специализированной экспертизы.
В своей основе модель представляет собой новый класс ИИ: реляционную основную модель, которая работает напрямую с энтерпрайз-структурами данных, а не упрощает их в таблицы. Это различие устраняет одно из наиболее постоянных ограничений в энтерпрайз-ИИ, где ценные отношения между наборами данных часто теряются до начала моделирования.
От Статических Конвейеров к Системам Прогнозирования в Реальном Времени
Энтерпрайз-прогнозная аналитика исторически была медленной и ресурсоёмкой. Каждый новый случай использования — будь то прогнозирование отказов, обнаружение мошенничества или прогнозирование спроса — обычно требует отдельного конвейера, включающего очистку данных, инженерию функций, обучение модели и настройку.
KumoRFM-2 заменяет весь этот рабочий процесс на одну, предварительно обученную систему.
Вместо построения моделей пользователи определяют, что они хотят прогнозировать. Модель интерпретирует запрос, строит необходимый контекст из базы данных и производит прогнозы за один проход. Это становится возможным благодаря комбинации обучения в контексте и декларативного интерфейса, называемого языком прогнозирования (PQL), где пользователи выражают результат, который их интересует, а не шаги, необходимые для его вычисления.
Результатом является сдвиг от «построения моделей» к «задаванию вопросов» — изменение, которое значительно снижает барьер для использования прогнозного ИИ во всей организации.
Почему Реляционные Данные Были Так Трудны
Большинство существующих систем ИИ испытывают трудности со структурированными энтерпрайз-данными по простой причине: они обрабатывают их неправильно.
Традиционные модели, включая многие табличные системы ИИ и даже большие языковые модели, полагаются на упрощение данных в одну таблицу. Но реальные энтерпрайз-данные существуют как взаимосвязанные системы — клиенты, связанные с транзакциями, транзакции, связанные с продуктами, продукты, связанные с запасами, все развивающиеся во времени.
Упрощение этой структуры удаляет отношения, которые часто содержат наиболее ценные прогнозные сигналы. Это также заставляет команды вручную воссоздавать эти сигналы через инженерию функций, процесс, который является как耗ящим время, так и склонным к ошибкам.
KumoRFM-2 полностью избегает этого, работая напрямую с реляционными базами данных, сохраняя связи между таблицами, временными метками и сущностями.
Внутри Архитектуры: Как Работает KumoRFM-2
Ключевым нововведением за KumoRFM-2 является его иерархическая реляционная графовая архитектура трансформеров, которая обрабатывает данные на нескольких уровнях одновременно.
На первом уровне модель анализирует отдельные таблицы с помощью комбинации строкового и столбцового внимания. Это позволяет ей понять, как функции относятся внутри таблицы, фильтруя ненужные или шумовые данные на ранней стадии. Важно, что цель прогнозирования вводится на этой стадии, что означает, что модель обусловлена задачей с самого начала.
На втором уровне модель выполняет графическое рассуждение между таблицами. Используя внешние ключевые отношения, она соединяет данные из разных частей базы данных — такие как связь профиля клиента с историей покупок или поведенческими закономерностями — и выявляет межтаблицные сигналы, которые в противном случае были бы потеряны.
На третьем уровне модель включает межобразцовое внимание, позволяя ей учиться на нескольких примерах одновременно. Это позволяет ей обобщать из относительно небольшого количества контекстных примеров, а не требовать полных обучающих наборов данных.
Этот многоступенчатый дизайн имеет решающее значение. Он избегает вычислительного взрыва, который возник бы при обработке каждого пункта данных одновременно, а также улучшает точность, фильтруя шум перед более глубоким рассуждением.
Обучение в Контексте Заменяет Обучение
Определяющей чертой KumoRFM-2 является его зависимость от обучения в контексте вместо традиционного обучения.
Вместо обучения модели для каждой задачи KumoRFM-2 обучается один раз на большом наборе синтетических и реальных реляционных данных. Когда пользователь отправляет запрос на прогнозирование, система автоматически генерирует набор контекстных примеров — небольшие подграфы базы данных, объединенные с известными результатами.
Эти примеры служат руководством для модели, позволяя ей выводить закономерности и производить прогнозы без обновления своих весов. На практике это означает:
- Нет обучения для конкретной задачи
- Нет инженерии функций
- Нет настройки модели
Даже с таким небольшим количеством данных, как 0,2% от того, что обычно требуется для обучения с учителем, модель может достичь уровня лучших в мире результатов.
Производительность на Реальных Бенчмарках
KumoRFM-2 был оценен на 41 прогнозной задаче, охватывающей отрасли, такие как электронная коммерция, здравоохранение, социальные платформы и энтерпрайз-системы.
Модель последовательно превосходит традиционные подходы к машинному обучению с учителем, включая разработанные ансамбли и реляционные глубокие системы обучения. На энтерпрайз-бенчмарках он превосходит широко используемые решения значительными отрывами, а также улучшается при тонкой настройке.
Помимо сырой точности, модель демонстрирует сильную устойчивость:
- Сохраняет производительность даже при отсутствии больших участков реляционных связей
- Обрабатывает шумовые или неполные данные с минимальным ухудшением
- Функционирует хорошо в сценариях «холодного старта», где исторические данные ограничены
Эта стойкость особенно важна в энтерпрайз-средах, где качество данных часто не последовательное.
Разработан для Масштаба: До 500 Миллиардов Строк
KumoRFM-2 разработан для работы на уровне современной инфраструктуры данных.
Система может обрабатывать наборы данных, превышающие 500 миллиардов строк, объединяя выполнение, родное для базы данных, с пользовательским графовым движком, способным обеспечивать высокопроизводительный доступ к данным. Вместо перемещения данных в отдельную систему машинного обучения вычисления推аются напрямую туда, где находятся данные — будь то SQL-базы данных или облачные хранилища данных.
Этот подход снижает задержку, упрощает развертывание и позволяет организациям интегрировать прогнозные возможности直接 в существующие рабочие процессы.
Естественный Язык в качестве Интерфейса
Другой определяющей чертой является естественный языковый интерфейс модели.
Пользователи могут задавать вопросы, такие как:
- Какие клиенты, вероятно, откажутся в течение следующих 30 дней?
- Какие лиды наиболее вероятно конвертируются?
- Какие продукты будут иметь увеличенный спрос?
Система переводит эти запросы в структурированную прогнозную логику, выполняет их на базе данных и возвращает как прогнозы, так и объяснения.
Это не только делает прогнозную аналитику более доступной, но также позволяет интегрировать ее с ИИ-агентами, где прогнозы могут быть встроены в автоматические рабочие процессы принятия решений.
К Агентно-Ориентированному Энтерпрайз-Интеллекту
KumoRFM-2 разработан с учетом агентов.
Его прогнозные возможности могут быть представлены как модульные «навыки», которые ИИ-агенты могут вызывать в рамках более крупных рабочих процессов. Это превращает прогнозное моделирование в составную строительную единицу — что-то, что можно объединить с извлечением, рассуждением и выполнением в автономных системах.
В этом контексте модель не является просто инструментом для аналитиков, но и основным слоем для следующего поколения энтерпрайз-автоматизации.
Переопределение Роли Науки о Данных
KumoRFM-2 сигнализирует о более широком сдвиге в том, как организации подходят к науке о данных.
Вместо построения и поддержки десятков моделей для конкретных задач команды могут полагаться на одну, общую систему, которая адаптируется к новым проблемам мгновенно. Это снижает потребность в специализированной экспертизе в инженерии функций и настройке модели, а также позволяет быстрее экспериментировать и итерировать.
Для многих организаций это может означать переход от централизованной функции науки о данных к более распределенной модели, где прогнозные идеи доступны в нескольких отделах.
Новая Категория Основных Моделей
Хотя основные модели уже преобразовали области, такие как язык и зрение, структурированные энтерпрайз-данные остались одной из последних границ.
KumoRFM-2 представляет собой ранний пример того, чего могут достичь специализированные основные модели для структурированных данных. Объединяя реляционное рассуждение, обучение в контексте и естественный языковый интерфейс, он вводит новую парадигму для прогнозного ИИ.
Если этот подход будет широко принят, он может переопределить, как бизнес взаимодействует со своими данными — превращая прогнозную аналитику из сложного, задержанного процесса в реальное, организационное умение.












