Оголошення

Kumo запускає KumoRFM-2, фундаментальну модель, розроблену для заміни традиційного корпоративного машинного навчання

mm

Kumo представила KumoRFM-2, наступне покоління фундаментальної моделі, спеціально розробленої для структурованих корпоративних даних, що означає фундаментальну зміну того, як організації генерують прогнози з своїх даних. На відміну від традиційних машинних моделей навчання, які вимагають місяців інженерії функцій і розробки моделей, KumoRFM-2 дозволяє командам генерувати прогнози миттєво за допомогою природної мови, без навчання чи спеціалізованої експертизи.

У своєму ядрі модель представляє нову категорію ІІ: реляційну фундаментальну модель, яка працює безпосередньо з корпоративними структурами даних, а не спрощує їх у таблиці. Ця відмінність вирішує одну з найбільш постійних обмежень корпоративного ІІ, де цінні зв’язки між наборами даних часто втрачаються до початку моделювання.

Від статичних трубопроводів до системи прогнозування в реальному часі

Корпоративна прогнозна аналітика історично була повільною і ресурсоємною. Кожний новий випадок використання – чи то прогнозування відходу клієнтів, виявлення шахрайства чи прогнозування попиту – зазвичай вимагає окремого трубопроводу, що включає очистку даних, інженерію функцій, навчання моделі та налаштування.

KumoRFM-2 заміняє весь цей робочий процес на одну попередньо натреновану систему.

Замість будівництва моделей користувачі визначають, що вони хочуть спрогнозувати. Модель інтерпретує запит, будує необхідний контекст з бази даних та генерує прогнози в одному проході. Це стало можливим завдяки поєднанню навчання в контексті та декларативного інтерфейсу під назвою Predictive Query Language (PQL), де користувачі виражають результат, який їх турбує, а не кроки, необхідні для його обчислення.

Результатом є зміна від “будівництва моделей” до “питання” – зміна, яка суттєво знижує бар’єр для використання прогнозного ІІ по всій організації.

Чому реляційні дані були так складні

Більшість існуючих систем ІІ борються зі структурованими корпоративними даними з простої причини: вони обробляють їх неправильно.

Традиційні моделі, включаючи багато табличних систем ІІ та навіть великі мовні моделі, покладаються на спрощення даних у одну таблицю. Але реальні корпоративні дані існують у вигляді взаємопов’язаних систем – клієнти, пов’язані з транзакціями, транзакції, пов’язані з продуктами, продукти, пов’язані з запасами, все це розвивається з часом.

Спрощення цієї структури видаляє зв’язки, які часто містять найбільш цінні прогнозні сигнали. Це також змушує команди ручно відтворювати ці сигнали через інженерію функцій, процес, який є як тривалим, так і схильним до помилок.

KumoRFM-2 уникнути цього зовсім, працюючи безпосередньо з реляційними базами даних, зберігаючи зв’язки між таблицями, таймстампами та сутностями.

Усередині архітектури: як працює KumoRFM-2

Ключова інновація за KumoRFM-2 – це його ієрархічна реляційна графова архітектура трансформерів, яка обробляє дані на декількох рівнях одночасно.

На першому рівні модель аналізує окремі таблиці за допомогою комбінації уваги рядків і стовпців. Це дозволяє їй зрозуміти, як функції пов’язані всередині таблиці, а також фільтрує неважливі або шумові дані на початку процесу. Насправді, ціль прогнозування вводиться на цьому етапі, що означає, що модель умовлена завданням з самого початку.

На другому рівні модель виконує графічний розсудливість між таблицями. Використовуючи зовнішні ключові зв’язки, вона з’єднує дані з різних частин бази даних – наприклад, зв’язуючи профіль клієнта з історією покупок або поведінкими моделями – і визначає міжтабличні сигнали, які інакше були б втрачені.

На третьому рівні модель включає увагу між зразками, що дозволяє їй вивчати кілька прикладів одночасно. Це дозволяє їй узагальнювати з відносно малої кількості контекстних прикладів, а не вимагати повних навчальних наборів даних.

Цей етапований дизайн є критичним. Він уникнути комп’ютерного вибуху, який би виник з обробки кожного пункту даних одночасно, а також покращує точність, фільтруючи шум до глибшого розсудливості.

Навчання в контексті заміняє навчання

Визначальною особливістю KumoRFM-2 є його залежність від навчання в контексті замість традиційного навчання.

Замість навчання моделі для кожної задачі KumoRFM-2 попередньо натренована один раз на великому змішаному синтетичних та реальних реляційних даних. Коли користувач надсилає запит на прогнозування, система автоматично генерує набір контекстних прикладів – малих підграфів бази даних, поєднаних з відомими результатами.

Ці приклади діють як керівництво для моделі, дозволяючи їй виводити закономірності та генерувати прогнози без оновлення її ваг. На практиці це означає:

  • Немає завдання-специфічного навчання
  • Немає інженерії функцій
  • Немає налаштування моделі

Дажи з такою малиною кількістю даних, як 0,2% від тих, які зазвичай потрібні для нагляду за навчанням, модель може досягти найвищої продуктивності.

Продуктивність по реальним бенчмаркам

KumoRFM-2 був оцінений по 41 прогнозній задачі, що охоплюють галузі, такі як електронна комерція, охорона здоров’я, соціальні платформи та корпоративні системи.

Модель постійно перевершує традиційні підходи до машинного навчання з наглядом, включаючи інженерні ансамблі та реляційні глибинні системи навчання. На корпоративних бенчмарках він перевершує широко використовувані рішення на значні відстані, а також покращується при тонкому налаштуванні.

Поза сутою точністю модель демонструє сильну стійкість:

  • Зберігає продуктивність навіть тоді, коли великі частини реляційних зв’язків відсутні
  • Обробляє шумові або неповні дані з мінімальною деградацією
  • Виконує добре в сценаріях “холодного старту”, де історичні дані обмежені

Ця стійкість особливо важлива в корпоративних середовищах, де якість даних часто є нестійкою.

Розроблений для масштабу: до 500 мільярдів рядків

KumoRFM-2 розроблений для роботи в масштабі сучасної інфраструктури даних.

Система може обробляти набори даних, що перевищують 500 мільярдів рядків, поєднуючи виконання бази даних з настраїваним графовим двигуном, здатним забезпечувати високопродуктивний доступ до даних. Замість переміщення даних у окрему систему МО, обчислення здійснюється безпосередньо там, де знаходяться дані – чи то в базах даних SQL, чи в хмарних сховищах даних.

Цей підхід знижує затримку, спрощує розгортання та дозволяє організаціям інтегрувати прогнозні можливості безпосередньо в існуючі робочі процеси.

Природна мова як інтерфейс

Іншою визначальною особливістю є інтерфейс моделі природної мови.

Користувачі можуть ставити питання, такі як:

  • Які клієнти найімовірніше відмовляться у найближчі 30 днів?
  • Які ліди найімовірніше конвертуються?
  • Які продукти побачать збільшення попиту?

Система перекладає ці запити на структуровану прогнозну логіку, виконує їх на основі даних та повертає як прогнози, так і пояснення.

Це не тільки робить прогнозну аналітику більш доступною, але й дозволяє інтегрувати її з агентами ІІ, де прогнози можуть бути вбудовані в автоматизовані робочі процеси прийняття рішень.

До агент-орієнтованої корпоративної інтелектуальності

KumoRFM-2 розроблений з урахуванням агентів.

Його прогнозні можливості можуть бути представлені як модульні “навички”, які агенти ІІ можуть викликати як частину більш великих робочих процесів. Це перетворює прогнозне моделювання на складну будівельну блок – щось, що можна поєднати з пошуком, розсудливістю та виконанням в автономних системах.

У цьому контексті модель не тільки інструмент для аналітиків, а й фундаментальний шар для наступного покоління корпоративної автоматизації.

Перевизначення ролі науки про дані

KumoRFM-2 сигналізує про ширшу зміну того, як організації підходять до науки про дані.

Замість будівництва та підтримки десятків завдань-специфічних моделей команди можуть покладатися на одну загальну систему, яка адаптується до нових проблем миттєво. Це знижує потребу у спеціалізованій експертизі в інженерії функцій та налаштуванні моделей, а також дозволяє швидшу експериментацію та ітерацію.

Для багатьох організацій це може означати перехід від централізованої функції науки про дані до більш розподіленої моделі, де прогнозні знання доступні по декількох відділам.

Нова категорія фундаментальних моделей

Хоча фундаментальні моделі вже перетворили галузі, такі як мова та бачення, структуровані корпоративні дані залишилися однією з останніх меж.

KumoRFM-2 представляє ранній приклад того, чого можуть досягти спеціалізовані фундаментальні моделі для структурованих даних. Об’єднуючи реляційне розсудливість, навчання в контексті та взаємодію природної мови, він вводить новий парадигму для прогнозного ІІ.

Якщо цей підхід буде широко прийнятий, це може змінити те, як бізнес взаємодіє зі своїми даними – перетворюючи прогнозну аналітику з складного, затриманого процесу на реальний, організаційно-широкий потенціал.

Антуан - видний лідер і засновник Unite.AI, який рухається незламною пристрасті до формування та просування майбутнього штучного інтелекту та робототехніки. Як серійний підприємець, він вважає, що штучний інтелект буде таким же революційним для суспільства, як і електрика, і часто захоплюється потенціалом революційних технологій і AGI.

Як футуролог, він присвячений вивченню того, як ці інновації будуть формувати наш світ. Крім того, він є засновником Securities.io, платформи, орієнтованої на інвестування в передові технології, які переінакшують майбутнє і змінюють цілі сектори.