Лідери думок

Чому дані є невидимим героєм стратегії штучного інтелекту

Published May 1, 2025

Updated April 26, 2026

Siddharth (Sidd) Rajagopal, Chief Architect at Informatica

Золотий похід штучного інтелекту – від пілотних проектів та експериментів до стратегії підприємства

Закон Мура діє повною мірою, коли мова йде про штучний інтелект. Штучний інтелект перебуває у великому запиті, і кожне підприємство приймає його. Інновації також сприяють цьому запитові з новими моделями штучного інтелекту, агентами штучного інтелекту та новими технологіями, що з’являються на цьому місці. Це створює фундаментальну зміну для підприємств – етап пілотних проектів та експериментів та демонстрації штучного інтелекту, зокрема генеративного штучного інтелекту, в основному зникає. Підприємства розуміють, що штучний інтелект повинен бути закладений як частина стратегії підприємства для масштабування та створення справжньої бізнес-диференціації. Штучний інтелект є темою в більшості ради директорів, що призводить до стратегічної інновації та бюджетів.

Дані: перший доміно в стратегії штучного інтелекту

Ключовим фактором будь-якої стратегії штучного інтелекту повинна бути дані. Дані є критичними для моделей штучного інтелекту, щоб бути контекстними, інтелектуальними та специфічними для галузі та підприємства. Моделі штучного інтелекту передбачають результати на основі того, як модель налаштована та яких входів їй надаються. Обидва ці фактори залежать від якості, різноманітності, свіжості та структури даних.

За прогнозом IDC, штучний інтелект повинен збільшити глобальну економіку майже на 20 трильйонів доларів до 2030 року, що спричинено не тільки моделями, але й величезними інвестиціями в основні дані та інфраструктуру, які їх підтримують.

Тренувальні дані з вузькими підмножинами призводять до упереджених моделей, застарілі дані призводять до нерелевантних результатів, а погані дані просто призводять до поганих результатів штучного інтелекту. Тому дані є першим доміно в стратегії даних підприємства. Навіть з кращими людьми та передовими технологіями, якщо дані доміно впадуть, вся стратегія штучного інтелекту швидко розвалиться.

Як зазначено в звіті Gartner 2024 про топ-тренди даних та аналітики, організації, які масштабуються з штучним інтелектом, залежать від даних, а лідери, які успішно реалізують цю стратегію, будуть тими, хто установлює довіру до своїх даних і керує ними стратегічно.

Ключові стратегічні рішення щодо даних для вашої стратегії штучного інтелекту

Ось 5 ключових факторів, які ви та ваше підприємство повинні враховувати для підготовки даних для вашої стратегії штучного інтелекту:

1. Перевикористайте свій ландшафт даних – Багато підприємств не перевикористовують управління даними, управління якістю даних, зберігання та аналіз даних для штучного інтелекту. Багато даних, які служать критичним звітам та аналітиці, також можуть бути критичними для штучного інтелекту. Тому важливо починати з даних, які вже присутні в підприємстві. Звичайно, це потрібно доповнити правильними заходами якості даних.

Ключове питання для запитання – Які дані у нас є в підприємстві, і в якому стані вони перебувають?

2. Метадані та лінійка даних – Для наявних даних метадані, тобто дані про дані, можуть бути не менш важливими, якщо не більш важливими, для штучного інтелекту. Наприклад, бізнес-терміни, пов’язані з даними, можуть допомогти ідентифікувати відповідний контекст для моделі RAG, наприклад. Коли користувач запитує статус заяви в страховому підприємстві, всі дані атрибути, пов’язані зі статусом заяви, можуть бути використані як контекст для моделі штучного інтелекту, щоб відповісти. Лінійка даних також допомагає зрозуміти потік даних, що допомагає моделям штучного інтелекту ідентифікувати надійні джерела даних.

За recent ISASA блогом, управління штучним інтелектом є критичним і вимагає правильних метаданих та лінійки даних для масштабування.

Ключове питання для запитання – Чи правильно позначені наші дані бізнесовими та технічними метаданими? Чи збираємо ми лінійку даних, щоб зрозуміти, як дані течуть від початку до кінця?

3. Управління даними та відповідність – Забезпечте, щоб ваші дані були добре керованими та управляються, і що будь-які нормативні акти та правила конфіденційності застосовуються до даних. Стратегія штучного інтелекту повинна успадкувати та розширити ці заходи управління та нормативні акти, а не починати з нуля. Наприклад, якщо клієнт хоче, щоб його дані були анонімізовані згідно з регламентом GDPR, модель штучного інтелекту повинна бути як тренована, так і операційна на анонімізованому наборі даних.

Ключове питання для запитання – Чи маємо ми програму управління даними та відповідності? Якщо ні, які ключові аспекти мені потрібно мати на місці для моєї стратегії штучного інтелекту?

4. Обробіть майстер-дані як ваш квотербек штучного інтелекту – Критичні майстер-дані, які містять дані про ключові сутності в вашому підприємстві, повинні бути використані як основа для вашої стратегії штучного інтелекту. Наприклад, якщо існує 360-градусний вигляд клієнта, стратегія штучного інтелекту на будь-якій домені клієнта, chẳng hạn як передбачення відмови клієнта, повинна використовувати ці майстер-дані, щоб уникнути будь-яких пропущених або неповних даних. Звичайно, це можна поєднати з більшою кількістю інформації з конкретних джерел даних.

Ключове питання для запитання – Чи мають ми наші критичні майстер-дані домени доступні в повному обсязі та зв’язані з рештою нашого ландшафту даних?

5. Дані та їхня вартість – Дані не повинні розглядатися як центр витрат, а оцінюватися за їхньої вартості, як для штучного інтелекту, так і для бізнесу. Це вимагає, щоб дані були на рівні ради директорів та CXO, окрім штучного інтелекту.

Ключове питання для запитання – Чи розуміє наша рада директорів та CXO вартість даних для організації? Якщо ні, як ми можемо забезпечити, щоб це було зрозуміло, особливо в контексті стратегії штучного інтелекту в підприємстві?

Моделі приходять і йдуть, але дані залишаються.

Як ваша стратегія штучного інтелекту розвивається, нові моделі та інновації штучного інтелекту з’являються. Швидкість інновацій в цьому просторі є приголомшливою. Але з часом моделі штучного інтелекту будуть комодитизовані; справжній диференціатор у вашому підприємстві не те, яку модель ви використовуєте, а як вона контекстуалізується з якими даними тренується, налаштовується та працює на них.

Якщо ви створюєте стратегію штучного інтелекту, не починайте з моделі. Почніть з питання: Чи маємо ми дані, щоб підтримати це?

Siddharth (Sidd) Rajagopal, Chief Architect in the Field CTO Organization at Informatica

Сіддхарт (Сідд) Раджагопал є головним архітектором в організації Field CTO в Informatica. У своїй ролі він взаємодіє з високопоставленими керівниками підприємств, надає лідерство думок щодо даних та управління даними,分享уючи свої ідеї та знання.

Unite.AI

Чому дані є невидимим героєм стратегії штучного інтелекту

Золотий похід штучного інтелекту – від пілотних проектів та експериментів до стратегії підприємства

Дані: перший доміно в стратегії штучного інтелекту

You may like