Connect with us

Почему данные являются незаслуженно забытым героем стратегии ИИ

Лидеры мнений

Почему данные являются незаслуженно забытым героем стратегии ИИ

mm

Золотая лихорадка ИИ – от пилотов и экспериментов к масштабу и стратегии предприятия

Закон Мура действует в полную силу, когда речь идет об ИИ. ИИ находится в большом спросе, и каждое предприятие принимает ИИ. Инновации также помогают стимулировать этот спрос с новыми моделями ИИ, агентами ИИ и новыми технологиями, которые появляются на этом месте. Это создает фундаментальный сдвиг для предприятий – сцена для пилотов и интересных экспериментов и показов для ИИ, в частности, генеративного ИИ, в значительной степени исчезает. Предприятия осознают, что ИИ необходимо внедрять как часть стратегии предприятия для масштабирования и создания真正й бизнес-различия. ИИ является темой в большинстве совещательных комнат, что приводит к стратегическим инновациям и бюджетам.

Данные: первый домино в стратегии ИИ

Ключевым фактором в любой стратегии ИИ должна быть Данные. Данные имеют решающее значение для того, чтобы модели ИИ были контекстными, интеллектуальными и специфичными для домена и предприятия. Модели ИИ прогнозируют результаты на основе того, как модель настроена и входных данных, представленных ей. Оба этих фактора зависят от качества, разнообразия, актуальности и структуры данных.

Согласно недавнему прогнозу IDC, ИИ, как ожидается, увеличит глобальную экономику почти на 20 триллионов долларов к 2030 году, что обусловлено не только моделями, но и огромными инвестициями в основные данные и инфраструктуру, которые их поддерживают.

Тренировочные данные с узкими подмножествами приводят к предвзятым моделям, устаревшие данные приводят к нерелевантным результатам, а плохие данные просто приводят к плохим результатам ИИ. Следовательно, Данные являются первым домино в стратегии данных предприятия. Даже с лучшими людьми и передовыми технологиями, если домино данных падает, вся стратегия ИИ быстро разваливается.

Как отмечается в отчете Gartner за 2024 год о топ-трендах в области данных и аналитики, организации, масштабирующиеся с ИИ, полагаются на данные, и лидеры, которые добиваются успеха, будут теми, кто устанавливает доверие к своим данным и руководствуется ими стратегически.

Ключевые стратегические решения по данным для вашей стратегии ИИ

Вот 5 ключевых факторов, которые вам и вашему предприятию необходимо учитывать при подготовке данных для стратегии ИИ:

1. Переиспользуйте свой ландшафт данных – Несколько предприятий не переиспользуют ландшафт управления данными, управления данными и хранения и аналитики данных для ИИ. Много данных, которые служат критическому отчету и аналитике, также могут быть критически важными для ИИ. Поэтому важно начать с уже существующих данных в предприятии. Конечно, это требует дополнения правильными мерами качества данных.

Ключевой вопрос для ответа – Какие данные у нас есть в нашем предприятии, и в каком состоянии они находятся?

2. Метаданные и родословная данных – Для существующих данных метаданные, т.е. данные о данных, могут быть столь же критически важными, если не более, для ИИ. Например, бизнес-термины, помеченные на данных, могут помочь определить релевантный контекст для модели RAG, например. Когда пользователь запрашивает статус заявки в страховом предприятии, все данные, помеченные статусом заявки, могут быть использованы в качестве контекста для модели ИИ, чтобы ответить. Родословная данных также помогает понять поток данных, что помогает моделям ИИ определить доверенные источники данных.

Согласно недавнему блогу ISASA, управление ИИ является критически важным и требует правильных метаданных и родословной данных для масштабирования.

Ключевой вопрос для ответа – Правильно ли наши данные помечены бизнес- и техническими метаданными? Собираем ли мы родословную данных, чтобы понять, как данные протекают от начала до конца?

3. Управление данными и соблюдение требований – Обеспечьте, чтобы ваши данные были хорошо управляемы и контролировались, и чтобы любые требования и правила конфиденциальности применялись к данным. Стратегия ИИ должна затем наследовать и расширять эти правила и регулирования, а не начинать с нуля. Например, если клиент хочет, чтобы его данные были анонимизированы в соответствии с правилами GDPR, модель ИИ должна быть обучена и работать на анонимизированном наборе данных.

Ключевой вопрос для ответа – Есть ли у нас программа управления данными и соблюдения требований? Если нет, какие ключевые аспекты мне нужно иметь в месте для моей стратегии ИИ?

4. Относитесь к мастер-данным как к вашему квотербеку ИИ – Критически важные мастер-данные, содержащие данные о ключевых сущностях в вашем предприятии, должны быть использованы в качестве основы для вашей стратегии ИИ. Например, если существует полный обзор клиента, стратегия ИИ в любой области клиента, такой как прогнозирование отказа клиента, должна использовать эти мастер-данные, чтобы избежать любых пропущенных или неполных данных. Конечно, это можно объединить с более подробной информацией из конкретных источников данных.

Ключевой вопрос для ответа – Есть ли у меня критически важные мастер-данные, доступные в полном и связанном с остальным ландшафтом данных?

5. Данные и их ценность – Данные не должны рассматриваться как центр затрат, а измеряться в терминах их ценности, как для ИИ, так и для бизнеса. Это требует, чтобы данные были на уровне совета директоров и CXO, помимо ИИ.

Ключевой вопрос для ответа – Понимают ли наши совет директоров и CXO ценность данных для организации? Если нет, как мы можем обеспечить, чтобы это было понято, особенно в контексте стратегии ИИ в предприятии?

Модели приходят и уходят, но данные остаются.

Когда ваша стратегия ИИ эволюционирует, появляются новые модели и инновации ИИ. Скорость инноваций в этой области ошеломляющая. Но со временем модели ИИ будут коммодитизироваться;真正й дифференциатор в вашем предприятии не та модель, которую вы используете, а то, как она контекстуализируется с помощью каких данных она обучена, донастраивается и работает на них.

Если вы разрабатываете стратегию ИИ, не начинайте с модели. Начните с вопроса: Есть ли у нас данные, чтобы поддержать ее?

Сиддхарт (Сидд) Раджагопал является главным архитектором в организации Field CTO в Informatica. В своей роли он взаимодействует с руководителями высшего уровня в предприятиях, предоставляя лидерство в области данных и управления данными, делясь своими идеями и знаниями.