Интервью
Сиддхартх Раджагопал и Суджай Датта, авторы книги «Данные как четвертый столп» – Интервью

Суджай Датта – опытный технологический и бизнес-лидер с более чем 25-летним опытом работы на глобальном рынке. Он считает, что будущее формируется на пересечении искусственного интеллекта, бизнес-результатов, культуры и данных (“А.Б.К.Д.”). В настоящее время он работает в качестве глобального руководителя счета в компании Databricks.
Сиддхартх (Сидд) Раджагопал – главный архитектор в организации Field CTO в компании Informatica. В своей роли он взаимодействует с руководителями высшего уровня в крупных предприятиях, предоставляя лидерство в области данных и управления данными, делясь своими идеями и выводами.
Данные как четвертый столп представляет собой аргументы в пользу того, чтобы рассматривать данные как фундаментальный элемент успеха предприятия, наравне с людьми, процессами и технологиями. Ориентированная на советы директоров, генеральных директоров и руководителей высшего уровня, книга очерчивает структурированный подход к внедрению стратегии данных в ядро бизнес-решений. Она вводит рамки зрелости и практические метрики, такие как общая адресуемая стоимость (TAV) и ожидаемая адресуемая стоимость (EAV), чтобы помочь организациям количественно оценить влияние инициатив, связанных с данными. Авторы также исследуют взаимосвязь между данными и искусственным интеллектом, подчеркивая, как каждый из них укрепляет другой. Благодаря кейсу от Рюдигера Эка из компании AUDI AG, книга сочетает теорию с реальным применением, делая ее практическим руководством для лидеров как в малых и средних предприятиях, так и в крупных корпорациях, ориентирующихся в сегодняшнем конкурентном, обусловленном данными ландшафте.
Ваша книга называется «Данные как четвертый столп». Можете ли вы суммировать, что представляют собой первые три столпа, и почему данные должны быть рассмотрены как четвертый столп?
Первые три традиционных/существующих столпа – это Люди, Процесс и Технология. Каждый столп был добавлен по мере того, как предприятия созревали с течением времени. Исторически данные были просто операционным побочным продуктом этих столпов, управляемым ИТ. Теперь, в современную эпоху, обусловленную искусственным интеллектом, данные больше не являются побочным продуктом. Они являются основным двигателем ценности, но также могут представлять риск для существования предприятия – поэтому мы называем Данные Огнем. Чтобы добиться успеха, данные должны быть повышены до уровня, равного другим трем столпам. С Данными как четвертым столпом каждый столп создает эффект летающей клапаны с другими столпами, облегчая и получая выгоду друг от друга. Данные как четвертый столп обеспечивают получение данными такого же внимания на уровне руководства и совета директоров, как и люди, процесс и технология, превращая их из центра затрат в измеримый актив предприятия, который стимулирует бизнес-рост.
Должность руководителя по данным (Chief Data Officer, CDO) описывается как ключевая роль, рекомендованная для взаимодействия с генеральным директором, техническим директором и другими руководителями высшего уровня. Можете ли вы дать нам общий обзор того, что включает в себя эта должность, и какие являются ее ключевые обязанности?
Руководитель по данным как лидер столпа данных является драйвером ценности, ускоряющим бизнес-результаты; развивает понимание интенсивности данных (Качество, Соблюдение и Скорость) для бизнес-кейсов; непрерывно балансирует и развивает спрос и предложение данных (через Модель эксплуатации данных); обеспечивает выполнение требований к людям, процессам и технологиям для столпа данных; и является агентом изменений для планирования и выполнения структурных изменений в рамках всего предприятия, с одобрения совета директоров и генерального директора, и с участием лидеров других столпов.
Почему сбор и выполнение данных так важны для использования искусственного интеллекта в крупном масштабе?
Опять же, Данные подобны Огню. Они топят искусственный интеллект. Модель искусственного интеллекта должна учиться закономерностям, отношениям и поведению напрямую из данных, которые она получает, чтобы иметь возможность оказать бизнес-воздействие. Кроме того, для искусственного интеллекта неструктурированные данные (такие как PDF, изображения и видео) становятся критически важными. Большинство предприятий в настоящее время не имеют достаточного опыта в обработке неструктурированных данных. Более того, модели искусственного интеллекта становятся/стали товаром – Данные создают различия при использовании модели искусственного интеллекта.
Ваша книга подробно описывает концепцию интенсивности данных. Можете ли вы кратко объяснить, что это означает, и почему это так важно?
Интенсивность данных – это мера того, насколько ваши данные подходят для ускорения бизнес-ценности, особенно для масштабирования искусственного интеллекта. Каждый бизнес-кейс требует данных по-разному, с разной интенсивностью. В нашей книге мы вводим рамки QCS, чтобы измерить интенсивность данных по трем критическим измерениям:
- Качество: являются ли данные точными, полными, последовательными и надежными? Это принцип “мусор на входе, мусор на выходе”. Данные низкого качества приводят к ошибочным аналитическим данным и ненадежному искусственному интеллекту.
- Соблюдение: соответствуют ли данные всем юридическим и этическим стандартам, таким как правила защиты данных (например, GDPR) и отраслевые правила? Несоблюдение данных создает巨альный риск.
- Скорость: доступны ли данные достаточно быстро, чтобы быть полезными? Это относится к скорости, с которой данные собираются, обрабатываются и становятся доступными для принятия решений (например, реальное время против пакетной обработки). Традиционно предприятия созрели до выполнения в одном или двух измерениях. Банк смог бы доставить на Q и C измерениях, в то время как стартап сосредоточился на Q и S измерениях. Вызов для предприятий в эпоху, обусловленной искусственным интеллектом, заключается в том, чтобы выполнять на высоком уровне все три измерения (Q, C и S) одновременно и последовательно.
Почему определение стратегии данных так важно, и почему это часто упускается из виду?
Определение стратегии данных имеет решающее значение, поскольку оно служит蓝принтом, который напрямую связывает все действия с данными с бизнес-стратегией предприятия. Оно очерчивает дорожную карту для разработки и использования возможностей данных для ускорения бизнес-результатов, таких как увеличение дохода, улучшение эффективности и построение конкурентного преимущества.
Несмотря на это, стратегия данных часто упускается из виду по нескольким ключевым причинам.
Исторически бизнес-лидеры рассматривали данные как побочный продукт бизнес-операций и техническую проблему ИТ, а не стратегическую функцию на уровне руководства. Без ясного владельца, такого как руководитель по данным, эта важная работа часто попадает в вакуум лидерства. Это приводит к тому, что компании сразу же приступают к интересным проектам по искусственному интеллекту без прочной основы данных, что является основной причиной, по которой многие из них терпят неудачу.
Можете ли вы подробнее рассказать о том, что такое рамки управления данными, как они отличаются от стратегии данных и почему они необходимы для смягчения рисков, связанных с использованием данных?
Стратегия данных определяет цели, которые бизнес хочет достичь с помощью своих данных. Напротив, рамки управления данными позволяют бизнес-кейсам использовать данные на необходимом уровне интенсивности (Q, C и S), чтобы доставить ожидаемую ценность.
Рамки управления данными имеют решающее значение для смягчения рисков. Без управления данными данные становятся обязательством. Они обеспечивают соблюдение правил, таких как GDPR, предотвращая巨альные штрафы и юридические проблемы. Они устанавливают стандарты безопасности и конфиденциальности, которые защищают от утечек данных и последующего ущерба репутации. Обеспечение качества данных предотвращает дорогостоящие бизнес-решения на основе ошибочных данных. И агенты искусственного интеллекта полезны только тогда, когда они получают данные на необходимой скорости.
Подумайте об этом так: ваша стратегия – это пункт назначения на карте; ваши рамки управления – это правила дорожного движения, которые вы следуете, чтобы добраться туда без аварий.
Вы также обсуждаете концепцию Модели эксплуатации данных (Data Operating Model, DOM). Можете ли вы объяснить, что это такое и как она помогает организациям внедрять свою стратегию данных?
Модель эксплуатации данных (DOM) – это двигатель, который выполняет поставку данных для удовлетворения спроса на данные. Модель эксплуатации данных оживляет стратегию, переводя высокоуровневые цели в конкретные, многократно используемые действия. Это практическая рамка, которая индустриализирует поставку данных на необходимом уровне интенсивности, включающую людей, процессы и технологии.
Хотя наличие правильной стратегии данных и управления обеспечивает хорошие намерения, успех часто зависит от принятия данных и управления инженерными данными. Можете ли вы кратко обсудить эти два элемента и почему руководители должны обратить на них пристальное внимание?
Успех с данными зависит от принятия данных и управления инженерными данными.
Принятие данных – это культурная сторона – ваши команды фактически используют данные для принятия ежедневных решений. Без принятия весь инвестиции в столп данных теряются.
Управление инженерными данными – это технический задний план – построение и поддержание надежной “фабрики данных”, которая собирает и обрабатывает данные для удовлетворения требований к интенсивности данных (QCS). Руководители должны поддерживать оба аспекта. Плохое принятие означает, что инвестиции теряются. Плохое управление означает, что бизнес работает на неподходящих данных (т.е. данные, которые не удовлетворяют необходимой интенсивности), что приводит к дорогостоящим ошибкам, подрыву доверия, созданию проблем с соблюдением и невозможности реализации любой инициативы по искусственному интеллекту.
Ваша книга написана с учетом крупных предприятий, где роли, такие как руководитель по данным, управление рисками данных, управление доступом к данным и команды качества и наблюдения данных, хорошо определены. Почему небольшие компании также должны рассмотреть эту книгу, и как они могут компенсировать отсутствие этих ролей?
Для небольшой компании данные часто являются ее главным различием. Гораздо проще построить Данные как четвертый столп с самого начала, чем исправлять крупную традиционную организацию позже. Получение правильной основы данных с самого начала обеспечивает巨ское конкурентное преимущество для роста и будущего внедрения искусственного интеллекта. Как один из генеральных директоров небольшого предприятия рассказал нам: для меня Данные – это первый столп, и я являюсь руководителем по данным.
Если есть один ключевой вывод из вашей книги, то какой бы он был?
Определенный вывод заключается в том, что предприятиям необходимо немедленно реализовать структурные изменения, чтобы установить Данные как четвертый столп операционной модели, равный людям, процессам и технологиям. Это решение, которое должны поддержать советы директоров и руководители высшего уровня, поскольку данные являются определяющим различием и необходимой основой для успешного масштабирования искусственного интеллекта и обеспечения конкурентного преимущества в будущем. Предприятия, которые не смогут внедрить данные как основной столп, рискуют потерять актуальность и будут бороться за конкуренцию в эпоху, обусловленной искусственным интеллектом. Время действовать – СЕЙЧАС!
Спасибо за отличное интервью, читателям, которые хотят узнать больше, следует прочитать Данные как четвертый столп.
Отказ от ответственности: мнения, выраженные в этой статье, являются мнениями авторов и не обязательно отражают мнения их текущих или прошлых работодателей.












