Entretiens
Siddharth Rajagopal & Sujay Dutta, Auteurs de Données comme le Quatrième Pilier – Série d’entretiens

Sujay Dutta est un leader chevronné dans les domaines de la technologie et des affaires, avec plus de 25 ans d’expérience mondiale. Il croit que l’avenir se dessine à l’intersection de l’IA, des résultats commerciaux, de la culture et des données (“A.B.C.D.”). Il travaille actuellement en tant que Global Account Lead chez Databricks.
Siddharth (Sidd) Rajagopal est un architecte en chef au sein de l’organisation Field CTO d’Informatica. Dans son rôle, il s’engage avec les cadres supérieurs des entreprises pour fournir un leadership de pensée autour des données et de la gestion des données en partageant ses connaissances et ses apprentissages.
Données comme le quatrième pilier présente le cas pour traiter les données comme un élément fondamental du succès de l’entreprise, au même niveau que les personnes, les processus et la technologie. Destiné aux conseils d’administration, aux PDG et aux cadres supérieurs, le livre décrit une approche structurée pour intégrer la stratégie de données au cœur de la prise de décision commerciale. Il introduit un cadre de maturité et des indicateurs pratiques tels que la Valeur Addressable Totale (TAV) et la Valeur Addressable Attendue (EAV) pour aider les organisations à quantifier l’impact des initiatives de données. Les auteurs explorent également l’interaction entre les données et l’intelligence artificielle, en mettant en évidence la façon dont chacun renforce l’autre. Étayé par une étude de cas d’AUDI AG de Rüdiger Eck, le livre allie théorie et application concrète, ce qui en fait un guide pratique pour les dirigeants des PME et des grandes entreprises qui naviguent dans le paysage concurrentiel et axé sur les données d’aujourd’hui.
Votre titre de livre fait référence aux données comme au quatrième pilier. Pouvez-vous résumer ce que sont les trois premiers piliers et pourquoi les données devraient être considérées comme le quatrième pilier ?
Les trois premiers piliers traditionnels/existants sont les Personnes, les Processus et la Technologie. Chaque pilier a été ajouté à mesure que les entreprises ont mûri au fil des ans. Historiquement, les données n’étaient qu’un sous-produit opérationnel de ces piliers, géré par le département informatique. Maintenant, à l’ère de l’IA, les données ne sont plus un sous-produit. Elles sont le principal moteur de valeur mais peuvent également risquer l’existence d’une entreprise – c’est pourquoi nous faisons référence aux données comme au Feu. Pour réussir, les données doivent être élevées au rang de quatrième pilier co-égal. Avec les données comme quatrième pilier, chaque pilier crée un effet d’entraînement avec les autres piliers, les habilitant et en bénéficiant. Les données comme quatrième pilier garantissent que les données reçoivent la même attention au niveau de la direction et du conseil d’administration que les personnes, les processus et la technologie, les transformant d’un centre de coûts en un actif d’entreprise mesurable qui stimule la croissance commerciale.
Le poste de Directeur des données (CDO) est décrit comme un rôle clé, recommandé pour faire le lien avec le PDG, le CTO et d’autres cadres supérieurs. Pouvez-vous donner un aperçu général de ce que ce poste implique et de ses principales responsabilités ?
Le CDO, en tant que leader du pilier des données, est un moteur de valeur, qui accélère les résultats commerciaux ; il développe une compréhension de l’intensité des données (QCS – Qualité, Conformité et Vitesse) pour les cas d’utilisation commerciaux ; il équilibre et fait croître continuellement la demande et l’offre de données (via le MOD – Modèle d’exploitation des données) ; il apporte une excellence d’exécution en termes de personnes, de processus et de technologie pour le pilier des données ; et il est un agent de changement pour la planification et l’exécution du changement structurel dans l’ensemble de l’entreprise, avec le parrainage du conseil d’administration et du PDG, et la participation des leaders des autres piliers.
Pourquoi la collecte et l’exécution des données sont-elles si critiques pour exploiter l’IA à grande échelle ?
Encore une fois, les données sont comme le Feu. Elles alimentent l’IA. Un modèle d’IA doit apprendre des modèles, des relations et des comportements directement à partir des données qu’il reçoit, pour être en mesure de délivrer un impact commercial. De plus, pour l’IA, les données non structurées (telles que les PDF, les images et les vidéos) deviennent critiques. La plupart des entreprises ne sont actuellement pas matures dans le traitement des données non structurées. De plus, les modèles d’IA sont devenus ou sont en train de devenir une commodité – les données créent la différenciation de l’utilisation d’un modèle d’IA.
Le livre se penche en détail sur le concept d’intensité des données. Pouvez-vous expliquer brièvement ce que cela signifie et pourquoi il est si important ?
L’intensité des données est une mesure de la façon dont vos données sont “adaptées à leur objectif” pour accélérer la valeur commerciale, en particulier pour la mise à l’échelle de l’IA. Chaque cas d’affaires nécessite des données différemment, avec une intensité différente. Notre livre introduit le cadre QCS pour mesurer l’intensité des données sur trois dimensions critiques :
- Qualité : Les données sont-elles exactes, complètes, cohérentes et fiables ? C’est le principe “d’ordures entrantes, d’ordures sortantes”. Des données de mauvaise qualité conduisent à des analyses erronées et à une IA peu fiable.
- Conformité : Les données respectent-elles toutes les normes juridiques et éthiques, telles que les réglementations de confidentialité (comme le RGPD) et les règles spécifiques à l’industrie ? Des données non conformes créent un risque massif.
- Vitesse : Les données sont-elles disponibles suffisamment rapidement pour être utiles ? Cela fait référence à la vitesse à laquelle les données sont collectées, traitées et mises à disposition pour la prise de décision (par exemple, en temps réel par rapport au traitement par lots). Traditionnellement, les entreprises ont mûri pour exécuter dans une ou deux dimensions. Une banque serait en mesure de livrer sur les dimensions Q et C, tandis qu’une start-up se concentrerait sur les dimensions Q et S. Le défi pour les entreprises à l’ère de l’IA est d’exécuter à un niveau élevé sur les trois dimensions (Q, C et S) simultanément et de manière cohérente.
Pourquoi définir une stratégie de données est-elle si importante, et pourquoi est-elle souvent négligée ?
Définir une stratégie de données est critique car elle sert de plan directeur qui relie toutes les activités de données à la stratégie commerciale de l’entreprise. Elle décrit la feuille de route pour développer et exploiter les capacités de données pour accélérer les résultats commerciaux, tels que l’augmentation des revenus, l’amélioration de l’efficacité et la création d’un avantage concurrentiel.
Malgré cela, une stratégie de données est souvent négligée pour plusieurs raisons clés.
Historiquement, les dirigeants d’entreprise ont considéré les données comme un sous-produit des opérations commerciales et un problème technique du département informatique, plutôt que comme une fonction stratégique du niveau de la direction. Sans un propriétaire clair, tel qu’un Directeur des données, ce travail essentiel tombe souvent dans un vide de leadership. Cela amène les entreprises à passer directement à des projets d’IA passionnants sans une solide fondation de données, ce qui est une raison principale pour laquelle la plupart d’entre eux échouent.
Pouvez-vous élaborer sur ce qu’est un cadre de gouvernance des données, comment il diffère d’une stratégie de données et pourquoi il est nécessaire pour atténuer les risques associés à l’utilisation des données ?
Une stratégie de données définit les objectifs que l’entreprise souhaite atteindre avec ses données. En revanche, un cadre de gouvernance des données permet aux cas d’utilisation commerciaux d’utiliser les données à l’intensité de données requise (Q, C et S), pour être en mesure de livrer la valeur attendue.
Le cadre de gouvernance des données est crucial pour atténuer les risques. Sans gouvernance, les données deviennent une responsabilité. Il garantit la conformité avec les réglementations telles que le RGPD, empêchant ainsi des amendes massives et des problèmes juridiques. Il établit les normes de sécurité et de confidentialité qui protègent contre les violations de données et les dommages à la réputation qui en découlent. L’application de la qualité des données empêche les décisions commerciales coûteuses basées sur des informations erronées. Et les agents d’IA sont utiles uniquement lorsqu’ils reçoivent les données à la vitesse requise.
Pensez-y de cette façon : votre stratégie est la destination sur une carte ; votre cadre de gouvernance est le code de la route que vous suivez pour y arriver sans accident.
Vous discutez également du concept de MOD (Modèle d’exploitation des données). Pouvez-vous expliquer ce que c’est et comment il aide les organisations à opérationnaliser leur stratégie de données ?
Un Modèle d’exploitation des données (MOD) est le moteur qui répond à la demande de données pour répondre à la demande de données. Le MOD opérationnalise la stratégie en traduisant les objectifs de haut niveau en actions concrètes et réutilisables. Il s’agit d’un cadre pratique qui industrialise la livraison de données à l’intensité de données requise, comprenant les personnes, les processus et la technologie.
Alors que disposer de la bonne stratégie de données et de gouvernance garantit de bonnes intentions, le succès dépend souvent de l’adoption des données et de la gestion de l’ingénierie des données. Pouvez-vous discuter brièvement de ces deux éléments et pourquoi les dirigeants devraient prêter une attention particulière à ceux-ci ?
Le succès avec les données repose sur l’adoption des données et la gestion de l’ingénierie des données.
L’adoption des données est l’aspect culturel – avec vos équipes qui utilisent réellement les données pour prendre des décisions quotidiennes. Sans adoption, l’ensemble de l’investissement dans le pilier des données est gaspillé.
La gestion de l’ingénierie des données est la colonne vertébrale technique – la construction et la maintenance de l’usine de données fiable qui collecte et traite les données pour répondre aux exigences d’intensité des données (QCS).
Les dirigeants doivent défendre les deux. Une mauvaise adoption signifie que l’investissement est gaspillé. Une mauvaise ingénierie signifie que l’entreprise fonctionne avec des données inadaptées (c’est-à-dire des données qui ne répondent pas à l’intensité de données requise), ce qui conduit à des erreurs coûteuses, érode la confiance, crée des problèmes de conformité et rend toute initiative d’IA impossible.
Le livre est écrit en tenant compte des grandes entreprises, où des rôles tels que CDO, gestion des risques de données, gestion de l’accès aux données et équipes de qualité et d’observabilité des données sont bien définis. Pourquoi les petites entreprises devraient-elles également considérer ce livre, et comment peuvent-elles compenser le fait de ne pas avoir ces rôles en place ?
Pour une petite entreprise, dans la plupart des cas, les données sont son plus grand facteur de différenciation. Il est beaucoup plus facile de construire l’ADN “Données comme le quatrième pilier” correctement dès le départ que de corriger une grande organisation traditionnelle plus tard. Obtenir la bonne fondation de données dès le début fournit un avantage concurrentiel massif pour la croissance et l’adoption future de l’IA. Comme le dirigeant d’une entreprise de taille moyenne nous l’a dit : pour moi, les données sont le premier pilier, et je suis le CDO également.
Si vous deviez retenir une chose clé de votre livre, quelle serait-elle ?
La prise définitive est que les entreprises doivent mettre en œuvre immédiatement le changement structurel pour établir les données comme le quatrième pilier du modèle opérationnel, co-égal avec les personnes, les processus et la technologie. Il s’agit d’une décision existentielle que les conseils d’administration et les dirigeants doivent défendre, car les données sont le facteur de différenciation déterminant et la fondation indispensable requise pour mettre à l’échelle avec succès l’IA et sécuriser un avantage concurrentiel dans le futur. Les entreprises qui ne parviennent pas à intégrer les données comme pilier de base risquent de devenir obsolètes et auront du mal à concurrencer à l’ère de l’IA. Le moment d’agir est MAINTENANT !
Je vous remercie pour cette grande interview, les lecteurs qui souhaitent en savoir plus devraient lire Données comme le quatrième pilier.
Avertissement : Les opinions exprimées dans cet article sont celles des auteurs et ne reflètent pas nécessairement celles de leurs employeurs actuels ou passés.












