Connect with us

Alimentez vos efforts de ML et d’IA avec la transformation de données – Leaders d’opinion

Intelligence artificielle

Alimentez vos efforts de ML et d’IA avec la transformation de données – Leaders d’opinion

mm

Plus la variété, la vitesse et le volume de données sont importants, plus il devient réalisable d’utiliser l’analyse prédictive et la modélisation pour prévoir la croissance et identifier les domaines d’opportunité et d’amélioration. Cependant, pour obtenir la plus grande valeur des outils de rapport, d’apprentissage automatique (ML) et d’intelligence artificielle (IA), une organisation doit accéder aux données provenant de nombreuses sources et s’assurer que les données sont de haute qualité et fiables. Ceci est souvent le plus grand obstacle pour transformer les grandes données en stratégie commerciale.

Les professionnels des données passent tellement de temps à collecter et à valider les données pour les préparer à l’utilisation qu’ils n’ont que peu de temps pour se concentrer sur leur objectif principal : analyser les données et en dériver une valeur commerciale. Il n’est pas surprenant que 76 pour cent des data scientists disent que la préparation des données est la partie la moins agréable de leur travail. De plus, les efforts actuels de préparation des données, tels que le dénouement des données et l’ETL traditionnel, nécessitent un effort manuel des professionnels de l’informatique et ne sont pas suffisants pour gérer l’échelle et la complexité des grandes données.

Les entreprises qui veulent exploiter le pouvoir de l’IA doivent s’éloigner de ces processus fastidieux et principalement manuels qui augmentent le risque de résultats « de mauvaise qualité ». Au lieu de cela, elles ont besoin de processus de transformation de données qui extraient les données brutes de plusieurs sources et formats, les joignent et les normalisent, et ajoutent de la valeur avec une logique métier et des métriques pour les rendre prêtes à l’analyse. Avec une transformation de données complexes, ils peuvent être sûrs que les modèles d’IA/ML sont basés sur des données propres et précises qui fournissent des résultats fiables.

Exploiter le pouvoir du cloud avec ELT

L’endroit idéal pour préparer et transformer les données aujourd’hui est un entrepôt de données cloud (CDW) tel qu’Amazon Redshift, Google BigQuery, Microsoft Azure Synapse ou Snowflake. Alors que les approches traditionnelles de l’entrepôt de données nécessitent que les données soient extraites et transformées avant de pouvoir être chargées, un CDW utilise la scalabilité et les performances du cloud pour une ingestion et une transformation de données plus rapides et permet d’extraire et de charger les données de nombreuses sources de données disparates avant de les transformer à l’intérieur du CDW.

Idéalement, le modèle ELT déplace initialement les données dans une section du CDW réservée aux données de mise en scène brutes. À partir de là, le CDW peut utiliser ses ressources de calcul quasi illimitées disponibles pour les travaux d’intégration de données et d’ETL qui nettoient, agrègent, filtrent et joignent les données mises en scène. Les données peuvent ensuite être transformées dans un schéma différent – un coffre-fort de données ou un schéma étoilé, par exemple, en optimisant les données pour les rapports et l’analyse

L’approche ELT permet également de répliquer les données brutes à l’intérieur du CDW pour une préparation et une transformation ultérieures lorsque et comme nécessaire. Cela vous permet d’utiliser des outils d’intelligence commerciale qui déterminent le schéma lors de la lecture et produisent des transformations spécifiques sur demande, vous permettant effectivement de transformer les mêmes données de plusieurs manières à mesure que vous découvrez de nouvelles utilisations pour elles.

Accélérer les modèles d’apprentissage automatique

Ces exemples du monde réel montrent comment deux entreprises de différents secteurs exploitent la transformation de données dans un CDW pour stimuler les initiatives d’IA.

Une agence de marketing et de publicité de niche a créé une plate-forme de gestion client propriétaire pour aider ses clients à mieux identifier, comprendre et motiver leurs clients. En transformant les données dans un CDW, la plate-forme intègre rapidement et facilement les données client en temps réel à travers les canaux dans une vue client à 360 degrés qui éclaire les modèles d’IA/ML de la plate-forme pour rendre les interactions client plus cohérentes, opportunes et personnalisées.

Une entreprise de logistique mondiale qui effectue 100 millions de livraisons à 37 millions de clients uniques dans 72 pays a besoin de vastes quantités de données pour alimenter ses opérations quotidiennes. L’adoption de la transformation de données dans un CDW a permis à l’entreprise de déployer 200 modèles d’apprentissage automatique en un an. Ces modèles font 500 000 prédictions chaque jour, améliorant considérablement l’efficacité et stimulant un service client de haute qualité qui a réduit les appels entrants au centre d’appels de 40 pour cent.

Meilleures pratiques pour commencer

Les entreprises qui veulent soutenir leurs initiatives d’IA/ML avec le pouvoir de la transformation de données dans le cloud doivent comprendre leur cas d’utilisation spécifique et leurs besoins. En commençant par ce que vous voulez faire avec vos données – réduire les coûts de carburant en optimisant les itinéraires de livraison, augmenter les ventes en fournissant les meilleures offres aux agents de service client en temps réel, etc. – vous pouvez rétro-ingénier vos processus pour identifier quelles données livreront des résultats pertinents.

Une fois que vous déterminez quelles données votre projet d’IA/ML a besoin pour construire ses modèles, vous avez besoin d’une solution ELT native cloud qui rendra vos données prêtes à l’emploi. Recherchez une solution qui :

  • Est neutre en termes de fournisseur et capable de fonctionner avec votre pile technologique actuelle

  • Est suffisamment flexible pour évoluer et s’adapter à mesure que votre pile technologique change

  • Peut gérer des transformations de données complexes à partir de plusieurs sources de données

  • Offre un modèle de tarification à l’utilisation dans lequel vous ne payez que ce que vous utilisez

  • Est conçu spécifiquement pour votre CDW préféré afin que vous puissiez exploiter pleinement les fonctionnalités de ce CDW pour exécuter des travaux plus rapidement et transformer des données de manière transparente.

Une solution de transformation de données cloud qui répond aux dénominateurs communs de tous les CDW peut fournir une expérience cohérente, mais seule celle qui permet les puissantes fonctionnalités différenciatrices de votre CDW choisi peut livrer les hautes performances qui accélèrent le temps d’obtention des informations. La bonne solution vous permettra d’alimenter vos projets d’IA/ML avec plus de données propres et fiables provenant de plus de sources en moins de temps – et de générer des résultats plus rapides et plus fiables qui stimulent une valeur commerciale et une innovation jusque-là irréalisables.

David Langton est un professionnel du logiciel expérimenté avec plus de 20 ans d'expérience dans la création de technologies et de produits primés. David occupe actuellement le poste de VP de Produit chez Matillion, un fournisseur de solutions de transformation de données. Avant son rôle chez Matillion, il a travaillé en tant que gestionnaire d'entrepôt de données et contractant dans l'industrie financière.