- Terminologie (A à D)
- Contrôle des capacités de l'IA
- AIOps
- Albumentation
- Performance de l'actif
- Encodeur automatique
- Rétropropagation
- Théorème de Bayes
- Big Data
- Chatbot : guide du débutant
- Pensée computationnelle
- Vision par ordinateur
- Matrice de confusion
- Réseaux de neurones convolutionnels
- Cybersécurité
- Structure de données
- Storytelling de données
- Sciences des données
- Entreposage de données
- Arbre de décision
- Deepfakes
- L'apprentissage en profondeur
- Apprentissage par renforcement profond
- Devops
- DevSecOps
- Modèles de diffusion
- Jumeau Numérique
- Réduction de la dimensionnalité
- Terminologie (E à K)
- IA de pointe
- Emotion AI
- Apprentissage d'ensemble
- Piratage éthique
- ETL
- IA explicable
- Apprentissage fédéré
- FinOps
- IA générative
- Réseau d'adversaire génératif
- Génératif vs Discriminatif
- Rehaussement de dégradé
- Descente graduelle
- Apprentissage en quelques coups
- Classification d'image
- Opérations informatiques (ITOps)
- Automatisation des incidents
- Ingénierie d'influence
- K-Means Clustering
- Les voisins les plus proches
- Terminologie (L à Q)
- Terminologie (R à Z)
- Apprentissage par renforcement
- IA responsable
- RLHF
- Automatisation des processus robotiques
- Structuré vs non structuré
- Analyse des sentiments
- Supervisé vs non supervisé
- Machines à vecteurs de support
- Données synthétiques
- Médias synthétiques
- Classification du texte
- MinusculeML
- Transfert d'apprentissage
- Réseaux de neurones de transformateur
- Test de Turing
- Recherche de similarité vectorielle
AI 101
Qu'est-ce qu'une Data Fabric ?
Table des matières
Souvent associée à l’intelligence artificielle (IA) et au machine learning (ML), une structure de données est l’un des principaux outils permettant de convertir des données brutes en business intelligence.
Mais qu'est-ce qu'une Data Fabric exactement ?
Une structure de données est une architecture et un logiciel qui offrent une collection unifiée d'actifs de données, de bases de données et d'architectures de base de données au sein d'une entreprise. Il facilite l'intégration de bout en bout de divers pipelines de données et environnements cloud grâce à l'utilisation de systèmes intelligents et automatisés.
Les structures de données sont devenues plus importantes à mesure que des développements majeurs continuent d'avoir lieu avec le cloud hybride, l'Internet des objets (IoT), l'IA et l'informatique de pointe. Cela a provoqué une augmentation massive du Big Data, ce qui signifie que les organisations ont encore plus à gérer.
Pour faire face à ces mégadonnées, les entreprises doivent se concentrer sur l'unification et la gouvernance des environnements de données, ce qui a posé plusieurs défis tels que les silos de données, les risques de sécurité et les goulots d'étranglement dans la prise de décision. Ces défis ont conduit les équipes de gestion des données à adopter des solutions de Data Fabric, qui aident à unifier les systèmes de données, à renforcer la confidentialité et la sécurité, à améliorer la gouvernance et à offrir une plus grande accessibilité aux données pour les travailleurs.
L'intégration des données conduit à une prise de décision plus axée sur les données, et bien que les entreprises aient historiquement utilisé différentes plates-formes de données pour des aspects spécifiques de l'entreprise, les structures de données permettent de visualiser les données de manière plus cohérente. Tout cela conduit à une meilleure compréhension du cycle de vie du client et aide à établir des connexions entre les données.
A quoi sert une Data Fabric ?
Les structures de données sont utilisées pour établir une vue unifiée des données associées, ce qui facilite l'accès aux informations indépendamment de leur emplacement, de leur association à la base de données ou de leur structure. Les structures de données simplifient également l'analyse grâce à l'IA et à l'apprentissage automatique.
Un autre objectif d'une structure de données est de faciliter le développement d'applications, car il crée un modèle commun pour accéder aux informations, distinct des silos traditionnels d'applications et de bases de données. Ces modèles offrent un meilleur accès aux informations, mais ils améliorent également l'efficacité en établissant une couche unique où l'accès aux données peut être géré sur toutes les ressources.
Bien qu'il n'y ait pas une seule architecture de données pour une structure de données, on dit souvent que ce type de structure de données comporte six composants fondamentaux :
Gestion de données: Responsable de la gouvernance des données et de la sécurité des données.
Ingestion de données : Rassemble les données cloud et identifie les connexions entre les données structurées et non structurées.
Traitement de l'information: affine les données pour s'assurer que seules les données pertinentes sont présentées pour l'extraction de données.
Orchestration des données: Une couche très importante du framework responsable de la transformation, de l'intégration et du nettoyage des données afin qu'elles puissent être utilisées dans l'ensemble de l'entreprise.
Découverte de données: Présente de nouvelles façons d'intégrer les sources de données.
Accès aux données: Permet la consommation de données, garantit les bonnes autorisations pour que certaines équipes se conforment à la réglementation et aide à mettre en évidence les données pertinentes grâce à l'utilisation de tableaux de bord et d'autres outils de visualisation de données.
Avantages d'une Data Fabric
Les data fabrics présentent de nombreux avantages commerciaux et techniques, tels que :
Briser les silos de données: Les entreprises modernes souffrent souvent de silos de données, car les bases de données modernes sont associées à des groupes d'applications et se développent souvent à mesure que de nouvelles sont ajoutées à l'entreprise. Les silos de données contiennent des données de structures et de formats différents, mais les structures de données peuvent améliorer l'accès aux informations de l'entreprise et utiliser les données collectées pour améliorer l'efficacité opérationnelle.
Unir les bases de données: Les data fabrics aident également les entreprises à fédérer des bases de données réparties sur une grande surface. Ils veillent à ce que les différences d'emplacement n'entraînent pas d'obstacles à l'accès. Les structures de données simplifient le développement d'applications et peuvent être utilisées pour optimiser l'utilisation de données d'application spécifiques sans rendre les données moins accessibles aux autres applications. Ils peuvent également unifier les données déjà déplacées dans des silos.
Accès unique aux informations: Les structures de données améliorent la portabilité des applications et agissent comme un moyen unique d'accéder aux informations à la fois dans le cloud et dans le centre de données.
Générez des informations à un rythme accéléré : Les solutions de Data Fabric peuvent facilement gérer des ensembles de données complexes, ce qui accélère le délai d'obtention d'informations. Leur architecture permet à des modèles d'analyse et à des algorithmes cognitifs prédéfinis de traiter les données à grande échelle et rapidement.
Utilisé par les utilisateurs techniques et non techniques : Les data fabrics ne s'adressent pas qu'aux utilisateurs techniques. L'architecture est flexible et peut être utilisée avec une large gamme d'interfaces utilisateur. Ils peuvent aider à créer des tableaux de bord compréhensibles par les dirigeants d'entreprise, ou leurs outils sophistiqués peuvent être utilisés pour l'exploration de données par des data scientists.
Meilleures pratiques pour la mise en œuvre de Data Fabrics
Le marché mondial des données est en constante expansion et la demande dans ce domaine est forte. De nombreuses entreprises cherchent à mettre en œuvre une architecture de données pour optimiser leurs données d'entreprise et suivent certaines bonnes pratiques courantes.
L'une de ces pratiques consiste à adopter un modèle de processus DataOps. Data Fabric et DataOps ne sont pas identiques, mais selon un modèle DataOps, il existe une connectivité étroite entre les processus de données, les outils et les utilisateurs. En alignant les utilisateurs pour qu'ils s'appuient sur les données, ils peuvent tirer parti des outils et appliquer des informations. Sans modèle DataOps, les utilisateurs peuvent avoir du mal à extraire suffisamment de la structure de données.
Une autre bonne pratique consiste à éviter de transformer la structure de données en un autre lac de données, ce qui est courant. Par exemple, une véritable structure de données ne peut pas être obtenue si vous disposez de tous les composants architecturaux, tels que les sources de données et les analyses, mais aucun des API et des SDK. La structure de données fait référence à la conception de l'architecture, et non à une seule technologie. Et certaines des caractéristiques déterminantes de l'architecture sont l'interopérabilité entre les composants et la préparation à l'intégration.
Il est également essentiel pour l'organisation de comprendre ses exigences en matière de conformité et de réglementation. Une architecture de Data Fabric peut améliorer la sécurité, la gouvernance et la conformité réglementaire.
Étant donné que les données ne sont pas dispersées entre les systèmes, la menace d'exposition aux données sensibles est moindre. Cela dit, il est important de comprendre les exigences de conformité et réglementaires avant de mettre en œuvre une structure de données. Différents types de données peuvent relever de différentes juridictions réglementaires. Une solution consiste à utiliser des politiques de conformité automatisées qui garantissent que la transformation des données est conforme aux lois.
Cas d'utilisation de Data Fabric
Il existe de nombreuses utilisations différentes pour une structure de données, mais quelques-unes sont très courantes. Un tel exemple courant est la collecte virtuelle/logique d'actifs de données géographiquement diversifiés pour faciliter l'accès et l'analyse. La structure de données est généralement utilisée pour la gestion centralisée de l'entreprise dans ce cas. Étant donné que les opérations de ligne distribuées qui collectent et utilisent les données sont prises en charge par des applications traditionnelles et des interfaces d'accès/requête aux données, les organisations qui ont une segmentation régionale ou nationale de leurs activités ont beaucoup à gagner. Ces organisations nécessitent souvent une gestion et une coordination centralisées.
Un autre cas d'utilisation majeur des data fabrics est la mise en place d'un modèle de données unifié suite à une fusion ou une acquisition. Lorsque cela se produit, la base de données et les politiques de gestion des données de l'organisation auparavant indépendante changent souvent, ce qui signifie qu'il devient plus difficile de collecter des informations au-delà des frontières organisationnelles. Une structure de données peut surmonter ce problème en créant une vue unifiée des données qui permet à l'entité combinée de s'harmoniser sur un modèle de données unique.
Alex McFarland est un journaliste et écrivain en IA qui explore les derniers développements en matière d'intelligence artificielle. Il a collaboré avec de nombreuses startups et publications d'IA dans le monde entier.
Tu peux aimer
Big Data vs Small Data : principales différences
Science des données vs informatique : principales différences
Science des données vs exploration de données : principales différences
Apprentissage en profondeur vs réseaux de neurones
Apprentissage automatique vs science des données : principales différences
Apprentissage automatique vs intelligence artificielle : principales différences