- Terminologia (A a D)
- Control de la capacitat d'IA
- AIOps
- Albumentacions
- Rendiment dels recursos
- Autocodificador
- Retropropagació
- Teorema de Bayes
- Big Data
- Chatbot: una guia per a principiants
- Pensament computacional
- Visió per ordinador
- Matriu de confusió
- Xarxes neuronals revolucionàries
- Seguretat cibernètica
- Data Fabric
- Narració de dades
- La ciència de dades
- Magatzematge de dades
- Arbre de decisions
- Deepfakes
- Aprenentatge profund
- Aprenentatge de reforç profund
- DevOps
- DevSecOps
- Models de difusió
- Bessó digital
- Reducció de la dimensionalitat
- Terminologia (E a K)
- Edge AI
- Emoció AI
- Aprenentatge conjunt
- Hacking ètic
- ETL
- IA explicable
- Aprenentatge federat
- FinOps
- IA generativa
- Xarxa adversària generativa
- Generativa vs. discriminativa
- Augment del gradient
- Descens Gradient
- Aprenentatge de pocs tirs
- Classificació d'imatges
- Operacions de TI (ITOps)
- Automatització d'incidències
- Enginyeria d'influència
- K-Means Clustering
- K-Veïns més propers
- Terminologia (L a Q)
- Terminologia (R a Z)
- Aprenentatge de reforç
- IA responsable
- RLHF
- Automatització de processos robotitzats
- Estructurat vs no estructurat
- Anàlisi de sentiments
- Supervisat vs no supervisat
- Suport de màquines vectorials
- Dades sintètiques
- Mitjans sintètics
- Classificació de textos
- TinyML
- Transferència d'aprenentatge
- Xarxes neuronals transformadores
- Prova de Turing
- Cerca de semblança de vectors
IA 101
Què és un Data Fabric?
Taula de continguts
Sovint associat amb la intel·ligència artificial (IA) i l'aprenentatge automàtic (ML), un teixit de dades és una de les principals eines per convertir dades en brut en intel·ligència empresarial.
Però, què és exactament un teixit de dades?
Un teixit de dades és una arquitectura i programari que ofereix una col·lecció unificada d'actius de dades, bases de dades i arquitectures de bases de dades dins d'una empresa. Facilita la integració d'extrem a extrem de diversos canals de dades i entorns de núvol mitjançant l'ús de sistemes intel·ligents i automatitzats.
Els teixits de dades han esdevingut més importants a mesura que continuen produint-se desenvolupaments importants amb el núvol híbrid, l'Internet de les coses (IoT), la IA i la informàtica de punta. Això ha provocat un augment massiu del big data, la qual cosa significa que les organitzacions encara tenen més per gestionar.
Per fer front a aquestes grans dades, les empreses han de centrar-se en la unificació i la governança dels entorns de dades, cosa que ha suposat diversos reptes com ara les sitges de dades, els riscos de seguretat i els colls d'ampolla en la presa de decisions. Aquests reptes són els que han fet que els equips de gestió de dades adopten solucions de teixit de dades, que ajuden a unificar els sistemes de dades, reforçar la privadesa i la seguretat, millorar la governança i oferir més accessibilitat a les dades als treballadors.
La integració de dades condueix a una presa de decisions més basada en dades i, mentre que les empreses han utilitzat històricament diferents plataformes de dades per a aspectes específics del negoci, els teixits de dades permeten veure les dades de manera més cohesionada. Tot això condueix a una millor comprensió del cicle de vida del client i ajuda a establir connexions entre les dades.
Quin és el propòsit d'un Data Fabric?
Els teixits de dades s'utilitzen per establir una visió unificada de les dades associades, que facilita l'accés a la informació independentment de la seva ubicació, associació de bases de dades o estructura. Els teixits de dades també simplifiquen l'anàlisi amb IA i aprenentatge automàtic.
Un altre propòsit d'un teixit de dades és facilitar el desenvolupament d'aplicacions, ja que crea un model comú per accedir a la informació independent de les sitges tradicionals d'aplicacions i bases de dades. Aquests models proporcionen un millor accés a la informació, però també milloren l'eficiència mitjançant l'establiment d'una única capa on l'accés a les dades es pot gestionar a través de tots els recursos.
Tot i que no hi ha una única arquitectura de dades per a un teixit de dades, sovint es diu que hi ha sis components fonamentals per a aquest tipus de marc de dades:
Gestió de dades: Responsable del govern i la seguretat de les dades.
Ingesta de dades: Reuneix dades del núvol i identifica connexions entre dades estructurades i no estructurades.
procés de dades: perfecciona les dades per assegurar-se que només apareixen dades rellevants per a l'extracció de dades.
Orquestració de dades: una capa molt important del marc responsable de transformar, integrar i netejar les dades perquè es puguin utilitzar a tot el negoci.
Descobriment de dades: apareix noves maneres d'integrar fonts de dades.
Accés a les dades: Permet el consum de dades, garanteix els permisos adequats per a determinats equips per complir la normativa i ajuda a emergir dades rellevants mitjançant l'ús de taulers de control i altres eines de visualització de dades.
Beneficis d'un Data Fabric
Hi ha molts avantatges comercials i tècnics dels teixits de dades, com ara:
Trenca les sitges de dades: Les empreses modernes sovint pateixen sitges de dades, ja que les bases de dades modernes s'associen a grups d'aplicacions i sovint creixen a mesura que s'afegeixen de noves a l'empresa. Les sitges de dades contenen dades de diferents estructures i formats, però els teixits de dades poden millorar l'accés a la informació de l'empresa i utilitzar les dades recopilades per millorar l'eficiència operativa.
Uneix bases de dades: Els teixits de dades també ajuden les empreses a unir bases de dades repartides per una gran àrea. Asseguren que les diferències d'ubicació no generen barreres d'accés. Els teixits de dades simplifiquen el desenvolupament d'aplicacions i es poden utilitzar per optimitzar l'ús de dades d'aplicacions específiques sense fer que les dades siguin menys accessibles per a altres aplicacions. També poden unificar les dades que ja s'han traslladat a les sitges.
Única via d'accés a la informació: Els teixits de dades milloren la portabilitat de les aplicacions i actuen com una manera única d'accedir a la informació tant al núvol com al centre de dades.
Genereu estadístiques a un ritme accelerat: Les solucions de teixit de dades poden gestionar fàcilment conjunts de dades complexos, la qual cosa accelera el temps per obtenir informació. La seva arquitectura permet que models d'anàlisi i algorismes cognitius preconstruïts processin dades a escala i velocitat.
Utilitzat per usuaris tècnics i no tècnics: Els teixits de dades no només estan dirigits a usuaris tècnics. L'arquitectura és flexible i es pot utilitzar amb una àmplia gamma d'interfícies d'usuari. Poden ajudar a crear taulers de control que els executius empresarials puguin entendre, o les seves eines sofisticades es poden utilitzar per a l'exploració de dades pels científics de dades.
Bones pràctiques per a la implementació de Data Fabrics
El mercat global de dades està en constant expansió i hi ha una gran demanda a l'espai. Moltes empreses busquen implementar una arquitectura de dades per optimitzar les seves dades empresarials i segueixen algunes pràctiques recomanades habituals.
Una d'aquestes pràctiques és adoptar un model de procés DataOps. Data fabric i DataOps no són idèntics, però segons un model DataOps, hi ha una estreta connectivitat entre els processos de dades, les eines i els usuaris. En alinear els usuaris per confiar en les dades, poden aprofitar les eines i aplicar els coneixements. Sense un model de DataOps, els usuaris poden lluitar per extreure prou del teixit de dades.
Una altra bona pràctica és evitar convertir el teixit de dades en un llac de dades més, que és un fet habitual. Per exemple, no es pot aconseguir un teixit de dades real si teniu tots els components arquitectònics, com ara fonts de dades i analítiques, però cap de les API i SDK. El teixit de dades es refereix al disseny de l'arquitectura, no a una sola tecnologia. I alguns dels trets que defineixen l'arquitectura són la interoperabilitat entre components i la preparació per a la integració.
També és fonamental que l'organització entengui el seu compliment i els requisits reglamentaris. Una arquitectura de teixit de dades pot millorar la seguretat, la governança i el compliment normatiu.
Com que les dades no estan disperses entre els sistemes, hi ha una menor amenaça d'exposició de dades sensibles. Dit això, és important entendre els requisits normatius i de compliment abans d'implementar un teixit de dades. Diferents tipus de dades poden correspondre a diferents jurisdiccions reguladores. Una solució és utilitzar polítiques de compliment automatitzades que garanteixin que la transformació de dades compleixi les lleis.
Casos d'ús de Data Fabric
Hi ha molts usos diferents per a un teixit de dades, però alguns són molt comuns. Un exemple comú és la col·lecció virtual/lògica d'actius de dades geogràficament diversos per facilitar l'accés i l'anàlisi. El teixit de dades s'utilitza normalment per a la gestió empresarial centralitzada en aquest cas. Com que les operacions de línia distribuïda que recullen i utilitzen les dades són compatibles amb aplicacions tradicionals i interfícies d'accés/consulta de dades, hi ha molt a guanyar les organitzacions que tenen una segmentació regional o nacional de les seves activitats. Aquestes organitzacions sovint requereixen una gestió i coordinació centrals.
Un altre cas d'ús important dels teixits de dades és l'establiment d'un model de dades unificat després d'una fusió o adquisició. Quan es produeixen, la base de dades i les polítiques de gestió de dades de l'organització anteriorment independent sovint canvien, el que significa que es fa més difícil recopilar informació a través dels límits de l'organització. Un teixit de dades pot superar-ho creant una visió unificada de les dades que permeti que l'entitat combinada s'harmonitzi en un únic model de dades.
Alex McFarland és un periodista i escriptor d'IA que explora els últims desenvolupaments en intel·ligència artificial. Ha col·laborat amb nombroses startups i publicacions d'IA a tot el món.
Potser t'agradi
Big Data vs. Small Data: Diferències clau
Ciència de dades vs informàtica: diferències clau
Ciència de dades vs mineria de dades: diferències clau
Aprenentatge profund vs xarxes neuronals
Aprenentatge automàtic vs ciència de dades: diferències clau
Aprenentatge automàtic vs intel·ligència artificial: diferències clau