- Terminologia (A–D)
- AI Capability Control
- AI Ops
- Albuminaatiot
- Omaisuuden suorituskyky
- Automaattinen kooderi
- backpropagation
- Bayes-lause
- Big Data
- Chatbot: Aloittelijan opas
- Laskennallinen ajattelu
- Tietokoneen visio
- Sekaannusmatriisi
- Neuvontaverkot
- tietoverkkojen
- Tietokangas
- Tietojen tarinankerronta
- data Science
- Tietovarastointi
- Päätöspuu
- Deepfakes
- Deep Learning
- Syvävahvistusoppiminen
- DevOps
- DevSecOps
- Diffuusiomallit
- Digitaalinen Twin
- Ulottuvuuden pienentäminen
- Terminologia (E–K)
- Edge AI
- Emotion AI
- Yhtye-oppiminen
- Eettinen hakkerointi
- ETL
- Selitettävä AI
- Federoitu oppiminen
- FinOps
- Generatiivinen AI
- Generatiivinen kilpaileva verkosto
- Generatiivinen vs. syrjivä
- Liukuvärjäys
- Kaltevuuslasku
- Muutaman laukauksen oppiminen
- Kuvien luokittelu
- IT-toiminnot (ITOps)
- Tapahtumaautomaatio
- Vaikutustekniikka
- K-tarkoittaa klusterointia
- K-Lähimmät naapurit
- Terminologia (L–Q)
- Terminologia (R–Z)
AI 101
Mikä on Data Fabric?
Sisällysluettelo
Usein tekoälyyn (AI) ja koneoppimiseen (ML) yhdistetty tietokangas on yksi tärkeimmistä työkaluista raakadatan muuntamiseksi liiketoimintaälyksi.
Mutta mikä tietokangas oikein on?
Tietokangas on arkkitehtuuri ja ohjelmisto, joka tarjoaa yhtenäisen kokoelman tietoresursseja, tietokantoja ja tietokanta-arkkitehtuureja yrityksessä. Se helpottaa erilaisten dataputkien ja pilviympäristöjen integrointia päästä päähän älykkäiden ja automatisoitujen järjestelmien avulla.
Datakudokset ovat tulleet entistä tärkeämmiksi, kun hybridipilven, esineiden internetin (IoT), tekoälyn ja reunalaskentaan liittyvät merkittävät kehitystyöt jatkuvat. Tämä on lisännyt valtavasti big dataa, mikä tarkoittaa, että organisaatioilla on entistä enemmän hallittavaa.
Tämän big datan käsittelemiseksi yritysten on keskityttävä tietoympäristöjen yhtenäistämiseen ja hallintaan, mikä on asettanut useita haasteita, kuten tietosiilot, turvallisuusriskit ja pullonkaulat päätöksenteossa. Nämä haasteet ovat johtaneet siihen, että tiedonhallintaryhmät ovat ottaneet käyttöön tietokangasratkaisuja, jotka auttavat yhtenäistämään tietojärjestelmiä, vahvistamaan yksityisyyttä ja turvallisuutta, parantamaan hallintoa ja parantamaan tietojen saatavuutta työntekijöille.
Tietojen integrointi johtaa datalähtöisempään päätöksentekoon, ja vaikka yritykset ovat perinteisesti käyttäneet erilaisia tietoalustoja tiettyihin liiketoiminnan osa-alueisiin, tietokankaat mahdollistavat datan yhtenäisemmän tarkastelun. Kaikki tämä johtaa parempaan ymmärrykseen asiakkaan elinkaaresta ja auttaa luomaan yhteyksiä datan välille.
Mikä on datakankaan tarkoitus?
Tietokankaita käytetään muodostamaan yhtenäinen näkymä liittyvästä tiedosta, mikä helpottaa pääsyä tietoihin riippumatta sen sijainnista, tietokantayhteydestä tai rakenteesta. Tietokankaat myös yksinkertaistavat analysointia tekoälyn ja koneoppimisen avulla.
Tietokankaan toinen tarkoitus on helpottaa sovelluskehitystä, koska se luo yhteisen mallin tiedonhakuun erillään perinteisistä sovellus- ja tietokantasiiloista. Nämä mallit tarjoavat paremman tiedon saatavuuden, mutta ne myös parantavat tehokkuutta luomalla yhden kerroksen, jossa tietojen käyttöä voidaan hallita kaikissa resursseissa.
Vaikka tietokankaalla ei ole yhtä ainoaa tietoarkkitehtuuria, usein sanotaan, että tämän tyyppisessä tietokehyksessä on kuusi peruskomponenttia:
Tiedonhallinta: Vastaat tietojen hallinnasta ja tietoturvasta.
Tietojen otto: Kokoaa pilvitiedot yhteen ja tunnistaa yhteyksiä strukturoidun ja strukturoimattoman tiedon välillä.
Tietojenkäsittely: Tarkentaa tietoja varmistaakseen, että vain asiaankuuluvat tiedot tulevat esiin tietojen poimimista varten.
Tietojen järjestäminen: Todella tärkeä kehyksen kerros, joka vastaa tietojen muuntamisesta, integroimisesta ja puhdistamisesta, jotta sitä voidaan käyttää kaikkialla yrityksessä.
Tietojen etsiminen: Tuo esiin uusia tapoja integroida tietolähteitä.
Tietojen käyttö: Mahdollistaa tietojen kulutuksen, varmistaa tietyille tiimeille oikeat käyttöoikeudet säädösten noudattamiseen ja auttaa nostamaan oleellista dataa kojetaulujen ja muiden tietojen visualisointityökalujen avulla.
Data Fabricin edut
Datakankailla on monia liiketoiminnallisia ja teknisiä etuja, kuten:
Break Data Siilot: Nykyaikaiset yritykset kärsivät usein tietosiiloista, koska nykyaikaiset tietokannat liittyvät sovellusryhmiin ja kasvavat usein, kun yritykseen lisätään uusia. Tietosiiloissa on eri rakenteita ja muotoja olevia tietoja, mutta tietokankaat voivat parantaa yritystietojen saatavuutta ja käyttää kerättyä tietoa toiminnan tehostamiseen.
Yhdistä tietokannat: Tietokankaat auttavat myös yrityksiä yhdistämään laajalle alueelle hajallaan olevia tietokantoja. Ne varmistavat, että sijaintierot eivät aiheuta pääsyn esteitä. Tietokankaat yksinkertaistavat sovelluskehitystä, ja niitä voidaan käyttää optimoimaan tietyn sovellusdatan käyttöä ilman, että tiedot heikkenevät muiden sovellusten käytettävissä. Ne voivat myös yhdistää tietoja, jotka on jo siirretty siiloihin.
Yksi tapa saada tietoja: Tietokankaat parantavat sovellusten siirrettävyyttä ja toimivat yhtenä tapana käyttää tietoja sekä pilvessä että datakeskuksessa.
Luo näkemyksiä kiihtyvällä tahdilla: Tietokangasratkaisut pystyvät helposti käsittelemään monimutkaisia tietojoukkoja, mikä nopeuttaa oivalluksiin kuluvaa aikaa. Niiden arkkitehtuuri mahdollistaa valmiiden analytiikkamallien ja kognitiivisten algoritmien käsittelyn dataa mittakaavassa ja nopeudella.
Teknisten ja ei-teknisten käyttäjien käyttämä: Datakankaat eivät ole tarkoitettu vain teknisille käyttäjille. Arkkitehtuuri on joustava ja sitä voidaan käyttää useiden käyttöliittymien kanssa. Ne voivat auttaa rakentamaan hallintapaneeleja, joita yritysjohtajat ymmärtävät, tai tietotutkijat voivat käyttää heidän kehittyneitä työkalujaan tietojen tutkimiseen.
Parhaat käytännöt datakankaiden käyttöönottamiseksi
Globaalit datamarkkinat laajenevat jatkuvasti ja alalla on vahvaa kysyntää. Monet yritykset haluavat ottaa käyttöön tietoarkkitehtuurin optimoidakseen yritystietojaan ja noudattavat joitain yleisiä parhaita käytäntöjä.
Yksi tällainen käytäntö on omaksua DataOps-prosessimalli. Datakangas ja DataOps eivät ole identtisiä, mutta DataOps-mallin mukaan dataprosessien, työkalujen ja käyttäjien välillä on läheinen yhteys. Mukauttamalla käyttäjät luottamaan tietoihin he voivat hyödyntää työkaluja ja soveltaa oivalluksia. Ilman DataOps-mallia käyttäjillä on vaikeuksia poimia tarpeeksi tietokankaasta.
Toinen paras käytäntö on välttää muuttamasta tietokangasta vain uusi datajärvi, mikä on yleinen ilmiö. Esimerkiksi todellista tietorakennetta ei voida saavuttaa, jos sinulla on kaikki arkkitehtoniset komponentit, kuten tietolähteet ja analytiikka, mutta ei mitään API:ita ja SDK:ita. Tietokangas viittaa arkkitehtuurisuunnitteluun, ei yksittäiseen tekniikkaan. Ja eräitä arkkitehtuurin määrittäviä piirteitä ovat komponenttien välinen yhteentoimivuus ja integrointivalmius.
On myös tärkeää, että organisaatio ymmärtää vaatimustenmukaisuuden ja säädöstenmukaisuuden. Tietorakennearkkitehtuuri voi parantaa turvallisuutta, hallintoa ja säädöstenmukaisuutta.
Koska tiedot eivät ole hajallaan järjestelmissä, arkaluontoisten tietojen altistumisen uhka on pienempi. Tästä huolimatta on tärkeää ymmärtää vaatimustenmukaisuus- ja sääntelyvaatimukset ennen tietorakenteen käyttöönottoa. Eri tietotyypit voivat kuulua eri lainkäyttöalueisiin. Yksi ratkaisu on käyttää automaattisia noudattamiskäytäntöjä, jotka varmistavat, että tietojen muuntaminen on lakien mukainen.
Data Fabric -käyttötapaukset
Tietokankaalle on monia erilaisia käyttötarkoituksia, mutta muutamat ovat erittäin yleisiä. Yksi tällainen yleinen esimerkki on maantieteellisesti erilaisten tietoresurssien virtuaalinen/looginen kokoelma käytön ja analysoinnin helpottamiseksi. Tietokangasta käytetään yleensä tässä tapauksessa keskitettyyn liiketoiminnan hallintaan. Koska dataa kerääviä ja käyttäviä hajautettuja linjatoimintoja tuetaan perinteisten sovellus- ja tiedonhaku-/kyselyrajapintojen kautta, organisaatioilla, joilla on alueellinen tai valtakunnallinen toimintansa segmentointi, on paljon voitettavaa. Nämä organisaatiot vaativat usein keskitettyä hallintoa ja koordinointia.
Toinen tärkeä tietokantojen käyttötapa on yhtenäisen tietomallin luominen sulautumisen tai yrityskaupan jälkeen. Kun nämä tapahtuvat, aiemmin itsenäisen organisaation tietokanta- ja tiedonhallintakäytännöt usein muuttuvat, jolloin tiedon kerääminen organisaatiorajojen yli vaikeutuu. Tietokangas voi voittaa tämän luomalla yhtenäisen näkymän tiedoista, jonka avulla yhdistetty kokonaisuus voi harmonisoitua yhden tietomallin perusteella.
Alex McFarland on tekoälytoimittaja ja kirjailija, joka tutkii tekoälyn viimeisintä kehitystä. Hän on tehnyt yhteistyötä lukuisten AI-startup-yritysten ja -julkaisujen kanssa maailmanlaajuisesti.