- Terminológia (A-tól D-ig)
- AI képességvezérlés
- AIOps
- albumációk
- Eszköz teljesítménye
- Autoencoder
- Visszaszaporítás
- Bayes-tétel
- Big adatok
- Chatbot: Útmutató kezdőknek
- Számítási gondolkodás
- Számítógépes látás
- Zavart mátrix
- Konvolúciós neurális hálózatok
- Kiberbiztonság
- Data Fabric
- Adattörténetmondás
- Data Science
- Adattárolás
- Döntési fa
- Deepfakes
- Deep Learning
- Mély megerősítésű tanulás
- DevOps
- DevSecOps
- Diffúziós modellek
- Digitális iker
- Dimenzionalitás csökkentés
- Terminológia (E-től K-ig)
- Edge AI
- Érzelem AI
- Együttes tanulás
- Etikai hackelés
- ETL
- Megmagyarázható AI
- Egyesített tanulás
- FinOps
- Generatív AI
- Generatív versenytársak hálózata
- Generatív vs. diszkriminatív
- Gradiens Boosting
- Gradiens Descent
- Few-Shot Learning
- Képosztályozás
- IT-műveletek (ITOps)
- Incidens automatizálás
- Befolyásolás Mérnökség
- K-Means klaszterezés
- K-Legközelebbi szomszédok
- Terminológia (L-től Q-ig)
- Terminológia (R-től Z-ig)
- Erősítő tanulás
- Felelős mesterséges intelligencia
- RLHF
- Robotikus folyamat automatizálás
- Strukturált vs strukturálatlan
- Érzelmi elemzés
- Felügyelt vs nem felügyelt
- Támogatja a vektoros gépeket
- Szintetikus adatok
- Szintetikus média
- Szöveg osztályozása
- TinyML
- Transzfer tanulás
- Transzformátor neurális hálózatok
- Turing teszt
- Vektoros hasonlóság keresése
AI 101
Strukturált vs strukturálatlan adatok
Tartalomjegyzék
Nem strukturált adatok olyan adat, amely nincs előre meghatározott módon szervezve, vagy nem tartalmaz konkrét adatmodellt. Közben, strukturált adatok olyan adat, amely egyértelmű, definiálható kapcsolatokkal rendelkezik az adatpontok között, és egy előre meghatározott modell tartalmazza ezeket. Ez a rövid válasz a strukturált és a strukturálatlan adatok közötti különbségre, de nézzük meg közelebbről a két adattípus közötti különbségeket.
Mi az a strukturált adat?
Ha számítástechnikáról van szó, az adatstruktúrák az adatok tárolásának és rendszerezésének sajátos módjait jelentik. A különböző adatstruktúrák eltérő kapcsolatokkal rendelkeznek az adatpontok között, de az adatok strukturálatlanok is lehetnek. Mit jelent az, hogy az adatok strukturáltak? A definíció világosabbá tétele érdekében vessünk egy pillantást az adatok strukturálásának néhány különféle módjára.
A strukturált adatokat gyakran táblázatokban tárolják, például Excel fájlok vagy SQL adatbázisok. Ezekben az esetekben az adatok sorai és oszlopai különböző változókat vagy jellemzőket tartalmaznak, és gyakran meg lehet állapítani az adatpontok közötti kapcsolatot az adatsorok és oszlopok metszéspontjának ellenőrzésével. A strukturált adatok könnyen beilleszthetők egy relációs adatbázisba, és a strukturált adatkészlet különböző jellemzőire példák lehetnek például nevek, címek, dátumok, időjárási statisztikák, hitelkártyaszámok stb. Míg a strukturált adatok leggyakrabban szöveges adatok, strukturált adatokként is tárolhatók például képek és hangok.
A strukturált adatok gyakori forrásai közé tartoznak például az érzékelőkből gyűjtött adatok, webnaplók, hálózati adatok, valamint kiskereskedelmi vagy e-kereskedelmi adatok. Strukturált adatok generálhatók úgy is, hogy az emberek táblázatokat vagy adatbázisokat töltenek ki számítógépekről és más eszközökről gyűjtött adatokkal. Például az online űrlapokon gyűjtött adatok gyakran azonnal bekerülnek egy adatstruktúrába.
A strukturált adatok tárolásának hosszú története van relációs adatbázisok és SQL. Ezek a tárolási módszerek népszerűek, mivel ezekben a formátumokban könnyű olvasni és írni, és a legtöbb platform és nyelv képes értelmezni ezeket az adatformátumokat.
Gépi tanulási környezetben a strukturált adatokkal könnyebb betanítani a gépi tanulási rendszert, mivel az adatokon belüli minták egyértelműbbek. Bizonyos funkciók betáplálhatók egy gépi tanulási osztályozóba, és felhasználhatók más adatpéldányok címkézésére a kiválasztott funkciók alapján. Ezzel szemben a gépi tanulási rendszer strukturálatlan adatokon való betanítása általában nehezebb, a később világossá váló okok miatt.
Mi az a strukturálatlan adat?
A strukturálatlan adatok olyan adatok, amelyek nincsenek előre meghatározott adatmodell vagy -struktúra szerint rendezve. A strukturálatlan adatokat gyakran kvalitatív adatoknak nevezik, mivel nem elemezhetők vagy dolgozhatók fel hagyományos módszerekkel a strukturált adatokhoz használt szokásos módszerekkel.
Mivel a strukturálatlan adatoknak nincsenek meghatározott kapcsolatai az adatpontok között, ezért nem szervezhetők relációs adatbázisokba. Ezzel szemben a strukturálatlan adatok tárolásának módja jellemzően a egy NoSQL adatbázis, vagy egy nem relációs adatbázis. Ha az adatbázis szerkezete kevéssé aggodalomra ad okot, NoSQL-adatbázis helyett egy adattó vagy egy nagy mennyiségű strukturálatlan adattár használható az adatok tárolására.
A strukturálatlan adatokat nehéz elemezni, és a strukturálatlan adatok értelmezéséhez gyakran meg kell vizsgálni az egyes adatokat, hogy felismerjük a lehetséges jellemzőket, majd megvizsgáljuk, hogy ezek a jellemzők előfordulnak-e a készlet más adatrészeiben.
Az adatok túlnyomó többsége strukturálatlan formátumú, a becslések szerint a strukturálatlan adatok az összes adat körülbelül 80%-át teszik ki. Adatbányászati technikák használhatók az adatok strukturálására.
Ami a gépi tanulást illeti, bizonyos technikák segíthetnek a strukturálatlan adatok rendezésében és strukturált adatokká alakításában. A strukturálatlan adatok strukturált adatokká alakításának népszerű eszköze az autoencoder nevű rendszer.
Blogger és programozó szakterületekkel Gépi tanulás és a Deep Learning témákat. Daniel abban reménykedik, hogy segíthet másoknak az AI erejét társadalmi javára használni.