stub Reaalmaailma tehisintellekti juurutamise lubamine ulatuslikult – Unite.AI
Ühenda meile

Mõttejuhid

Reaalmaailma tehisintellekti juurutamise lubamine mastaapselt

mm

avaldatud

 on

Autor: Brad King, valdkonna tehnoloogiadirektor Scalality

Tehisintellekti/ML-i ja suurandmete tööriistadel on ühine joon – nad vajavad andmeid ja vajavad neid palju. Tavatarkus ütleb, et mida rohkem, seda parem. Analüütikud ennustavad, et globaalne andmete loomine kasvab aastaks 180 rohkem kui 2025 zetabaiti – ning aastal 2020 saavutas loodud ja kopeeritud andmemaht uue rekordi – 64.2 zetabaiti.

Need andmed on äärmiselt väärtuslikud – sageli asendamatud ja esindavad mõnikord ühekordseid või kord elus toimuvaid sündmusi. Neid andmeid tuleb hoida ohutult ja turvaliselt; ja kuigi hinnanguliselt jäetakse alles vaid väike protsent vastloodud andmetest, kasvab nõudlus salvestusmahu järele jätkuvalt. Tegelikult prognoositakse, et salvestusvõimsuse installeeritud baas kasvab aastatel 19.2–2020 aastase liitkasvumääraga 2025%, teatasid teadlased Statista.

Kuna luuakse rohkem andmeid – eriti nende tehisintellekti/ML-i töökoormuste tõttu –, vajavad organisatsioonid rohkem salvestusruumi, kuid mitte kõik salvestuslahendused ei suuda seda intensiivset ja tohutut töökoormust taluda. Vaja on uut lähenemist ladustamisele. Vaatame, kuidas organisatsioonid nendest väljakutsetest üle saavad, läbi kolme kasutusjuhtumi objektiivi.

Reisitööstus

Kuigi paljud meist alles harjuvad pärast enam kui aasta pikkust sulgemist uuesti reisimisega, soovib reisisektor jõuda suurel määral tagasi pandeemia-eelsesse aega. See muudab andmete tähtsuse – täpsemalt nende andmete asjakohase rakenduse ja kasutamise – veelgi olulisemaks.

Kujutage ette, mida saaksite teha teadmisega, kuhu enamik maailma lennureisijaid järgmisena reisib või kuhu nad homme lähevad. Näiteks reisibüroo jaoks oleks see tohutu.

Kuid need reisiorganisatsioonid tegelevad nii suure hulga andmetega, et nende sortimine, et välja selgitada, mis on tähendusrikas, on tohutu väljavaade. Iga päev genereeritakse umbes petabait andmeid ja osa andmeid dubleerivad sellised saidid nagu Kayak. Need andmed on ajatundlikud ja reisifirmad peavad kiiresti avastama, millised andmed on olulised. Neil on vaja tööriista, et seda mastaapi tõhusamalt hallata.

Autotööstus

Teine näide pärineb autotööstusest, mis on kindlasti üks enim räägitud kasutusjuhtumeid. Tööstus on pikka aega kõvasti tööd teinud abivahenditega, nagu sõiduraja jälgijad, kokkupõrke vältimine ja muu taoline. Kõik need andurid toovad suurel hulgal andmeid. Ja loomulikult arendavad, testivad ja kontrollivad isejuhtivaid algoritme.

Tööstus vajab paremat viisi nende salvestatud andmete mõistmiseks, et nad saaksid neid kasutada juhtumite analüüsimiseks, kus midagi valesti läks, andurite väljundeid testjuhtumina kureerida, anduriandmete alusel algoritme testida ja palju muud. Nad vajavad kvaliteedikontrolli testimist, et vältida regressioone, ja nad peavad dokumenteerima ebaõnnestunud juhtumid.

Digipatoloogia

Teine huvitav AI/ML kasutusjuht, mis on samuti hädas andmete üleujutuse ja vajadusega andmeid paremini kasutada, on digitaalne patoloogia. Sarnaselt teistele näidetele vajavad nad tegelikult võimalust neid andmeid paremini kasutada, et nad saaksid teha näiteks koeproovides patoloogiaid automaatselt tuvastada, teha kaugdiagnostikat ja nii edasi.

Kuid salvestusruum piirab täna kasutamist. Kasuliku eraldusvõimega pildid on säästlikuks salvestamiseks liiga suured. Objektide kiire salvestamine võimaldab aga uusi võimalusi – nagu pildipangad, mida saab kasutada peamise koolitusressursina, ja ruumitäitekõverate kasutamine mitme eraldusvõimega kujutiste nimetamiseks/salvestamiseks ja toomiseks objektipoes. See võimaldab ka laiendatavat ja paindlikku metaandmete märgistamist, mis muudab selle teabe otsimise ja mõtestamise lihtsamaks.

AI töökoormused nõuavad uut lähenemist

Nagu nägime kolmel ülaltoodud juhul, on ülioluline, et oleks võimalik koondada ja korraldada tohutul hulgal AI/ML töökoormustega seotud andmeid. Andmekogumid ulatuvad sageli mitme petabaidini ja jõudlusnõuded võivad kogu infrastruktuuri küllastada. Selliste suuremahuliste koolitus- ja katseandmete kogumitega tegelemisel on edu võtmeelemendid salvestuse kitsaskohtade (latentsus- ja/või läbilaskevõimeprobleemid) ja mahupiirangute/tõkete ületamine.

AI/ML/DL töökoormused nõuavad salvestusarhitektuuri, mis suudab hoida andmevoogu läbi torujuhtme ning millel on nii suurepärane töötlemata sisend-/väljundjõudlus kui ka võimsuse skaleerimise võimalus. Salvestusinfrastruktuur peab AI/ML/DL torujuhtme kõigis etappides järjest nõudlikumate nõuetega sammu pidama. Lahendus on spetsiaalselt kiiruse ja piiramatu ulatuse jaoks loodud salvestusinfrastruktuur.

Väärtuse väljavõtmine

Ei möödu nädalatki ilma lugudeta AI ja ML potentsiaalist äriprotsesse ja igapäevaelu muuta. On palju kasutusjuhtumeid, mis näitavad selgelt nende tehnoloogiate kasutamise eeliseid. AI tegelikkus ettevõttes on tänapäeval aga üks tohutult suuri andmekogumeid ja salvestuslahendusi, mis ei suuda seda tohutut töökoormust hallata. Uuendused autodes, tervishoius ja paljudes teistes tööstusharudes ei saa edasi liikuda enne, kui ladustamisprobleem on lahendatud. Objektide kiire salvestamine ületab suurandmete säilitamise väljakutse, et organisatsioonid saaksid nendest andmetest väärtust oma äritegevuse edendamiseks välja tuua.

Tehnoloogiajuhina vastutab Brad King suurimate süsteemide projekteerimise eest Scalality levib üle maailma. Nende hulka kuuluvad mitme petabaidi, mitme saidi süsteemid sadade serveritega. Brad on üks Scality kaasasutajatest. Ta alustas oma mitmetahulist karjääri mereväe arhitektina Prantsuse mereväes, tehes suurte laevade ümber laevade ümbermineku ja lainete arvulisi simulatsioone. Seejärel liitus ta mitmeks aastaks Pariisis asuva Schlumbergeri uurimislaboriga, kus töötas turbulentse vedeliku dünaamika, labori automatiseerimise, suuremahuliste paralleelsete arvsimulatsioonide ja uute Interneti-tehnoloogiate kallal, sealhulgas Schlumbergeri rahastatud NCSA projektide (nt Mosaic) monitooringuga.