stuacach Cad is Sonraí Móra ann? - Aontú.AI
Ceangail le linn

AI 101

Cad is Sonraí Mór ann?

mm
Nuashonraithe on

Cad is Sonraí Mór ann?

Tá “Sonraí Móra” ar cheann de na focail buzz a úsáidtear go coitianta sa ré reatha, ach cad a chiallaíonn sé i ndáiríre?

Seo sainmhíniú tapa, simplí ar shonraí móra. Sonraí Big sonraí atá rómhór agus ró-chasta le láimhseáil trí mhodhanna traidisiúnta próiseála agus stórála sonraí. Cé gur sainmhíniú tapa é sin is féidir leat a úsáid mar heorastúla, bheadh ​​sé ina chuidiú tuiscint níos doimhne agus níos iomláine a bheith agat ar shonraí móra. Breathnaímid ar chuid de na coincheapa atá mar bhunús ag sonraí móra, amhail stóráil, struchtúr agus próiseáil.

Cé chomh Mór is atá Sonraí Mór?

Níl sé chomh simplí le “sonraí ar bith níos mó ná an méid ‘X’ is sonraí mór a rá”, is fachtóir thar a bheith tábhachtach é an timpeallacht ina bhfuil na sonraí á láimhseáil. lena gcinntear cad a cháilíonn mar shonraí móra. Braitheann méid na sonraí, le gur mórsonraí iad, ar an gcomhthéacs, nó ar an tasc a bhfuil na sonraí in úsáid ann. Is féidir dhá thacar sonraí de mhéideanna an-difriúla a mheas mar “sonraí móra” i gcomhthéacsanna éagsúla.

Chun a bheith níos nithiúla, má dhéanann tú iarracht comhad 200-megabyte a sheoladh mar cheangaltán ríomhphoist, ní bheadh ​​tú in ann é sin a dhéanamh. Sa chomhthéacs seo, d’fhéadfaí an comhad 200 meigeavata a mheas mar shonraí móra. I gcodarsnacht leis sin, ní fhéadfaidh sé am ar bith a ghlacadh chun comhad 200 meigeavata a chóipeáil go gléas eile laistigh den LAN céanna, agus sa chomhthéacs sin, ní mheasfar gur sonraí móra é.

Mar sin féin, déanaimis glacadh leis go bhfuil gá le 15 terabytes d’fhíseáin a réamhphróiseáil le húsáid in oiliúint feidhmchláir fís ríomhaire. Sa chás seo, tógann na comhaid físe an oiread sin spáis go dtógfadh fiú ríomhaire cumhachtach go leor ama iad go léir a phróiseáil, agus mar sin de ghnáth dáiltear an phróiseáil ar ríomhairí iolracha atá nasctha le chéile chun am próiseála a laghdú. Is cinnte go gcáileoidh na 15 terabytes seo de shonraí físeáin mar shonraí móra.

Cineálacha Struchtúir Sonraí Móra

Tagann sonraí móra i dtrí chatagóir éagsúla struchtúir: sonraí neamhstruchtúrtha, sonraí leath-struchtúrtha agus struchtúrtha.

Is éard is sonraí neamhstruchtúrtha ann ná sonraí nach bhfuil aon struchtúr inshainithe acu, rud a chiallaíonn go bunúsach nach bhfuil na sonraí ach i gcomhthiomsú mór amháin. Samplaí de shonraí neamhstruchtúrtha is ea bunachar sonraí atá lán d’íomhánna gan lipéad.

Is éard is sonraí leath-struchtúrtha ann ná sonraí nach bhfuil struchtúr foirmiúil acu, ach atá ann laistigh de struchtúr scaoilte. Mar shampla, b’fhéidir go n-áireofaí sonraí ríomhphoist mar shonraí leathstruchtúrtha, toisc go bhféadfá tagairt a dhéanamh do na sonraí atá i ríomhphoist aonair, ach níl patrúin fhoirmiúla sonraí bunaithe.

Is éard is sonraí struchtúrtha ann ná sonraí a bhfuil struchtúr foirmiúil acu, le pointí sonraí a chatagóiriú de réir gnéithe éagsúla. Sampla amháin de shonraí struchtúrtha is ea scarbhileog Excel ina bhfuil faisnéis teagmhála amhail ainmneacha, ríomhphoist, uimhreacha gutháin agus láithreáin ghréasáin.

Más mian leat tuilleadh a léamh faoi na difríochtaí sna cineálacha sonraí seo, seiceáil an nasc anseo.

Méadracht Chun Sonraí Móra a Mheasúnú

Is féidir sonraí móra a anailísiú i dtéarmaí trí mhéadracht dhifriúla: toirt, treoluas, agus éagsúlacht.

Tagraíonn toirt do mhéid na sonraí. Is minic a mhéadaíonn meánmhéid na dtacar sonraí. Mar shampla, ba é an tiomántán crua is mó in 2006 ná tiomántán crua 750 GB. I gcodarsnacht leis sin, meastar go nginfidh Facebook níos mó ná 500 terabyte sonraí in aghaidh an lae agus is é an tiomántán crua tomhaltóra is mó atá ar fáil inniu ná tiomántán crua 16 terabyte. Seans nach sonraí móra i ré eile an méid a áirmhítear mar shonraí móra i ré amháin. Gintear níos mó sonraí inniu toisc go bhfuil níos mó agus níos mó de na rudaí thart orainn feistithe le braiteoirí, ceamaraí, micreafóin agus gléasanna bailithe sonraí eile.

Tagraíonn treoluas do chomh tapa agus atá sonraí ag gluaiseacht, nó chun é sin a chur ar bhealach eile, cé mhéad sonraí a ghintear laistigh de thréimhse áirithe ama. Gineann sruthanna meán sóisialta na céadta mílte post agus tuairimí gach nóiméad, agus is dócha go mbeidh i bhfad níos lú gníomhaíochta ag do bhosca isteach ríomhphoist féin. Is sruthanna iad sruthanna sonraí móra a láimhseálann go minic na céadta mílte nó na milliúin imeachtaí i bhfíor-am níos mó nó níos lú. Samplaí de na sruthanna sonraí seo is ea ardáin chearrbhachais ar líne agus halgartaim ardmhinicíochta trádála stoc.

Tagraíonn éagsúlacht do na cineálacha éagsúla sonraí atá sa tacar sonraí. Is féidir le sonraí a bheith comhdhéanta de go leor formáidí éagsúla, ar nós fuaime, físeáin, téacs, grianghraif nó sraithuimhreacha. Go ginearálta, formáidítear bunachair shonraí thraidisiúnta chun cineál amháin, nó díreach cúpla, a láimhseáil. Chun é sin a chur ar bhealach eile, tá bunachair shonraí traidisiúnta struchtúrtha chun sonraí a choinneáil atá cothrom aonchineálach agus a bhfuil struchtúr comhsheasmhach intuartha acu. De réir mar a éiríonn feidhmchláir níos éagsúla, lán de ghnéithe éagsúla, agus de réir mar a úsáideann níos mó daoine, b’éigean bunachair shonraí a éabhlóidiú chun níos mó cineálacha sonraí a stóráil. Tá bunachair shonraí neamhstruchtúrtha an-oiriúnach chun sonraí móra a choinneáil, mar is féidir leo cineálacha iomadúla sonraí a choinneáil nach bhfuil gaol acu lena chéile.

Modhanna Láimhseála Sonraí Móra

Tá roinnt ardán agus uirlisí éagsúla ann atá deartha chun anailís ar shonraí móra a éascú. Ní mór anailís a dhéanamh ar chomhthiomsuithe móra sonraí chun patrúin brí a bhaint as na sonraí, tasc a d’fhéadfadh a bheith dúshlánach go leor le huirlisí traidisiúnta anailíse sonraí. Mar fhreagra ar an ngá atá le huirlisí chun anailís a dhéanamh ar líon mór sonraí, chruthaigh éagsúlacht cuideachtaí uirlisí anailíse sonraí móra. I measc na n-uirlisí anailíse sonraí móra tá córais mar ZOHO Analytics, Cloudera, agus Microsoft BI.

Blogger agus ríomhchláraitheoir le speisialtachtaí i Foghlaim Meaisín agus Deep Learning topaicí. Tá súil ag Daniel cabhrú le daoine eile cumhacht AI a úsáid ar mhaithe le leas sóisialta.