stuacach Cad is KNN (K-Na comharsana is gaire) ann? - Aontú.AI
Ceangail le linn
Máistir-rang AI:

AI 101

Cad is KNN (K-Na comharsana is gaire) ann?

mm
Nuashonraithe on

Cad é K-Comharsana is cóngaraí (KNN)?

Is teicníc meaisínfhoghlama agus algartam foghlama é K-Nearest Neighbours a is féidir é a úsáid le haghaidh aischéimniúcháin agus tascanna aicmithe araon. K- Comharsana is gaire scrúdú na lipéid ar líon roghnaithe pointí sonraí timpeall ar spriocphointe sonraí, chun tuar a dhéanamh faoin rang a dtiteann an pointe sonraí isteach. Is algartam simplí ach an-chumhachtach é K-Nearest Neighbours (KNN), agus ar na cúiseanna sin, tá sé ar cheann de na halgartaim meaisínfhoghlama is coitianta. Léim go domhain isteach san algartam KNN agus féach go beacht conas a oibríonn sé. Má bhíonn tuiscint mhaith agat ar an gcaoi a n-oibríonn KNN, beidh tú buíoch as na cásanna úsáide is fearr agus is measa do KNN.

Forbhreathnú ar K-Na Comharsana is cóngaraí (KNN)

Grianghraf: Antti Ajanki AnAj via Wikimedia Commons, CC BY SA 3.0 ( https://commons.wikimedia.org/wiki/File:KnnClassification.svg)

Déanaimis tacar sonraí a shamhlú ar eitleán 2T. Pictiúr roinnt pointí sonraí ar ghraf, scaipthe ar an ngraf i gcnuasaigh bheaga. Scrúdaíonn KNN dáileadh na bpointí sonraí agus, ag brath ar na hargóintí a thugtar don tsamhail, scarann ​​sé na pointí sonraí ina ngrúpaí. Tugtar lipéad do na grúpaí seo ansin. Is é an toimhde phríomha a dhéanann samhail KNN ná go bhfuil na pointí sonraí/cásanna sonraí atá cóngarach dá chéile an-chosúil, agus má tá pointe sonraí i bhfad ar shiúl ó ghrúpa eile tá sé neamhchosúil leis na pointí sonraí sin.

Ríomhann samhail KNN cosúlacht agus úsáid á baint as an bhfad idir dhá phointe ar ghraf. Dá mhéad an fad idir na pointí is ea is lú cosúlachtaí atá siad. Tá bealaí éagsúla ann chun an fad idir pointí a ríomh, ach is é an t-achar-mhéadrach is coitianta ná fad Eiclídeach (an fad idir dhá phointe i líne dhíreach).

Is algartam foghlama maoirsithe é KNN, rud a chiallaíonn go gcaithfidh lipéid a bheith sannta dóibh/caithfidh a gcuid ranganna a bheith ar eolas ag na samplaí sa tacar sonraí. Tá dhá rud tábhachtach eile ar eolas faoi KNN. Gcéad dul síos, is algartam neamh-pharaiméadrach é KNN. Ciallaíonn sé seo nach ndéantar aon toimhdí faoin tacar sonraí nuair a úsáidtear an tsamhail. Ina ionad sin, tá an tsamhail tógtha go hiomlán ó na sonraí a cuireadh ar fáil. Ar an dara dul síos, níl aon scoilteadh ar an tacar sonraí ina thacair oiliúna agus tástála agus KNN á úsáid. Ní dhéanann KNN ginearálú idir sraith oiliúna agus tástála, mar sin baintear úsáid as na sonraí oiliúna go léir freisin nuair a iarrtar ar an tsamhail tuar a dhéanamh.

Conas a Oibríonn Algartam KNN

Téann algartam KNN trí phríomhchéim de réir mar a dhéantar é:

  1. K a shocrú leis an líon comharsan roghnaithe.
  2. An fad idir sampla soláthraithe/tástála agus samplaí an tacair sonraí a ríomh.
  3. Na hachair ríofa a shórtáil.
  4. Faigh lipéid na n-iontrálacha barr K.
  5. Tuar faoin sampla tástála a thabhairt ar ais.

Sa chéad chéim, roghnaíonn an t-úsáideoir K agus insíonn sé don algartam cé mhéad comharsan (cé mhéad pointe sonraí máguaird) ba cheart a mheas agus breithiúnas á thabhairt maidir leis an ngrúpa lena mbaineann an spriocshampla. Sa dara céim, tabhair faoi deara go seiceálann an tsamhail an fad idir an spriocshampla agus gach sampla sa tacar sonraí. Cuirtear na faid isteach i liosta ansin agus sórtáiltear iad. Ina dhiaidh sin, déantar an liosta sórtáilte a sheiceáil agus cuirtear na lipéid le haghaidh na n-eilimintí K is fearr ar ais. I bhfocail eile, má tá K socraithe go 5, seiceálann an tsamhail lipéid na 5 phointe sonraí is gaire don spriocphointe sonraí. Nuair a dhéantar tuar faoin spriocphointe sonraí, bíonn sé tábhachtach má tá an tasc a aischéimniú or aicmiú tasc. Maidir le tasc aischéimnithí, úsáidtear meán na lipéid bharr K, agus úsáidtear modh na lipéid bharr K i gcás aicmithe.

Braitheann na hoibríochtaí matamaitice cruinne a úsáidtear chun KNN a dhéanamh ar an bhfad-mhéadrach a roghnaíodh. Más mian leat tuilleadh a fhoghlaim faoin gcaoi a ríomhtar an mhéadracht, is féidir leat léamh faoi chuid de na méadrachtaí is coitianta, mar shampla Eoiclídeach, Manhattan, agus Minkowski.

Cén Fáth Atá Luach K

Is é an príomhtheorannú agus KNN á úsáid ná go bhféadfaí luach míchuí K a roghnú (an líon mícheart comharsana le cur san áireamh). Má tharlaíonn sé seo, d’fhéadfadh go n-imeoidh na tuartha ar ais go substaintiúil. Tá sé an-tábhachtach, agus algartam KNN á úsáid, go roghnófaí an luach cuí do K. Ba mhaith leat luach a roghnú do K a uasmhéadaíonn cumas an mhúnla tuar a dhéanamh ar shonraí nach bhfacthas riamh cheana agus líon na n-earráidí a dhéanann sé á laghdú.

Grianghraf: Agor153 via Wikimedia Commons, CC BY SA 3.0 ( https://en.wikipedia.org/wiki/File:Map1NN.png)

Ciallaíonn luachanna níos ísle K nach bhfuil na tuartha a dhéanann an KNN chomh cobhsaí agus chomh hiontaofa. Chun tuiscint a fháil ar an bhfáth go bhfuil sé seo amhlaidh, smaoinigh ar chás ina bhfuil 7 gcomharsan againn thart ar spriocphointe sonraí. Glacaimid leis go bhfuil an tsamhail KNN ag obair le luach K de 2 (táimid ag iarraidh air breathnú ar an dá chomharsa is gaire chun tuar a dhéanamh). Má bhaineann formhór mór na gcomharsana (cúigear as seachtar) leis an rang Gorm, ach gur Dearg an dá chomharsa is gaire, tuarfaidh an tsamhail gurb é Dearg an sampla fiosrúcháin. In ainneoin buille faoi thuairim an tsamhail, i gcás den sórt sin bheadh ​​Gorm ina buille faoi thuairim níos fearr.

Más é seo an cás, cén fáth nach roghnaíonn tú ach an luach K is airde is féidir linn? Tá sé seo amhlaidh toisc go laghdófar cruinneas freisin má chuirtear in iúl don mhúnla an iomarca comharsana a mheas. De réir mar a mhéadaíonn an ga a mheasann an tsamhail KNN, tosóidh sé ar deireadh ag smaoineamh ar phointí sonraí atá níos gaire do ghrúpaí eile ná mar atá siad mar spriocphointe sonraí agus cuirfear tús le mí-rangú. Mar shampla, fiú dá mbeadh an pointe a roghnaíodh ar dtús i gceann de na réigiúin dhearga thuas, dá mbeadh K socraithe ró-ard, bhainfeadh an tsamhail amach sna réigiúin eile chun pointí a mheas. Agus samhail KNN in úsáid, déantar iarracht luachanna éagsúla K féachaint cén luach a thugann an fheidhmíocht is fearr don mhúnla.

Buntáistí agus Míbhuntáistí KNN

Déanaimis cuid de na buntáistí agus na míbhuntáistí a bhaineann leis an tsamhail KNN a scrúdú.

Son:

Is féidir KNN a úsáid le haghaidh aischéimniúcháin agus tascanna aicmithe, murab ionann agus roinnt algartam foghlama maoirsithe eile.

Tá KNN an-chruinn agus simplí le húsáid. Tá sé éasca a léirmhíniú, a thuiscint, agus a chur i bhfeidhm.

Ní dhéanann KNN aon boinn tuisceana faoi na sonraí, rud a chiallaíonn gur féidir iad a úsáid le haghaidh réimse leathan fadhbanna.

CONS:

Stórálann KNN an chuid is mó de na sonraí nó iad go léir, rud a chiallaíonn go n-éilíonn an tsamhail go leor cuimhne agus go bhfuil sé costasach go ríomhaireachtúil. Is féidir le tacair shonraí móra a chur faoi deara go dtógfaidh tuartha go leor ama freisin.

Cruthaíonn KNN go bhfuil sé an-íogair do scála an tacair sonraí agus is furasta go leor gnéithe neamhábhartha a chaitheamh amach i gcomparáid le samhlacha eile.

Achoimre ar K-Na Comharsana is cóngaraí (KNN)

Tá K-Nearest Neighbours ar cheann de na halgartaim meaisínfhoghlama is simplí. In ainneoin chomh simplí agus atá KNN, ó thaobh coincheap de, is algartam cumhachtach é freisin a thugann cruinneas ard go leor ar fhormhór na bhfadhbanna. Nuair a úsáideann tú KNN, déan cinnte triail a bhaint as luachanna éagsúla K chun an uimhir is airde cruinneas a fháil.

Blogger agus ríomhchláraitheoir le speisialtachtaí i Foghlaim Meaisín agus Deep Learning topaicí. Tá súil ag Daniel cabhrú le daoine eile cumhacht AI a úsáid ar mhaithe le leas sóisialta.