stub Dè a th’ ann an KNN (K-Nàbaidhean as fhaisge)? — Unite.AI
Ceangal leinn
Clas Maighstir AI:

AI 101

Dè a th’ ann an KNN (K-Nàbaidhean as fhaisge)?

mm
Ùraichte on

Dè a th’ ann an K-Nàbaidhean as fhaisge (KNN)?

Tha K-Nearest Neighbours na dhòigh ionnsachaidh inneal agus algairim a tha faodar a chleachdadh an dà chuid airson gnìomhan ais-tharraing agus seòrsachadh. K- Na nàbaidhean as fhaisge sgrùdadh bileagan àireamh taghte de phuingean dàta timcheall air puing dàta targaid, gus ro-innse a dhèanamh mun chlas anns a bheil am puing dàta. Tha K-Nearest Neighbours (KNN) na algairim bun-bheachdail sìmplidh ach glè chumhachdach, agus airson na h-adhbharan sin, is e seo aon de na h-algorithms ionnsachaidh inneal as mòr-chòrdte. Bheir sinn dàibheadh ​​​​domhainn a-steach don algairim KNN agus faic mar a tha e ag obair. Le bhith a’ faighinn deagh thuigse air mar a tha KNN ag obair leigidh sin dhut luach a chuir air na cùisean cleachdaidh as fheàrr agus as miosa airson KNN.

Sealladh farsaing air K-Nàbaidhean as fhaisge (KNN)

Dealbh: Antti Ajanki AnAj tro Wikimedia Commons, CC BY SA 3.0 (https://commons.wikimedia.org/wiki/File:KnnClassification.svg)

Bheir sinn sealladh air stòr-dàta air itealan 2D. Dèan dealbh de ghrunn phuingean dàta air graf, sgapte air feadh a’ ghraf ann am buidhnean beaga. Bidh KNN a’ sgrùdadh cuairteachadh nam puingean dàta agus, a rèir nan argamaidean a chaidh a thoirt don mhodail, bidh e a’ sgaradh nam puingean dàta gu buidhnean. Thèid leubail a thoirt do na buidhnean sin an uairsin. Is e am prìomh bharail a tha modail KNN a’ dèanamh gu bheil puingean dàta/suidheachadh a tha faisg air a chèile glè choltach, agus ma tha puing dàta fada air falbh bho bhuidheann eile tha e eu-coltach ris na puingean dàta sin.

Bidh modail KNN a’ tomhas ionnanachd a’ cleachdadh an astair eadar dà phuing air graf. Mar as motha an astar eadar na puingean, is ann as lugha a tha iad. Tha iomadh dòigh ann air an astar eadar puingean obrachadh a-mach, ach ’s e an astar as cumanta a th’ ann ach astar Euclidean (an astar eadar dà phuing ann an loidhne dhìreach).

Is e algairim ionnsachaidh fo stiùir a th’ ann an KNN, a’ ciallachadh gum feum bileagan a bhith air an sònrachadh dha na h-eisimpleirean san t-seata-dàta/feumaidh fios a bhith aig na clasaichean aca. Tha dà rud cudromach eile ri fios mu KNN. An toiseach, tha KNN na algairim neo-parametric. Tha seo a’ ciallachadh nach tèid barailean sam bith a dhèanamh mun t-seata dàta nuair a thèid am modail a chleachdadh. An àite sin, tha am modail air a thogail gu tur bhon dàta a chaidh a thoirt seachad. San dàrna h-àite, chan eil an dàta air a roinn ann an seataichean trèanaidh is deuchainn nuair a bhios tu a’ cleachdadh KNN. Chan eil KNN a’ dèanamh coitcheannachadh eadar seata trèanaidh is deuchainn, agus mar sin thathas a’ cleachdadh an dàta trèanaidh gu lèir cuideachd nuair a thèid iarraidh air a’ mhodail ro-innse a dhèanamh.

Mar a tha Algorithm KNN ag obrachadh

Bidh algorithm KNN a’ dol tro thrì prìomh ìrean mar a thèid a choileanadh:

  1. A’ suidheachadh K ris an àireamh de nàbaidhean taghte.
  2. Ag obrachadh a-mach an astair eadar eisimpleir a chaidh a sholarachadh/deuchainn agus na h-eisimpleirean dàta.
  3. A’ rèiteach nan astaran àireamhaichte.
  4. A’ faighinn na leubail de na h-inntrigidhean as àirde K.
  5. A’ tilleadh ro-innse mun eisimpleir deuchainn.

Anns a 'chiad cheum, tha K air a thaghadh leis an neach-cleachdaidh agus tha e ag innse don algairim cia mheud nàbaidh (cia mheud puing dàta mun cuairt) a bu chòir beachdachadh nuair a thathar a' toirt seachad breithneachadh mun bhuidheann a bhuineas don eisimpleir targaid. Anns an dàrna ceum, thoir an aire gu bheil am modail a’ sgrùdadh an astair eadar an eisimpleir targaid agus a h-uile eisimpleir anns an t-seata dàta. An uairsin thèid na h-astaran a chur ri liosta agus an rèiteachadh. Às deidh sin, thèid an liosta eagraichte a sgrùdadh agus thèid na bileagan airson na h-eileamaidean K as àirde a thilleadh. Ann am faclan eile, ma tha K air a shuidheachadh gu 5, bidh am modail a’ sgrùdadh bileagan nan 5 prìomh phuingean dàta as fhaisge air a’ phuing dàta targaid. Nuair a thathar a’ toirt seachad ro-innse mun phuing dàta targaid, tha e cudromach an e an obair a ath-thionndadh or seòrsachadh tasg. Airson gnìomh ath-thòiseachaidh, thathas a’ cleachdadh meanbh-chuimsean nan leubail K as àirde, fhad ‘s a thathar a’ cleachdadh modh nan leubail K as àirde a thaobh seòrsachadh.

Bidh na dearbh ghnìomhachdan matamataigeach a thathas a’ cleachdadh airson KNN a dhèanamh eadar-dhealaichte a rèir an astar meatrach a chaidh a thaghadh. Ma tha thu airson barrachd ionnsachadh mu mar a tha na meatrach air an tomhas, faodaidh tu leughadh mu chuid de na slatan-tomhais astair as cumanta, leithid Euclidanaich, Manhattan, agus Minkowski.

Carson a tha luach K cudromach

Is e am prìomh chuingealachadh nuair a bhios tu a’ cleachdadh KNN gur dòcha ann an luach neo-iomchaidh K (an àireamh ceàrr de nàbaidhean air an tèid beachdachadh) a thaghadh. Ma thachras seo, faodaidh na fàisneachdan a thèid a thilleadh a bhith dheth gu mòr. Tha e glè chudromach, nuair a bhios tu a’ cleachdadh algairim KNN, gun tèid an luach ceart airson K a thaghadh. Tha thu airson luach a thaghadh airson K a mheudaicheas comas a’ mhodail ro-innse a dhèanamh air dàta nach fhacas roimhe agus aig an aon àm a’ lughdachadh na h-àireamh de mhearachdan a nì e.

Dealbh: Agor153 tro Wikimedia Commons, CC BY SA 3.0 (https://en.wikipedia.org/wiki/File:Map1NN.png)

Tha luachan nas ìsle de K a’ ciallachadh nach eil na ro-innsean a rinn an KNN cho seasmhach agus cho earbsach. Gus tuigse fhaighinn air carson a tha seo fìor, beachdaich air cùis far a bheil 7 nàbaidhean againn timcheall air puing dàta targaid. Gabhamaid ris gu bheil am modail KNN ag obair le luach K de 2 (tha sinn ag iarraidh air coimhead air an dà nàbaidh as fhaisge gus ro-innse a dhèanamh). Ma bhuineas a’ mhòr-chuid de na nàbaidhean (còig a-mach à seachd) don chlas Gorm, ach gur e Dearg an dà nàbaidh as fhaisge, bidh am modail a’ ro-innse gur e Dearg an eisimpleir ceiste. A dh 'aindeoin beachd a' mhodail, ann an suidheachadh mar sin bhiodh Blue na thomhas nas fheàrr.

Ma tha seo fìor, carson nach tagh thu dìreach an luach K as àirde as urrainn dhuinn? Tha seo air sgàth 's gu bheil innse don mhodail beachdachadh air cus nàbaidhean cuideachd a' lùghdachadh cruinneas. Mar a tha an radius a tha modail KNN a’ beachdachadh a’ dol am meud, tòisichidh e mu dheireadh a’ beachdachadh air puingean dàta a tha nas fhaisge air buidhnean eile na tha iad mar am puing dàta targaid agus tòisichidh mì-seòrsachadh a’ tachairt. Mar eisimpleir, eadhon ged a bha am puing a chaidh a thaghadh an toiseach ann an aon de na roinnean dearga gu h-àrd, nam biodh K air a shuidheachadh ro àrd, ruigeadh am modail a-steach do na roinnean eile gus beachdachadh air puingean. Nuair a bhios tu a’ cleachdadh modail KNN, thathas a’ feuchainn ri luachan eadar-dhealaichte de K fhaicinn dè an luach a bheir an coileanadh as fheàrr don mhodail.

Nithean matha is dona KNN

Bheir sinn sùil air cuid de na buannachdan agus na h-eas-bhuannachdan a tha aig modal KNN.

nithean matha:

Faodar KNN a chleachdadh airson gnìomhan ais-tharraing agus seòrsachadh, eu-coltach ri cuid de algoirmean ionnsachaidh fo stiùir.

Tha KNN gu math ceart agus furasta a chleachdadh. Tha e furasta a mhìneachadh, a thuigsinn agus a chur an gnìomh.

Chan eil KNN a’ toirt beachd sam bith air an dàta, a’ ciallachadh gum faodar a chleachdadh airson measgachadh farsaing de dhuilgheadasan.

dona:

Bidh KNN a’ stòradh a’ mhòr-chuid no an dàta gu lèir, a tha a’ ciallachadh gu bheil feum aig a’ mhodail air tòrr cuimhne agus gu bheil e daor a thaobh àireamhachd. Faodaidh dàta mòr cuideachd adhbhrachadh gun toir ro-innse ùine mhòr.

Tha KNN gu math mothachail air meud an t-seata dàta agus faodar a chuir dheth le feartan neo-iomchaidh gu math furasta an taca ri modalan eile.

Geàrr-chunntas air K-Nàbaidhean as fhaisge (KNN)

Is e K-Nearest Neighbours aon de na h-algorithms ionnsachaidh inneal as sìmplidh. A dh 'aindeoin cho sìmplidh' sa tha KNN, ann am bun-bheachd, tha e cuideachd na algairim cumhachdach a tha a 'toirt seachad cruinneas gu math àrd air a' mhòr-chuid de dhuilgheadasan. Nuair a chleachdas tu KNN, bi cinnteach gun feuch thu le diofar luachan de K gus an àireamh a lorg a bheir seachad an cruinneas as àirde.

Blogger agus prògramadair le speisealaichean ann an Machine Ionnsachadh agus Ionnsachadh domhainn cuspairean. Tha Daniel an dòchas daoine eile a chuideachadh gus cumhachd AI a chleachdadh airson math sòisealta.