stub KNN (K-Cîranên herî nêzîk) çi ye? - Yekbûn.AI
Girêdana bi me

AI 101

KNN (K-Cîranên herî nêzîk) çi ye?

mm
Demê on

K-Nêziktirîn Cîran (KNN) çi ye?

K-Nearest Neighbors teknîk û algorîtmaya fêrbûna makîneyê ye ku dikare hem ji bo karên regresyonê û hem jî ji bo karên dabeşkirinê were bikar anîn. K-Nêziktirîn Cîran muayene bike etîketên hejmareke bijartî ya xalên daneyê li dora nuqteyek daneya armancê, ji bo ku pêşbîniyek li ser çîna ku xala daneyê tê de bikeve. K-Nêzîktirîn Neighbors (KNN) algorîtmayek têgihîştî hêsan e lê pir bi hêz e, û ji ber wan sedeman, ew yek ji wan algorîtmayên fêrbûna makîneyê ya herî populer e. Ka em li algorîtmaya KNN-ê kûr bigerin û bi rastî bibînin ka ew çawa dixebite. Fêmek baş a ka KNN çawa dixebite dê bihêle ku hûn rewşên karanîna çêtirîn û herî xirab ji bo KNN-ê binirxînin.

Nêrînên K-Nêziktirîn Cîran (KNN)

Wêne: Antti Ajanki AnAj bi rêya Wikimedia Commons, CC BY SA 3.0 (https://commons.wikimedia.org/wiki/File:KnnClassification.svg)

Werin em danegehek li ser balafirek 2D xuyang bikin. Komek xalên daneyê li ser grafiyekê wêne bikin, li ser grafîkê di komên piçûk de belav bibin. KNN belavkirina nuqteyên daneyê dikole û, li gorî argumanên ku ji modelê re hatine dayîn, xalên daneyê di koman de vediqetîne. Dûv re etîketek ji van koman re tê destnîşankirin. Texmîna bingehîn a ku modelek KNN dike ev e ku nuqteyên daneyan/nimûneyên ku li nêzê hevûdu hene pir dişibin hev, dema ku ger nuqteyek daneyî ji komek din dûr be ew ji wan xalên daneyê cudatir e.

Modelek KNN wekheviyê bi karanîna dûrahiya di navbera du xalên li ser grafikekê de hesab dike. Dûrahiya di navbera xalan de çiqas mezin be, ew qas kêm dişibin hev. Gelek awayên hesabkirina dûrahiya di navbera xalan de hene, lê metrika dûrbûna herî gelemperî tenê dûrahiya Euclidean e (dûrahiya di navbera du xalên di xetek rast de).

KNN algorîtmayek fêrbûnê ya çavdêrîkirî ye, tê vê wateyê ku nimûneyên di databasê de divê xwedî etîketên ku ji wan re hatine veqetandin/dersên wan bêne zanîn. Du tiştên din ên girîng hene ku di derbarê KNN de zanibin. Ya yekem, KNN algorîtmayek ne-parametrîk e. Ev tê wê wateyê ku dema ku model tê bikar anîn, di derheqê databasê de texmînek nayê çêkirin. Di şûna wê de, model bi tevahî ji daneyên peydakirî têne çêkirin. Ya duyemîn, dema ku KNN bikar tînin dabeşkirina databasê li komên perwerdehî û ceribandinê tune. KNN di navbera komek perwerdehî û ceribandinê de gelemperîkirinê nake, ji ber vê yekê hemî daneyên perwerdehiyê jî dema ku ji modelê tê xwestin ku pêşbîniyan bike tê bikar anîn.

Algorîtmayek KNN çawa dixebite

Algorîtmayek KNN dema ku tê meşandin di sê qonaxên sereke re derbas dibe:

  1. Sazkirina K ji bo hejmara cîranên bijartî.
  2. Hesabkirina dûrahiya di navbera mînakek pêşkêşkirî/test û nimûneyên databasê de.
  3. Rêzkirina dûrahiyên hesabkirî.
  4. Girtina etîketên navnîşên K-ya jorîn.
  5. Vegerandina pêşbîniyek di derbarê nimûneya testê de.

Di gava yekem de, K ji hêla bikarhêner ve tê hilbijartin û ew ji algorîtmayê re vedibêje ka çend cîran (çend nuqteyên daneya derdorê) divê were hesibandin dema ku li ser koma ku mînaka armanc tê de ye dadbar were kirin. Di gava duyemîn de, bala xwe bidin ku model dûrahiya di navbera mînaka armanc û her mînakek di daneyê de kontrol dike. Dûr dûr di navnîşek de têne zêdekirin û rêz kirin. Dûv re, navnîşa rêzkirî tê kontrol kirin û etîketên ji bo hêmanên K-ya jorîn têne vegerandin. Bi gotinek din, heke K li ser 5-ê were danîn, model etîketên 5 xalên daneya herî nêzîk ji xala daneya armancê re kontrol dike. Dema ku di derheqê xala daneya armancê de pêşbîniyek pêşkêş dikin, girîng e ku peywir a zordariyê or bisinifkirinî karî. Ji bo peywirek paşvekêşanê, navgîniya etîketên K-ya jorîn tê bikar anîn, dema ku moda tîpên K-ya jorîn di rewşa dabeşkirinê de tê bikar anîn.

Operasyonên matematîkî yên rastîn ên ku ji bo pêkanîna KNN-ê têne bikar anîn li gorî metrika dûrbûna bijartî cûda dibin. Heke hûn dixwazin bêtir fêr bibin ka pîvan çawa têne hesibandin, hûn dikarin li ser hin metrîkên dûrbûna herî gelemperî bixwînin, wek mînak Euclidean, Manhattan, û Minkowski.

Çima Nirxa K Girîng e

Sînordariya sereke dema ku KNN bikar tîne ev e ku di nirxek nerast a K de (hejmarek xelet a cîranên ku bêne hesibandin) were hilbijartin. Ger ev yek çêbibe, pêşbîniyên ku têne vegerandin dikarin bi giranî nebin. Pir girîng e ku, dema ku algorîtmayek KNN bikar bînin, nirxa rast ji bo K were hilbijartin. Hûn dixwazin ji bo K-ya nirxek hilbijêrin ku şiyana modelê ya ku pêşbîniyên li ser daneyên nedîtî çêdike zêde dike û di heman demê de hejmara xeletiyên ku dike kêm dike.

Wêne: Agor153 bi rêya Wikimedia Commons, CC BY SA 3.0 (https://en.wikipedia.org/wiki/File:Map1NN.png)

Nirxên jêrîn ên K tê vê wateyê ku pêşbîniyên ku ji hêla KNN ve têne pêşkêş kirin kêmtir aram û pêbawer in. Ji bo ku hûn têgihîştinek bikin ka çima wusa ye, rewşek ku me 7 cîranên li dora xalek daneya armancê hene binihêrin. Ka em bihesibînin ku modela KNN bi nirxek K-ya 2-yê re dixebite (em jê dipirsin ku li du cîranên herî nêzîk binêre da ku pêşbîniyekê bike). Ger piraniya cîranan (pênc ji heftan) ji çîna Şîn in, lê du cîranên herî nêzîk tenê Sor in, model dê pêşbînî bike ku mînaka pirsê Sor e. Tevî texmîna modelê, di senaryoyek wusa de Blue dê texmînek çêtir be.

Ger wusa be, çima ne tenê nirxa K-ya herî bilind a ku em dikarin hilbijêrin? Ev ji ber ku ji modelê re bêje ku pir cîranan bihesibîne dê di heman demê de rastbûnê kêm bike. Her ku tîrêjê ku modela KNN-ê dihesibîne zêde dibe, ew ê di dawiyê de dest bi nirxandina nuqteyên daneyê yên ku ji wan xala daneya armancê nêzikî komên din in bike û dabeşkirina xelet dê dest pê bike. Mînakî, heke xala ku di destpêkê de hatî hilbijartin jî li yek ji herêmên sor ên li jor be jî, heke K pir bilind were danîn, dê model bigihîje herêmên din da ku xalan binirxîne. Dema ku modelek KNN bikar bînin, nirxên cûda yên K têne ceribandin ku bibînin ka kîjan nirx performansa çêtirîn dide modelê.

KNN Pros Û Neyînî

Werin em hin erênî û neyînîyên modela KNN bikolin.

Pros:

KNN dikare hem ji bo peywirên paşveçûn û hem jî ji bo dabeşkirinê were bikar anîn, berevajî hin algorîtmayên fêrbûna çavdêriya din.

KNN pir rast û karanîna hêsan e. Şirovekirin, fêmkirin û bicihanîn hêsan e.

KNN di derbarê daneyan de ti texmînan nake, yanî ew dikare ji bo cûrbecûr pirsgirêkan were bikar anîn.

Neyînî:

KNN piraniya an hemî daneyan hilîne, ku tê vê wateyê ku modela pir bîranîn û bihabûna wê ya hesabkirinê hewce dike. Daneyên mezin jî dikarin bibin sedem ku pêşbîniyan demek dirêj dirêj bikin.

KNN îsbat dike ku ji pîvana databasê re pir hesas e û ew dikare ji hêla taybetmendiyên negirêdayî ve li gorî modelên din bi hêsanî were avêtin.

Kurteya K-Nêziktirîn Cîran (KNN)

K-Nearest Neighbors yek ji hêsantirîn algorîtmayên fêrbûna makîneyê ye. Tevî ku KNN çiqas hêsan e, di konseptê de, ew di heman demê de algorîtmayek hêzdar e ku di pir pirsgirêkan de rastbûna pir zêde dide. Dema ku hûn KNN-ê bikar tînin, pê ewle bin ku hûn bi nirxên cûda yên K-yê biceribînin da ku hûn hejmara ku rastbûna herî zêde peyda dike bibînin.

Blogger û bernameçêkerê ku di nav de pispor e Fêrbûna Machine û Fêrbûna Kûr mijarên. Daniel hêvî dike ku alîkariya kesên din bike ku hêza AI-ê ji bo başiya civakî bikar bînin.