stub Waa maxay K-Means Kutlada? - Midow.AI
Connect nala
AI Masterclass:

AI 101

Waa maxay K-Means Kutlada?

mm
Updated on

K-macneheedu waa ururintu waa a waxbarashada aan la ilaalin Algorithm, iyo dhammaan algorithms-yada waxbarasho ee aan la ilaalin, K-macnaheedu waa isku-ururinta ayaa laga yaabaa inay noqoto tan ugu ballaaran ee la isticmaalo, iyadoo ay ugu wacan tahay awooddeeda iyo fududaanteeda. Sidee buu K-macnaheedu yahay kooxuhu u shaqeeyaan si sax ah?

Jawaabta oo gaaban waa in K-macnaheedu yahay ururintu ay shaqeyso abuurista barta tixraaca (centroid) tirada fasallada la rabo, ka dibna u qoondaynta dhibcaha xogta kooxaha fasalka iyadoo lagu salaynayo barta tixraaca ee ugu dhow. In kasta oo taasi tahay qeexitaan degdeg ah oo loogu talagalay K-macnaheedu waa isku-ururinta, aan qaadanno wakhti aan si qoto dheer ugu dhex galno K-macnaha ururinta oo aan helno dareen wanaagsan oo ku saabsan sida ay u shaqeyso.

Qeexida Kutlada

Ka hor inta aynaan baarin algorithms-yada saxda ah ee loo isticmaalo fulinta isku-ururinta K-macnaha, aan qaadano wakhti yar si aan u qeexno kooxaynta guud ahaan.

Kooxuhu waa uun kooxo shay, iyo ururintu waa uun gelinta walxaha kooxahaas. Macnaha cilmiga xogta, ururinta algorithms ujeedo in aad samayso laba shay:

  • Hubi in dhammaan xogta ku jirta kooxdu ay isku mid yihiin intii suurtogal ah.
  • Hubi in dhammaan dhibcooyinka xogta ee kooxaha kala duwani ay u kala duwan yihiin midba midka kale intii suurtogal ah.

Ururinta algorithms-yada walxaha si wada jir ah iyadoo lagu salaynayo qiyaas isku mid ah. Tan waxaa badanaa lagu sameeyaa iyadoo la helayo "centroid" ee kooxaha suurtagalka ah ee kala duwan ee xogta, inkastoo aan si gaar ah loo helin. Waxa jira algorithms ururin kala duwan oo kala duwan, laakiin hadafka dhammaan algorithms-ka ururinta waa isku mid, si loo go'aamiyo kooxaha ku dhex jira xog-ururinta.

K-Waxaa loola jeedaa Kutlada

K-Means Clustering waa mid ka mid ah noocyada ugu da'da weyn uguna badan ee la isticmaalo ee algorithms ururinta, waxayna ku shaqeysaa iyadoo lagu saleynayo tirinta vector. Waxaa jira meel bannaan oo loo soo xushay asal ahaan, ka dibna vectors ayaa laga soo qaaday asalka ilaa dhammaan dhibcaha xogta ee xogta.

Guud ahaan, kooxda K-macneheedu waxa loo qaybin karaa shan tilaabo oo kala duwan:

  • Ku rid dhammaan tusaalooyinka qayb-hoosaadyo, halkaasoo tirada qayb-hoosaadyadu ay le'eg tahay K.
  • Soo hel barta dhexe/centroid ee qaybaha cusub ee la abuuray.
  • Iyada oo ku saleysan centroids, u qoondee dhibic kasta koox gaar ah.
  • Xisaabi masaafada u jirta bar kasta ilaa centroids, oo u qoondee dhibcaha kooxaha halka fogaanta u jirta centroid ay ugu yar tahay.
  • Ka dib marka dhibcaha loo qoondeeyo kooxaha, hel xarunta cusub ee kooxaha.

Tallaabooyinka kor ku xusan waa lagu celceliyaa ilaa habka tababarka la dhammeeyo.

Marxaladda hore, centroids ayaa la dhigayaa meel ka mid ah dhibcaha xogta.
Sawirka: Weston.pace iyada oo loo sii marayo wikimedia Commons, GNU Shatiga Dukumentiga ee Bilaashka ah (https://commons.wikimedia.org/wiki/File:K_Means_Example_Step_1.svg)

Taas beddelkeeda, ka dib marka centroids la dhigo, waxaan ka fikiri karnaa K-macnaha isku-duubnida sida isdhaafsiga gadaal iyo hor inta u dhaxaysa laba weji oo kala duwan: calaamadaynta dhibcaha xogta iyo cusboonaysiinta centroids.

Talaabada labaad, mitirka fogaanta sida masaafada Euclidean ayaa loo isticmaalaa in lagu xisaabiyo senterka barta la bixiyay ee ugu dhow, ka dibna dhibcaha waxaa loo qoondeeyay fasalka centroid. Sawirka: Weston.pace iyada oo loo sii marayo Wikimedia Commons, GNU Ruqsadda Doc Free (https://commons.wikimedia.org/wiki/File:K_Means_Example_Step_2.svg)

Marxaladda calaamadaynta xogta, dhibic kasta oo xog ah ayaa loo qoondeeyay calaamad dhigaya kooxda ay iska leedahay centroid-ka ugu dhow. Centroid-ka ugu dhow waxaa sida caadiga ah lagu go'aamiyaa iyadoo la isticmaalayo masaafo labajibaaran Euclidean, in kasta oo cabbirada masaafada kale sida fogaanta Manhattan, Cosine, iyo fogaanta Jaccard la isticmaali karo iyadoo ku xiran nooca xogta lagu quudiyo algorithm ururinta.

Tallaabada saddexaad, centroid waxaa loo raray celceliska dhammaan dhibcaha xogta. Fasallada ayaa markaa dib loo meeleeyaa. Sawirka: Weston.pace iyada oo loo sii marayo Wikiemedia Commons, CC SA 3.0 (https://commons.wikimedia.org/wiki/File:K_Means_Example_Step_3.svg)

Tallaabada cusboonaysiinta centroid-ka, centroid-ka waxaa lagu xisaabiyaa iyadoo la helayo celceliska masaafada u dhaxaysa dhammaan dhibcaha xogta hadda ku jira kutlada dhexdeeda.

Sida loo doorto qiimaha saxda ah ee "K"

Iyadoo la tixgalinayo in K-macnaheedu ay tahay isku-uruurintu ay tahay algorithm aan la ilaalin oo tirada fasallada aan horay loo sii ogeyn, sidee ayaad u go'aaminaysaa tirada ku habboon ee fasallada/qiimaha saxda ah ee K?

Mid ka mid ah farsamada xulashada saxda ah ee K-qiimaha ayaa loo yaqaan "farsamada xusulka”. Farsamada xusullada waxay ka kooban tahay socodsiinta a-K-macneheedu waa isku-ururinta algorithm ee kala duwan ee K-qiyamyada kala duwan iyo iyadoo la adeegsanayo cabbir sax ah, sida caadiga ah Isugeynta Khaladka labajibaaran, si loo go'aamiyo qiyamka K ee bixiya natiijooyinka ugu fiican. Wadarta Khaladka labajibbaaran waxaa lagu go'aamiyaa iyadoo la xisaabinayo celceliska masaafada u dhaxaysa xarunta dhexe ee kooxdu iyo dhibcaha xogta ee kutladaas.

Ereyga "farsamada xusulka" waxay ka timaaddaa xaqiiqda ah in marka aad sawirto SSE ee ku saabsan qiyamka kala duwan ee K, xariiqda xariiqda ka soo baxda waxay inta badan yeelan doontaa qaab "xuxul", halkaasoo SSE ay si degdeg ah hoos ugu dhacdo qiyamka ugu horreeya ee K. laakiin markaas heerarku way dhimman yihiin. Xaaladahan oo kale, qiimaha K ee ku yaal suxulka ayaa ah qiimaha ugu fiican ee K, maadaama ay jiraan soo-celin degdeg ah oo hoos u dhacaysa ka dib qiimahan.

Dufcaddii-yar ee K-Waxay ula jeedaa Koox-kooxeed

Marka xog-ururinta ay koraan, wakhtiga xisaabinta sidoo kale wuu koraa. K-macnaha aasaasiga ah ururinta waxay qaadan kartaa wakhti dheer in la dhamaystiro marka lagu shaqeeyo xog-ururineed oo baaxad leh, natiijaduna waxay tahay, waxka bedelka K-macnaha ururinta ayaa la sameeyay si ay awood u siiso in la dhimo algoorithmamka meesheeda iyo kharashaadka ku meel gaarka ah.

Mini-Batch K-macnaheedu waa ururin waa kala duwanaansho ku saabsan K-macnaha ururinta halkaas oo cabbirka xogta la tixgalinayo lagu koobay. K-kutlada caadiga ah waxay ku shaqaysaa dhammaan xogta kaydinta/dufcada hal mar, halka Dufcaddii-yar ee K-macnaheedu yahay ururin wuxuu u kala jebiyaa kaydka xogta oo u kala qaybiya qaybo-hoosaadyo. Dufcooyin yar-yar ayaa si aan kala sooc lahayn looga soo qaadaa xogta xogta oo dhan oo soo noqnoqon kasta oo cusub waxaa la doortaa muunad random cusub oo loo isticmaalo in lagu cusboonaysiiyo booska centroids.

Kutlada Mini-Batch K-Means, kooxuhu waa la cusboonaysiiyay iyadoo la isku daray qiimaha dufcada-yar iyo heerka waxbarashada. Heerka waxbarashadu wuu yaraadaa marka loo eego ku celcelinta, waana ka soo horjeeda tirada dhibcaha xogta ee lagu meeleeyay koox gaar ah. Saamaynta hoos u dhigista heerka waxbarashadu waa in saamaynta xogta cusub ay yaraato oo isku-xidhnaanta la gaadho marka, dhawr jeer oo la soo celceliyay ka dib, aanay wax isbedel ahi ku iman kooxuhu.

Natiijooyinka daraasadaha ku saabsan wax ku oolnimada Dufcaddii-yar ee K-macnaha ururinta waxay soo jeedinayaan inay si guul leh u dhimi karto wakhtiga xisaabinta iyadoo wax yar laga beddelayo tayada kooxda.

Codsiyada K-Means Kutlada

K-macneheedu waa ururinta si badbaado leh ayaa loo isticmaali karaa xaalad kasta oo dhibcaha xogta loo qaybin karo kooxo/fasalo kala duwan. Waa kuwan tusaalooyin qaar oo ah kiisaska la isticmaalo ee caadiga ah ee K-macnaha ururinta.

K-macneheedu waa kooxaynta waxaa lagu dabaqi karaa kala soocida dukumeentiyada, kooxaynta dukumentiyada ku salaysan sifooyinka sida mawduucyada, tags, isticmaalka erayada, xogta badan iyo sifooyinka kale ee dukumentiga. Waxa kale oo loo isticmaali karaa in lagu kala saaro isticmaalayaasha sida bots ama aan ahayn bots iyadoo lagu salaynayo qaababka waxqabadka sida qoraalada iyo faallooyinka. Kutlada K-macneheedu waxa kale oo loo isticmaali karaa in dadka la geliyo kooxo iyadoo lagu salaynayo heerarka walaaca marka la kormeerayo caafimaadkooda, iyadoo lagu salaynayo astaamaha sida cudurada faafa, da'da, taariikhda bukaanka, iwm.

K-macneheedu waa ururinta sidoo kale waxaa loo isticmaali karaa hawlo badan oo furan sida abuurista hababka talada. Isticmaalayaasha nidaamka sida Netflix waa la isku dari karaa iyadoo lagu salaynayo qaababka daawashada iyo waxa lagu taliyay waxyaabaha la midka ah. K-macneheedu waa ururinta waxaa loo isticmaali karaa hawlaha ogaanshaha cilladaysan, muujinta dhacdooyinka suurtagalka ah ee khiyaanada ama walxaha cilladaysan.