Connect with us

K-рдореАрдиреНрд╕ рдХреНрд▓рд╕реНрдЯрд░рд┐рдВрдЧ рдХреНрдпрд╛ рд╣реИ?

AI 101

K-рдореАрдиреНрд╕ рдХреНрд▓рд╕реНрдЯрд░рд┐рдВрдЧ рдХреНрдпрд╛ рд╣реИ?

mm

K-मीन्स क्लस्टरिंग एक अनुप्रविष्ट शिक्षा एल्गोरिदम है, और सभी अनुप्रविष्ट शिक्षा एल्गोरिदम में से, K-मीन्स क्लस्टरिंग शायद सबसे व्यापक रूप से उपयोग किया जाता है, इसकी शक्ति और सरलता के कारण। K-मीन्स क्लस्टरिंग वास्तव में कैसे काम करता है?

संक्षिप्त उत्तर यह है कि K-मीन्स क्लस्टरिंग एक वांछित संख्या में वर्गों के लिए एक संदर्भ बिंदु (एक केंद्र) बनाकर काम करता है, और फिर डेटा बिंदुओं को वर्ग क्लस्टर में सौंप दिया जाता है जो संदर्भ बिंदु के सबसे करीब है। जबकि यह K-मीन्स क्लस्टरिंग के लिए एक त्वरित परिभाषा है, आइए K-मीन्स क्लस्टरिंग में गहराई से जाने और इसके संचालन के लिए बेहतर अंतर्दृष्टि प्राप्त करने के लिए कुछ समय लें।

क्लस्टरिंग की परिभाषा

K-मीन्स क्लस्टरिंग के उपयोग किए जाने वाले सटीक एल्गोरिदम की जांच करने से पहले, आइए क्लस्टरिंग को सामान्य रूप से परिभाषित करें।
क्लस्टर केवल आइटमों के समूह हैं, और क्लस्टरिंग बस आइटमों को उन समूहों में रखना है। डेटा विज्ञान के अर्थ में, क्लस्टरिंग एल्गोरिदम दो चीजें करने का लक्ष्य रखते हैं:

  • सुनिश्चित करें कि एक क्लस्टर में सभी डेटा बिंदु एक दूसरे के लिए यथासंभव समान हों।
  • सुनिश्चित करें कि विभिन्न क्लस्टर में सभी डेटा बिंदु एक दूसरे के लिए यथासंभव असमान हों।

क्लस्टरिंग एल्गोरिदम कुछ समानता के मापदंड के आधार पर आइटमों को समूहों में विभाजित करते हैं। यह अक्सर विभिन्न समूहों में “केंद्र” को खोजकर किया जाता है, हालांकि विशेष रूप से नहीं। विभिन्न प्रकार के क्लस्टरिंग एल्गोरिदम हैं, लेकिन सभी क्लस्टरिंग एल्गोरिदम का लक्ष्य समान है, डेटासेट में अंतर्निहित समूहों का निर्धारण करना।

K-मीन्स क्लस्टरिंग

K-मीन्स क्लस्टरिंग क्लस्टरिंग एल्गोरिदम के सबसे पुराने और सबसे व्यापक रूप से उपयोग किए जाने वाले प्रकारों में से एक है, और यह वेक्टर क्वांटीकरण पर आधारित है। एक बिंदु को अंतरिक्ष में एक मूल के रूप में चुना जाता है, और फिर मूल से डेटासेट में सभी डेटा बिंदुओं तक वेक्टर खींचे जाते हैं।
सामान्य तौर पर, K-मीन्स क्लस्टरिंग को पांच अलग-अलग चरणों में तोड़ा जा सकता है:

  • सभी उदाहरणों को उपसेट में रखें, जहां उपसेट की संख्या K के बराबर है।
  • नव सृजित क्लस्टर भागों के माध्य बिंदु/केंद्र का पता लगाएं।
  • इन केंद्रों के आधार पर, प्रत्येक बिंदु को एक विशिष्ट क्लस्टर में सौंपें।
  • प्रत्येक बिंदु से केंद्रों की दूरी की गणना करें, और बिंदुओं को उन क्लस्टर में सौंपें जहां केंद्र से दूरी न्यूनतम है।
  • बिंदुओं को क्लस्टर में सौंप दिए जाने के बाद, क्लस्टर के नए केंद्र का पता लगाएं।

उपरोक्त चरण प्रशिक्षण प्रक्रिया समाप्त होने तक दोहराए जाते हैं।

प्रारंभिक चरण में, केंद्र डेटा बिंदुओं के बीच कहीं रखे जाते हैं।
फोटो: वेस्टन.पेस विकिमीडिया कॉमन्स, जीएनयू फ्री डॉक्यूमेंटेशन लाइसेंस (https://commons.wikimedia.org/wiki/File:K_Means_Example_Step_1.svg)


рдмреНрд▓реЙрдЧрд░ рдФрд░ рдкреНрд░реЛрдЧреНрд░рд╛рдорд░ рдЬрд┐рдирдХреА рд╡рд┐рд╢реЗрд╖рдЬреНрдЮрддрд╛ рдореИрд╢реАрди рд▓рд░реНрдирд┐рдВрдЧ рдФрд░ рдбреАрдк рд▓рд░реНрдирд┐рдВрдЧ рд╡рд┐рд╖рдпреЛрдВ рдореЗрдВ рд╣реИред рдбреИрдирд┐рдпрд▓ рджреВрд╕рд░реЛрдВ рдХреЛ рд╕рд╛рдорд╛рдЬрд┐рдХ рдХрд▓реНрдпрд╛рдг рдХреЗ рд▓рд┐рдП рдПрдЖрдИ рдХреА рд╢рдХреНрддрд┐ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдореЗрдВ рдорджрдж рдХрд░рдирд╛ рдЪрд╛рд╣рддрд╛ рд╣реИред