AI 101
K-рдореАрдиреНрд╕ рдХреНрд▓рд╕реНрдЯрд░рд┐рдВрдЧ рдХреНрдпрд╛ рд╣реИ?

K-मीन्स क्लस्टरिंग एक अनुप्रविष्ट शिक्षा एल्गोरिदम है, और सभी अनुप्रविष्ट शिक्षा एल्गोरिदम में से, K-मीन्स क्लस्टरिंग शायद सबसे व्यापक रूप से उपयोग किया जाता है, इसकी शक्ति और सरलता के कारण। K-मीन्स क्लस्टरिंग वास्तव में कैसे काम करता है?
संक्षिप्त उत्तर यह है कि K-मीन्स क्लस्टरिंग एक वांछित संख्या में वर्गों के लिए एक संदर्भ बिंदु (एक केंद्र) बनाकर काम करता है, और फिर डेटा बिंदुओं को वर्ग क्लस्टर में सौंप दिया जाता है जो संदर्भ बिंदु के सबसे करीब है। जबकि यह K-मीन्स क्लस्टरिंग के लिए एक त्वरित परिभाषा है, आइए K-मीन्स क्लस्टरिंग में गहराई से जाने और इसके संचालन के लिए बेहतर अंतर्दृष्टि प्राप्त करने के लिए कुछ समय लें।
क्लस्टरिंग की परिभाषा
K-मीन्स क्लस्टरिंग के उपयोग किए जाने वाले सटीक एल्गोरिदम की जांच करने से पहले, आइए क्लस्टरिंग को सामान्य रूप से परिभाषित करें।
क्लस्टर केवल आइटमों के समूह हैं, और क्लस्टरिंग बस आइटमों को उन समूहों में रखना है। डेटा विज्ञान के अर्थ में, क्लस्टरिंग एल्गोरिदम दो चीजें करने का लक्ष्य रखते हैं:
- सुनिश्चित करें कि एक क्लस्टर में सभी डेटा बिंदु एक दूसरे के लिए यथासंभव समान हों।
- सुनिश्चित करें कि विभिन्न क्लस्टर में सभी डेटा बिंदु एक दूसरे के लिए यथासंभव असमान हों।
क्लस्टरिंग एल्गोरिदम कुछ समानता के मापदंड के आधार पर आइटमों को समूहों में विभाजित करते हैं। यह अक्सर विभिन्न समूहों में “केंद्र” को खोजकर किया जाता है, हालांकि विशेष रूप से नहीं। विभिन्न प्रकार के क्लस्टरिंग एल्गोरिदम हैं, लेकिन सभी क्लस्टरिंग एल्गोरिदम का लक्ष्य समान है, डेटासेट में अंतर्निहित समूहों का निर्धारण करना।
K-मीन्स क्लस्टरिंग
K-मीन्स क्लस्टरिंग क्लस्टरिंग एल्गोरिदम के सबसे पुराने और सबसे व्यापक रूप से उपयोग किए जाने वाले प्रकारों में से एक है, और यह वेक्टर क्वांटीकरण पर आधारित है। एक बिंदु को अंतरिक्ष में एक मूल के रूप में चुना जाता है, और फिर मूल से डेटासेट में सभी डेटा बिंदुओं तक वेक्टर खींचे जाते हैं।
सामान्य तौर पर, K-मीन्स क्लस्टरिंग को पांच अलग-अलग चरणों में तोड़ा जा सकता है:
- सभी उदाहरणों को उपसेट में रखें, जहां उपसेट की संख्या K के बराबर है।
- नव सृजित क्लस्टर भागों के माध्य बिंदु/केंद्र का पता लगाएं।
- इन केंद्रों के आधार पर, प्रत्येक बिंदु को एक विशिष्ट क्लस्टर में सौंपें।
- प्रत्येक बिंदु से केंद्रों की दूरी की गणना करें, और बिंदुओं को उन क्लस्टर में सौंपें जहां केंद्र से दूरी न्यूनतम है।
- बिंदुओं को क्लस्टर में सौंप दिए जाने के बाद, क्लस्टर के नए केंद्र का पता लगाएं।
उपरोक्त चरण प्रशिक्षण प्रक्रिया समाप्त होने तक दोहराए जाते हैं।

प्रारंभिक चरण में, केंद्र डेटा बिंदुओं के बीच कहीं रखे जाते हैं।
फोटो: वेस्टन.पेस विकिमीडिया कॉमन्स, जीएनयू फ्री डॉक्यूमेंटेशन लाइसेंस (https://commons.wikimedia.org/wiki/File:K_Means_Example_Step_1.svg)












