ठूंठ पर्यवेक्षित बनाम अनपर्यवेक्षित शिक्षण - Unite.AI
हमसे जुडे
एआई मास्टरक्लास:

एआई 101

पर्यवेक्षित बनाम अनुपयोगी शिक्षण

mm
Updated on

मशीन लर्निंग में, अधिकांश कार्यों को आसानी से दो अलग-अलग वर्गों में वर्गीकृत किया जा सकता है: पर्यवेक्षित सीखने की समस्याएँ या बिना पर्यवेक्षित सीखने की समस्याएँ। पर्यवेक्षित शिक्षण में, डेटा में लेबल या कक्षाएं जुड़ी होती हैं, जबकि बिना पर्यवेक्षित शिक्षण के मामले में डेटा लेबल रहित होता है। आइए इस पर करीब से नज़र डालें कि यह अंतर क्यों महत्वपूर्ण है और प्रत्येक प्रकार की शिक्षा से जुड़े कुछ एल्गोरिदम पर नज़र डालें।

पर्यवेक्षित बनाम अनुपयोगी शिक्षण

अधिकांश मशीन लर्निंग कार्य किसके क्षेत्र में हैं? पर्यवेक्षित अध्ययन। पर्यवेक्षित शिक्षण एल्गोरिदम में, डेटासेट में व्यक्तिगत उदाहरणों/डेटा बिंदुओं को एक वर्ग या लेबल सौंपा गया है। इसका मतलब यह है कि मशीन लर्निंग मॉडल यह अंतर करना सीख सकता है कि कौन सी विशेषताएं किसी दिए गए वर्ग से संबंधित हैं और मशीन लर्निंग इंजीनियर यह देखकर मॉडल के प्रदर्शन की जांच कर सकता है कि कितने उदाहरणों को ठीक से वर्गीकृत किया गया था। वर्गीकरण एल्गोरिदम का उपयोग कई जटिल पैटर्न को समझने के लिए किया जा सकता है, जब तक कि डेटा को उचित वर्गों के साथ लेबल किया गया हो। उदाहरण के लिए, एक मशीन-लर्निंग एल्गोरिदम "मूंछ", "पूंछ", "पंजे" आदि जैसी विशेषताओं के आधार पर विभिन्न जानवरों को एक-दूसरे से अलग करना सीख सकता है।

पर्यवेक्षित शिक्षण के विपरीत, बिना पर्यवेक्षित शिक्षण में एक ऐसा मॉडल बनाना शामिल है जो बिना लेबल वाले डेटा से पैटर्न निकालने में सक्षम है। दूसरे शब्दों में, कंप्यूटर इनपुट सुविधाओं का विश्लेषण करता है और स्वयं निर्धारित करता है कि सबसे महत्वपूर्ण विशेषताएं और पैटर्न क्या हैं। बिना पर्यवेक्षित शिक्षण विभिन्न उदाहरणों के बीच अंतर्निहित समानताएँ खोजने का प्रयास करता है। यदि एक पर्यवेक्षित शिक्षण एल्गोरिदम का लक्ष्य डेटा बिंदुओं को ज्ञात कक्षाओं में रखना है, तो अप्रशिक्षित शिक्षण एल्गोरिदम ऑब्जेक्ट इंस्टेंसेस के लिए सामान्य सुविधाओं की जांच करेगा और उन्हें इन सुविधाओं के आधार पर समूहों में रखेगा, अनिवार्य रूप से अपनी कक्षाएं बनाएगा।

पर्यवेक्षित शिक्षण एल्गोरिदम के उदाहरण हैं लीनियर रिग्रेशन, लॉजिस्टिक रिग्रेशन, के-निकटतम पड़ोसी, निर्णय वृक्ष और सपोर्ट वेक्टर मशीनें।

इस बीच, अप्रशिक्षित शिक्षण एल्गोरिदम के कुछ उदाहरण प्रिंसिपल कंपोनेंट एनालिसिस और के-मीन्स क्लस्टरिंग हैं।

पर्यवेक्षित शिक्षण एल्गोरिदम

Linear Regression Slope एक एल्गोरिदम है जो दो विशेषताओं को लेता है और उनके बीच के संबंध को रेखांकित करता है। रैखिक प्रतिगमन का उपयोग अन्य संख्यात्मक चर के संबंध में संख्यात्मक मानों की भविष्यवाणी करने के लिए किया जाता है। रैखिक प्रतिगमन में Y = a +bX का समीकरण है, जहां b रेखा का ढलान है और a वह है जहां y X-अक्ष को पार करता है।

रसद प्रतिगमन एक द्विआधारी वर्गीकरण एल्गोरिथ्म है। एल्गोरिदम संख्यात्मक विशेषताओं के बीच संबंध की जांच करता है और संभावना ढूंढता है कि उदाहरण को दो अलग-अलग वर्गों में से एक में वर्गीकृत किया जा सकता है। संभाव्यता मान 0 या 1 की ओर "निचोड़" दिए जाते हैं। दूसरे शब्दों में, मजबूत संभावनाएं 0.99 तक पहुंच जाएंगी जबकि कमजोर संभावनाएं 0 तक पहुंच जाएंगी।

K-निकटतम पड़ोसी प्रशिक्षण सेट में पड़ोसियों की कुछ चुनी हुई संख्या के निर्दिष्ट वर्गों के आधार पर नए डेटा बिंदुओं को एक वर्ग निर्दिष्ट करता है। एल्गोरिथम द्वारा विचार किए गए पड़ोसियों की संख्या महत्वपूर्ण है, और बहुत कम या बहुत अधिक पड़ोसी अंकों को गलत वर्गीकृत कर सकते हैं।

निर्णय के पेड़ एक प्रकार का वर्गीकरण और प्रतिगमन एल्गोरिदम हैं। एक निर्णय वृक्ष डेटासेट को छोटे और छोटे भागों में विभाजित करके संचालित होता है जब तक कि उपसमुच्चय को और अधिक विभाजित नहीं किया जा सके और परिणामस्वरुप नोड्स और पत्तियों वाला एक वृक्ष बनता है। नोड्स वे हैं जहां डेटा बिंदुओं के बारे में निर्णय विभिन्न फ़िल्टरिंग मानदंडों का उपयोग करके किए जाते हैं, जबकि पत्तियां ऐसे उदाहरण हैं जिन्हें कुछ लेबल (एक डेटा बिंदु जिसे वर्गीकृत किया गया है) सौंपा गया है। निर्णय वृक्ष एल्गोरिदम संख्यात्मक और श्रेणीबद्ध डेटा दोनों को संभालने में सक्षम हैं। पेड़ में विशिष्ट चर/विशेषताओं के आधार पर विभाजन किये जाते हैं।

समर्थन वेक्टर मशीन एक वर्गीकरण एल्गोरिदम है जो डेटा बिंदुओं के बीच हाइपरप्लेन, या अलगाव की रेखाएं खींचकर संचालित होता है। डेटा बिंदुओं को इस आधार पर वर्गों में विभाजित किया जाता है कि वे हाइपरप्लेन के किस तरफ हैं। एक डेटासेट को कई वर्गों में विभाजित करते हुए, एक विमान में कई हाइपरप्लेन खींचे जा सकते हैं। क्लासिफायर डाइविंग हाइपरप्लेन और प्लेन के दोनों ओर के बिंदुओं के बीच की दूरी को अधिकतम करने का प्रयास करेगा, और लाइन और बिंदुओं के बीच की दूरी जितनी अधिक होगी, क्लासिफायर उतना ही अधिक आश्वस्त होगा।

अनसुपरवाइज्ड लर्निंग एल्गोरिथम

प्रमुख कंपोनेंट विश्लेषण आयामीता में कमी के लिए उपयोग की जाने वाली एक तकनीक है, जिसका अर्थ है कि डेटा की आयामीता या जटिलता को सरल तरीके से दर्शाया जाता है। प्रिंसिपल कंपोनेंट एनालिसिस एल्गोरिदम डेटा के लिए नए आयाम ढूंढता है जो ऑर्थोगोनल हैं। जबकि डेटा की आयामीता कम हो गई है, डेटा के बीच भिन्नता को यथासंभव संरक्षित किया जाना चाहिए। व्यावहारिक रूप से इसका मतलब यह है कि यह डेटासेट में सुविधाओं को लेता है और उन्हें कम सुविधाओं में विभाजित करता है जो अधिकांश डेटा का प्रतिनिधित्व करते हैं।

K- मीन्स क्लस्टरिंग एक एल्गोरिदम है जो स्वचालित रूप से समान सुविधाओं के आधार पर डेटा बिंदुओं को समूहों में समूहित करता है। डेटासेट के भीतर के पैटर्न का विश्लेषण किया जाता है और डेटापॉइंट इन पैटर्न के आधार पर समूहों में विभाजित हो जाते हैं। मूलतः, K-मीन्स बिना लेबल वाले डेटा से अपनी स्वयं की कक्षाएं बनाता है। के-मीन्स एल्गोरिदम क्लस्टर, या सेंट्रोइड्स को केंद्र निर्दिष्ट करके और सेंट्रोइड्स को तब तक स्थानांतरित करके संचालित होता है जब तक कि सेंट्रोइड्स के लिए इष्टतम स्थिति नहीं मिल जाती। इष्टतम स्थिति वह होगी जहां कक्षा के भीतर सेंट्रोइड से आसपास के डेटा बिंदुओं के बीच की दूरी कम से कम हो। K-मतलब क्लस्टरिंग में "K" से तात्पर्य है कि कितने सेंट्रोइड चुने गए हैं।

सारांश

समाप्त करने के लिए, आइए इनके बीच मुख्य अंतरों पर शीघ्रता से विचार करें पर्यवेक्षित और पर्यवेक्षित शिक्षण।

जैसा कि हमने पहले चर्चा की थी, पर्यवेक्षित शिक्षण कार्यों में इनपुट डेटा को लेबल किया जाता है और कक्षाओं की संख्या ज्ञात होती है। इस बीच, इनपुट डेटा को लेबल नहीं किया गया है और बिना पर्यवेक्षित शिक्षण के मामलों में कक्षाओं की संख्या ज्ञात नहीं है। पर्यवेक्षित शिक्षण कम कम्प्यूटेशनल रूप से जटिल होता है, जबकि पर्यवेक्षित शिक्षण अधिक कम्प्यूटेशनल रूप से जटिल होता है। जबकि पर्यवेक्षित सीखने के परिणाम अत्यधिक सटीक होते हैं, वहीं बिना पर्यवेक्षित सीखने के परिणाम कम सटीक/मध्यम सटीक होते हैं।

विशेषज्ञता वाले ब्लॉगर और प्रोग्रामर मशीन लर्निंग और गहरी सीख विषय। डैनियल को उम्मीद है कि वह दूसरों को सामाजिक भलाई के लिए एआई की शक्ति का उपयोग करने में मदद करेगा।