AI 101
рдПрдиреНрд╕реЗрдореНрдмрд▓ рд▓рд░реНрдирд┐рдВрдЧ рдХреНрдпрд╛ рд╣реИ?

मशीन लर्निंग की सबसे शक्तिशाली तकनीकों में से एक है एन्सेम्बल लर्निंग। एन्सेम्बल लर्निंग कई मशीन लर्निंग मॉडलों का उपयोग करके भविष्यवाणियों की विश्वसनीयता और सटीकता में सुधार करने के लिए किया जाता है। लेकिन कई मशीन लर्निंग मॉडलों का उपयोग करने से अधिक सटीक भविष्यवाणियों कैसे होती हैं? एन्सेम्बल लर्निंग मॉडल बनाने के लिए किस प्रकार की तकनीकों का उपयोग किया जाता है? हम इन प्रश्नों के उत्तर का अन्वेषण करेंगे, एन्सेम्बल मॉडल का उपयोग करने के तर्क और एन्सेम्बल मॉडल बनाने के प्राथमिक तरीकों पर एक नज़र डालेंगे।
एन्सेम्बल लर्निंग क्या है?
साधारण शब्दों में, एन्सेम्बल लर्निंग कई मशीन लर्निंग मॉडलों को प्रशिक्षित करने और उनके आउटपुट को एक साथ जोड़ने की प्रक्रिया है। विभिन्न मॉडल एक ऑप्टिमल भविष्यवाणी मॉडल बनाने के लिए एक आधार के रूप में उपयोग किए जाते हैं। विभिन्न मशीन लर्निंग मॉडलों के एक विविध सेट को जोड़कर समग्र मॉडल की स्थिरता में सुधार किया जा सकता है, जिससे अधिक सटीक भविष्यवाणियां होती हैं। एन्सेम्बल लर्निंग मॉडल अक्सर व्यक्तिगत मॉडलों की तुलना में अधिक विश्वसनीय होते हैं, और परिणामस्वरूप, वे अक्सर कई मशीन लर्निंग प्रतियोगिताओं में पहले स्थान पर आते हैं।
एन्सेम्बल लर्निंग मॉडल बनाने के लिए एक इंजीनियर द्वारा उपयोग की जाने वाली विभिन्न तकनीकें हैं। सरल एन्सेम्बल लर्निंग तकनीकों में विभिन्न मॉडलों के आउटपुट को औसत करना शामिल है, जबकि कई आधार शिक्षकों/मॉडलों की भविष्यवाणियों को एक साथ जोड़ने के लिए विशेष रूप से विकसित अधिक जटिल विधियां और अल्गोरिदम हैं।
एन्सेम्बल प्रशिक्षण विधियों का उपयोग क्यों करें?
मशीन लर्निंग मॉडल विभिन्न कारणों से एक दूसरे से भिन्न हो सकते हैं। विभिन्न मशीन लर्निंग मॉडल अलग-अलग जनसंख्या डेटा के नमूनों पर काम कर सकते हैं, विभिन्न मॉडलिंग तकनीकों का उपयोग किया जा सकता है, और एक अलग परिकल्पना का उपयोग किया जा सकता है।
कल्पना कीजिए कि आप एक बड़े समूह के साथ एक ट्रिविया गेम खेल रहे हैं। यदि आप अकेले एक टीम में हैं, तो निश्चित रूप से कुछ विषय होंगे जिनके बारे में आपको ज्ञान होगा और कई विषय होंगे जिनके बारे में आपको कोई ज्ञान नहीं होगा। अब मान लें कि आप अन्य लोगों के साथ एक टीम में हैं। जैसे कि आप, उनके पास अपनी विशेषज्ञता के बारे में कुछ ज्ञान होगा और अन्य विषयों के बारे में कोई ज्ञान नहीं होगा। लेकिन जब आपके ज्ञान को जोड़ा जाता है, तो आपके पास अधिक सटीक अनुमान होते हैं और विषयों की संख्या कम हो जाती है जिनके बारे में आपकी टीम को कोई ज्ञान नहीं होता है।
यह वही सिद्धांत है जो एन्सेम्बल लर्निंग के आधार पर है, विभिन्न टीम के सदस्यों (व्यक्तिगत मॉडल) की भविष्यवाणियों को जोड़कर सटीकता में सुधार करना और त्रुटियों को कम करना।
आँकड़ाविदों ने साबित किया है कि जब एक भीड़ से एक दिए गए प्रश्न के लिए सही उत्तर का अनुमान लगाने के लिए कहा जाता है, तो उनके सभी उत्तर एक संभावित वितरण बनाते हैं। जो लोग वास्तव में सही उत्तर जानते हैं वे आत्मविश्वास के साथ सही उत्तर चुनेंगे, जबकि जो लोग गलत उत्तर चुनते हैं वे संभावित गलत उत्तरों के श्रृंखला में अपने अनुमानों को वितरित करेंगे। ट्रिविया गेम के उदाहरण पर वापस जाकर, यदि आप और आपके दो दोस्त जानते हैं कि सही उत्तर ए है, तो तीनों आप ए वोट करेंगे, जबकि आपकी टीम के अन्य तीन लोग जो उत्तर नहीं जानते हैं वे गलती से बी, सी, डी, या ई अनुमान लगा सकते हैं। परिणाम यह है कि ए के पास तीन वोट हैं और अन्य उत्तरों के पास अधिकतम एक या दो वोट होंगे।
सभी मॉडलों में कुछ त्रुटि होती है। एक मॉडल द्वारा उत्पादित त्रुटियां दूसरे मॉडल द्वारा उत्पादित त्रुटियों से भिन्न होंगी, क्योंकि मॉडल स्वयं ऊपर वर्णित कारणों से भिन्न होते हैं। जब सभी त्रुटियों की जांच की जाती है, तो वे एक उत्तर या दूसरे के चारों ओर क्लस्टर नहीं होंगे, बल्कि वे गलत उत्तरों के चारों ओर बिखरे होंगे। दूसरी ओर, विभिन्न मॉडलों से सही अनुमान सही उत्तर के चारों ओर क्लस्टर होंगे। जब एन्सेम्बल प्रशिक्षण विधियों का उपयोग किया जाता है, तो सही उत्तर को अधिक विश्वसनीयता के साथ पाया जा सकता है।
सरल एन्सेम्बल प्रशिक्षण विधियां
सरल एन्सेम्बल प्रशिक्षण विधियों में आमतौर पर केवल सांख्यिकीय सारांश तकनीकों का अनुप्रयोग शामिल होता है, जैसे कि एक सेट के पूर्वानुमानों का मोड, माध्य, या भारित औसत निर्धारित करना।
मोड एक सेट में सबसे अधिक बार आने वाला तत्व है। मोड प्राप्त करने के लिए, व्यक्तिगत शिक्षा मॉडल अपने पूर्वानुमान लौटाते हैं और ये पूर्वानुमान अंतिम पूर्वानुमान के लिए वोट माने जाते हैं। पूर्वानुमानों का माध्य निकालने के लिए बस पूर्वानुमानों का अंकगणित माध्य निकाला जाता है और निकटतम पूर्ण संख्या तक गोल किया जाता है। अंत में, एक भारित औसत निकाला जा सकता है मॉडलों को अलग-अलग भार देकर जो भविष्यवाणियां बनाते हैं, जो उस मॉडल के महत्व का प्रतिनिधित्व करते हैं। वर्ग भविष्यवाणी का संख्यात्मक प्रतिनिधित्व 0 से 1.0 तक के भार के साथ गुणा किया जाता है, व्यक्तिगत भारित भविष्यवाणियों को जोड़ दिया जाता है और परिणाम को निकटतम पूर्ण संख्या तक गोल किया जाता है।
उन्नत एन्सेम्बल प्रशिक्षण विधियां
तीन प्राथमिक उन्नत एन्सेम्बल प्रशिक्षण तकनीकें हैं, प्रत्येक एक विशिष्ट प्रकार की मशीन लर्निंग समस्या से निपटने के लिए डिज़ाइन की गई है। “बैगिंग” तकनीकें मॉडल की भविष्यवाणियों के परिवर्तनशीलता को कम करने के लिए उपयोग की जाती हैं, जहां परिवर्तनशीलता भविष्यवाणियों के परिणाम में अंतर को संदर्भित करती है जब समान अवलोकन पर आधारित होती है। “बूस्टिंग” तकनीकें मॉडलों के पूर्वाग्रह से निपटने के लिए उपयोग की जाती हैं। अंत में, “स्टैकिंग” सामान्य रूप से भविष्यवाणियों में सुधार करने के लिए उपयोग की जाती है।
एन्सेम्बल लर्निंग विधियों को सामान्य रूप से दो अलग-अलग समूहों में विभाजित किया जा सकता है: क्रमिक विधियां और समानांतर एन्सेम्बल विधियां।
क्रमिक एन्सेम्बल विधियों को “क्रमिक” नाम मिलता है क्योंकि आधार शिक्षक/मॉडल क्रमिक रूप से उत्पन्न होते हैं। क्रमिक विधियों के मामले में, मूल विचार यह है कि आधार शिक्षकों के बीच निर्भरता का फायदा उठाकर अधिक सटीक भविष्यवाणियां प्राप्त की जा सकती हैं। गलत लेबल वाले उदाहरणों के वजन को समायोजित किया जाता है, जबकि सही लेबल वाले उदाहरणों के वजन समान रहते हैं। प्रत्येक बार जब एक नया शिक्षक उत्पन्न होता है, तो वजन बदल जाते हैं और सटीकता (उम्मीद है) में सुधार होता है।
क्रमिक एन्सेम्बल मॉडल के विपरीत, समानांतर एन्सेम्बल विधियां आधार शिक्षकों को समानांतर में उत्पन्न करती हैं। समानांतर एन्सेम्बल प्रशिक्षण करते समय, विचार यह है कि आधार शिक्षकों की स्वतंत्रता का फायदा उठाना, क्योंकि सामान्य त्रुटि दर व्यक्तिगत शिक्षकों की भविष्यवाणियों को औसत करके कम की जा सकती है।
एन्सेम्बल प्रशिक्षण विधियों को होमोजीनस या हेटेरोजीनस प्रकृति का हो सकता है। अधिकांश एन्सेम्बल लर्निंग विधियां होमोजीनस होती हैं, जिसका अर्थ है कि वे एक ही प्रकार के आधार शिक्षा मॉडल/अल्गोरिदम का उपयोग करती हैं। इसके विपरीत, हेटेरोजीनस एन्सेम्बल विभिन्न शिक्षा अल्गोरिदम का उपयोग करते हैं, शिक्षकों को विविधता प्रदान करते हैं और सटीकता को यथासंभव उच्च बनाने के लिए उन्हें बदल देते हैं।
एन्सेम्बल लर्निंग अल्गोरिदम के उदाहरण

एन्सेम्बल बूस्टिंग का दृश्यीकरण। फोटो: सिराकोर्न विकिमीडिया कॉमन्स, सीसी बाय एसए 4.0, (https://commons.wikimedia.org/wiki/File:Ensemble_Boosting.svg)












