Connect with us

рдПрдиреНрд╕реЗрдореНрдмрд▓ рд▓рд░реНрдирд┐рдВрдЧ рдХреНрдпрд╛ рд╣реИ?

AI 101

рдПрдиреНрд╕реЗрдореНрдмрд▓ рд▓рд░реНрдирд┐рдВрдЧ рдХреНрдпрд╛ рд╣реИ?

mm

मशीन लर्निंग की सबसे शक्तिशाली तकनीकों में से एक है एन्सेम्बल लर्निंग। एन्सेम्बल लर्निंग कई मशीन लर्निंग मॉडलों का उपयोग करके भविष्यवाणियों की विश्वसनीयता और सटीकता में सुधार करने के लिए किया जाता है। लेकिन कई मशीन लर्निंग मॉडलों का उपयोग करने से अधिक सटीक भविष्यवाणियों कैसे होती हैं? एन्सेम्बल लर्निंग मॉडल बनाने के लिए किस प्रकार की तकनीकों का उपयोग किया जाता है? हम इन प्रश्नों के उत्तर का अन्वेषण करेंगे, एन्सेम्बल मॉडल का उपयोग करने के तर्क और एन्सेम्बल मॉडल बनाने के प्राथमिक तरीकों पर एक नज़र डालेंगे।

एन्सेम्बल लर्निंग क्या है?

साधारण शब्दों में, एन्सेम्बल लर्निंग कई मशीन लर्निंग मॉडलों को प्रशिक्षित करने और उनके आउटपुट को एक साथ जोड़ने की प्रक्रिया है। विभिन्न मॉडल एक ऑप्टिमल भविष्यवाणी मॉडल बनाने के लिए एक आधार के रूप में उपयोग किए जाते हैं। विभिन्न मशीन लर्निंग मॉडलों के एक विविध सेट को जोड़कर समग्र मॉडल की स्थिरता में सुधार किया जा सकता है, जिससे अधिक सटीक भविष्यवाणियां होती हैं। एन्सेम्बल लर्निंग मॉडल अक्सर व्यक्तिगत मॉडलों की तुलना में अधिक विश्वसनीय होते हैं, और परिणामस्वरूप, वे अक्सर कई मशीन लर्निंग प्रतियोगिताओं में पहले स्थान पर आते हैं।
एन्सेम्बल लर्निंग मॉडल बनाने के लिए एक इंजीनियर द्वारा उपयोग की जाने वाली विभिन्न तकनीकें हैं। सरल एन्सेम्बल लर्निंग तकनीकों में विभिन्न मॉडलों के आउटपुट को औसत करना शामिल है, जबकि कई आधार शिक्षकों/मॉडलों की भविष्यवाणियों को एक साथ जोड़ने के लिए विशेष रूप से विकसित अधिक जटिल विधियां और अल्गोरिदम हैं।

एन्सेम्बल प्रशिक्षण विधियों का उपयोग क्यों करें?

मशीन लर्निंग मॉडल विभिन्न कारणों से एक दूसरे से भिन्न हो सकते हैं। विभिन्न मशीन लर्निंग मॉडल अलग-अलग जनसंख्या डेटा के नमूनों पर काम कर सकते हैं, विभिन्न मॉडलिंग तकनीकों का उपयोग किया जा सकता है, और एक अलग परिकल्पना का उपयोग किया जा सकता है।
कल्पना कीजिए कि आप एक बड़े समूह के साथ एक ट्रिविया गेम खेल रहे हैं। यदि आप अकेले एक टीम में हैं, तो निश्चित रूप से कुछ विषय होंगे जिनके बारे में आपको ज्ञान होगा और कई विषय होंगे जिनके बारे में आपको कोई ज्ञान नहीं होगा। अब मान लें कि आप अन्य लोगों के साथ एक टीम में हैं। जैसे कि आप, उनके पास अपनी विशेषज्ञता के बारे में कुछ ज्ञान होगा और अन्य विषयों के बारे में कोई ज्ञान नहीं होगा। लेकिन जब आपके ज्ञान को जोड़ा जाता है, तो आपके पास अधिक सटीक अनुमान होते हैं और विषयों की संख्या कम हो जाती है जिनके बारे में आपकी टीम को कोई ज्ञान नहीं होता है।
यह वही सिद्धांत है जो एन्सेम्बल लर्निंग के आधार पर है, विभिन्न टीम के सदस्यों (व्यक्तिगत मॉडल) की भविष्यवाणियों को जोड़कर सटीकता में सुधार करना और त्रुटियों को कम करना।
आँकड़ाविदों ने साबित किया है कि जब एक भीड़ से एक दिए गए प्रश्न के लिए सही उत्तर का अनुमान लगाने के लिए कहा जाता है, तो उनके सभी उत्तर एक संभावित वितरण बनाते हैं। जो लोग वास्तव में सही उत्तर जानते हैं वे आत्मविश्वास के साथ सही उत्तर चुनेंगे, जबकि जो लोग गलत उत्तर चुनते हैं वे संभावित गलत उत्तरों के श्रृंखला में अपने अनुमानों को वितरित करेंगे। ट्रिविया गेम के उदाहरण पर वापस जाकर, यदि आप और आपके दो दोस्त जानते हैं कि सही उत्तर ए है, तो तीनों आप ए वोट करेंगे, जबकि आपकी टीम के अन्य तीन लोग जो उत्तर नहीं जानते हैं वे गलती से बी, सी, डी, या ई अनुमान लगा सकते हैं। परिणाम यह है कि ए के पास तीन वोट हैं और अन्य उत्तरों के पास अधिकतम एक या दो वोट होंगे।
सभी मॉडलों में कुछ त्रुटि होती है। एक मॉडल द्वारा उत्पादित त्रुटियां दूसरे मॉडल द्वारा उत्पादित त्रुटियों से भिन्न होंगी, क्योंकि मॉडल स्वयं ऊपर वर्णित कारणों से भिन्न होते हैं। जब सभी त्रुटियों की जांच की जाती है, तो वे एक उत्तर या दूसरे के चारों ओर क्लस्टर नहीं होंगे, बल्कि वे गलत उत्तरों के चारों ओर बिखरे होंगे। दूसरी ओर, विभिन्न मॉडलों से सही अनुमान सही उत्तर के चारों ओर क्लस्टर होंगे। जब एन्सेम्बल प्रशिक्षण विधियों का उपयोग किया जाता है, तो सही उत्तर को अधिक विश्वसनीयता के साथ पाया जा सकता है

सरल एन्सेम्बल प्रशिक्षण विधियां

सरल एन्सेम्बल प्रशिक्षण विधियों में आमतौर पर केवल सांख्यिकीय सारांश तकनीकों का अनुप्रयोग शामिल होता है, जैसे कि एक सेट के पूर्वानुमानों का मोड, माध्य, या भारित औसत निर्धारित करना।
मोड एक सेट में सबसे अधिक बार आने वाला तत्व है। मोड प्राप्त करने के लिए, व्यक्तिगत शिक्षा मॉडल अपने पूर्वानुमान लौटाते हैं और ये पूर्वानुमान अंतिम पूर्वानुमान के लिए वोट माने जाते हैं। पूर्वानुमानों का माध्य निकालने के लिए बस पूर्वानुमानों का अंकगणित माध्य निकाला जाता है और निकटतम पूर्ण संख्या तक गोल किया जाता है। अंत में, एक भारित औसत निकाला जा सकता है मॉडलों को अलग-अलग भार देकर जो भविष्यवाणियां बनाते हैं, जो उस मॉडल के महत्व का प्रतिनिधित्व करते हैं। वर्ग भविष्यवाणी का संख्यात्मक प्रतिनिधित्व 0 से 1.0 तक के भार के साथ गुणा किया जाता है, व्यक्तिगत भारित भविष्यवाणियों को जोड़ दिया जाता है और परिणाम को निकटतम पूर्ण संख्या तक गोल किया जाता है।

उन्नत एन्सेम्बल प्रशिक्षण विधियां

तीन प्राथमिक उन्नत एन्सेम्बल प्रशिक्षण तकनीकें हैं, प्रत्येक एक विशिष्ट प्रकार की मशीन लर्निंग समस्या से निपटने के लिए डिज़ाइन की गई है। “बैगिंग” तकनीकें मॉडल की भविष्यवाणियों के परिवर्तनशीलता को कम करने के लिए उपयोग की जाती हैं, जहां परिवर्तनशीलता भविष्यवाणियों के परिणाम में अंतर को संदर्भित करती है जब समान अवलोकन पर आधारित होती है। “बूस्टिंग” तकनीकें मॉडलों के पूर्वाग्रह से निपटने के लिए उपयोग की जाती हैं। अंत में, “स्टैकिंग” सामान्य रूप से भविष्यवाणियों में सुधार करने के लिए उपयोग की जाती है।
एन्सेम्बल लर्निंग विधियों को सामान्य रूप से दो अलग-अलग समूहों में विभाजित किया जा सकता है: क्रमिक विधियां और समानांतर एन्सेम्बल विधियां।
क्रमिक एन्सेम्बल विधियों को “क्रमिक” नाम मिलता है क्योंकि आधार शिक्षक/मॉडल क्रमिक रूप से उत्पन्न होते हैं। क्रमिक विधियों के मामले में, मूल विचार यह है कि आधार शिक्षकों के बीच निर्भरता का फायदा उठाकर अधिक सटीक भविष्यवाणियां प्राप्त की जा सकती हैं। गलत लेबल वाले उदाहरणों के वजन को समायोजित किया जाता है, जबकि सही लेबल वाले उदाहरणों के वजन समान रहते हैं। प्रत्येक बार जब एक नया शिक्षक उत्पन्न होता है, तो वजन बदल जाते हैं और सटीकता (उम्मीद है) में सुधार होता है।
क्रमिक एन्सेम्बल मॉडल के विपरीत, समानांतर एन्सेम्बल विधियां आधार शिक्षकों को समानांतर में उत्पन्न करती हैं। समानांतर एन्सेम्बल प्रशिक्षण करते समय, विचार यह है कि आधार शिक्षकों की स्वतंत्रता का फायदा उठाना, क्योंकि सामान्य त्रुटि दर व्यक्तिगत शिक्षकों की भविष्यवाणियों को औसत करके कम की जा सकती है।
एन्सेम्बल प्रशिक्षण विधियों को होमोजीनस या हेटेरोजीनस प्रकृति का हो सकता है। अधिकांश एन्सेम्बल लर्निंग विधियां होमोजीनस होती हैं, जिसका अर्थ है कि वे एक ही प्रकार के आधार शिक्षा मॉडल/अल्गोरिदम का उपयोग करती हैं। इसके विपरीत, हेटेरोजीनस एन्सेम्बल विभिन्न शिक्षा अल्गोरिदम का उपयोग करते हैं, शिक्षकों को विविधता प्रदान करते हैं और सटीकता को यथासंभव उच्च बनाने के लिए उन्हें बदल देते हैं।

एन्सेम्बल लर्निंग अल्गोरिदम के उदाहरण

एन्सेम्बल बूस्टिंग का दृश्यीकरण। फोटो: सिराकोर्न विकिमीडिया कॉमन्स, सीसी बाय एसए 4.0, (https://commons.wikimedia.org/wiki/File:Ensemble_Boosting.svg)


рдмреНрд▓реЙрдЧрд░ рдФрд░ рдкреНрд░реЛрдЧреНрд░рд╛рдорд░ рдЬрд┐рдирдХреА рд╡рд┐рд╢реЗрд╖рдЬреНрдЮрддрд╛ рдореИрд╢реАрди рд▓рд░реНрдирд┐рдВрдЧ рдФрд░ рдбреАрдк рд▓рд░реНрдирд┐рдВрдЧ рд╡рд┐рд╖рдпреЛрдВ рдореЗрдВ рд╣реИред рдбреИрдирд┐рдпрд▓ рджреВрд╕рд░реЛрдВ рдХреЛ рд╕рд╛рдорд╛рдЬрд┐рдХ рдХрд▓реНрдпрд╛рдг рдХреЗ рд▓рд┐рдП рдПрдЖрдИ рдХреА рд╢рдХреНрддрд┐ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдореЗрдВ рдорджрдж рдХрд░рдирд╛ рдЪрд╛рд╣рддрд╛ рд╣реИред