AI 101
рдлреЗрдбрд░реЗрдЯреЗрдб рд▓рд░реНрдирд┐рдВрдЧ рдХреНрдпрд╛ рд╣реИ?

फेडरेटेड लर्निंग क्या है?
पारंपरिक तरीके से एआई मॉडल्स को प्रशिक्षित करने के लिए, आमतौर पर क्लाउड-आधारित कंप्यूटिंग प्लेटफ़ॉर्म के माध्यम से सर्वर सेट किए जाते हैं जहां मॉडल्स डेटा पर प्रशिक्षित होते हैं। हालांकि, पिछले कुछ वर्षों में, मॉडल निर्माण का एक वैकल्पिक रूप उभरा है, जिसे फेडरेटेड लर्निंग कहा जाता है। फेडरेटेड लर्निंग मशीन लर्निंग मॉडल्स को डेटा स्रोत तक ले जाती है, न कि डेटा को मॉडल तक ले जाती है। फेडरेटेड लर्निंग कई गणना उपकरणों को एक विकेंद्रीकृत प्रणाली में जोड़ती है जो डेटा एकत्र करने वाले व्यक्तिगत उपकरणों को मॉडल को प्रशिक्षित करने में मदद करने की अनुमति देती है।
एक फेडरेटेड लर्निंग सिस्टम में, नेटवर्क के हिस्से वाले विभिन्न उपकरणों में प्रत्येक उपकरण पर मॉडल की एक प्रति होती है। विभिन्न उपकरण/क्लाइंट अपने स्थानीय डेटा का उपयोग करके मॉडल की अपनी प्रति को प्रशिक्षित करते हैं, और फिर व्यक्तिगत मॉडल्स से प्राप्त पैरामीटर/वजन एक मास्टर डिवाइस, या सर्वर को भेजे जाते हैं जो पैरामीटर को एकत्रित करता है और वैश्विक मॉडल को अपडेट करता है। यह प्रशिक्षण प्रक्रिया तब तक दोहराई जा सकती है जब तक कि एक वांछित स्तर की सटीकता प्राप्त नहीं हो जाती। संक्षेप में, फेडरेटेड लर्निंग के पीछे का विचार यह है कि प्रशिक्षण डेटा कभी भी उपकरणों के बीच या पार्टियों के बीच संचारित नहीं किया जाता है, केवल मॉडल से संबंधित अद्यतन ही संचारित किए जाते हैं।
फेडरेटेड लर्निंग को तीन अलग-अलग चरणों या चरणों में विभाजित किया जा सकता है। फेडरेटेड लर्निंग आमतौर पर एक जेनेरिक मॉडल से शुरू होती है जो एक बेसलाइन के रूप में कार्य करती है और एक केंद्रीय सर्वर पर प्रशिक्षित होती है। पहले चरण में, यह जेनेरिक मॉडल एप्लिकेशन के क्लाइंट्स को भेजा जाता है। ये स्थानीय प्रतियां फिर क्लाइंट सिस्टम द्वारा उत्पन्न डेटा पर प्रशिक्षित होती हैं, सीखती हैं और अपने प्रदर्शन में सुधार करती हैं।
दूसरे चरण में, क्लाइंट अपने सीखे हुए मॉडल पैरामीटर को केंद्रीय सर्वर को भेजते हैं। यह नियमित रूप से एक निर्धारित अनुसूची पर होता है।
तीसरे चरण में, सर्वर प्राप्त होने पर सीखे हुए पैरामीटर को एकत्रित करता है। पैरामीटर एकत्रित होने के बाद, केंद्रीय मॉडल को अपडेट किया जाता है और फिर से क्लाइंट के साथ साझा किया जाता है। पूरी प्रक्रिया तब दोहराई जाती है।
विभिन्न उपकरणों पर मॉडल की एक प्रति होने का लाभ यह है कि नेटवर्क देरी कम हो जाती है या समाप्त हो जाती है। सर्वर के साथ डेटा साझा करने से जुड़ी लागत भी समाप्त हो जाती है। फेडरेटेड लर्निंग तरीकों के अन्य लाभों में यह तथ्य शामिल है कि फेडरेटेड लर्निंग मॉडल्स गोपनीयता संरक्षित हैं, और मॉडल प्रतिक्रियाएं डिवाइस के उपयोगकर्ता के लिए व्यक्तिगत हैं।
फेडरेटेड लर्निंग मॉडल्स के उदाहरणों में रिकमेंडेशन इंजन, धोखाधड़ी का पता लगाने वाले मॉडल और चिकित्सा मॉडल शामिल हैं। नेटफ्लिक्स या अमेज़ॅन द्वारा उपयोग किए जाने वाले प्रकार के मीडिया रिकमेंडेशन इंजन, हज़ारों उपयोगकर्ताओं से एकत्रित डेटा पर प्रशिक्षित हो सकते हैं। क्लाइंट डिवाइस अपने अलग-अलग मॉडल्स को प्रशिक्षित करेंगे और केंद्रीय मॉडल बेहतर भविष्यवाणियां करना सीखेगा, भले ही व्यक्तिगत डेटा बिंदु विभिन्न उपयोगकर्ताओं के लिए अद्वितीय हों। इसी तरह, बैंकों द्वारा उपयोग किए जाने वाले धोखाधड़ी का पता लगाने वाले मॉडल विभिन्न उपकरणों से गतिविधि के पैटर्न पर प्रशिक्षित हो सकते हैं, और कुछ अलग-अलग बैंक एक सामान्य मॉडल को प्रशिक्षित करने के लिए सहयोग कर सकते हैं। चिकित्सा फेडरेटेड लर्निंग मॉडल के संदर्भ में, कई अस्पताल एक सामान्य मॉडल को प्रशिक्षित करने के लिए मिलकर काम कर सकते हैं जो चिकित्सा स्कैन के माध्यम से संभावित ट्यूमर की पहचान कर सकता है।
फेडरेटेड लर्निंग के प्रकार
फेडरेटेड लर्निंग स्कीमा आमतौर पर दो अलग-अलग वर्गों में से एक में आती हैं: बहु-पक्षीय प्रणाली और एकल-पक्षीय प्रणाली। एकल-पक्षीय फेडरेटेड लर्निंग प्रणाली “एकल-पक्षीय” कहलाती है क्योंकि केवल एक इकाई पूरे नेटवर्क में सभी क्लाइंट डिवाइसों में डेटा के कब्जे और प्रवाह की देखभाल के लिए जिम्मेदार होती है। क्लाइंट डिवाइसों पर मौजूद मॉडल्स डेटा की एक ही संरचना पर प्रशिक्षित होते हैं, हालांकि डेटा बिंदु विभिन्न उपयोगकर्ताओं और डिवाइसों के लिए अद्वितीय होते हैं।
एकल-पक्षीय प्रणालियों के विपरीत, बहु-पक्षीय प्रणालियां दो या दो से अधिक इकाइयों द्वारा प्रबंधित की जाती हैं। ये इकाइयां एक साझा मॉडल को प्रशिक्षित करने के लिए सहयोग करती हैं जिसमें वे विभिन्न उपकरणों और डेटासेट तक पहुंच प्रदान करती हैं। उपकरणों के पैरामीटर और डेटा संरचनाएं आमतौर पर विभिन्न इकाइयों से संबंधित उपकरणों में समान होती हैं, लेकिन उन्हें समान होने की आवश्यकता नहीं है। इसके बजाय, मॉडल के इनपुट को मानकीकृत करने के लिए पूर्व-प्रसंस्करण किया जाता है। एक तटस्थ इकाई प्रत्येक उपकरण द्वारा स्थापित वजन को एकत्रित करने के लिए नियुक्त की जा सकती है।
फेडरेटेड लर्निंग के लिए फ्रेमवर्क
फेडरेटेड लर्निंग के लिए लोकप्रिय फ्रेमवर्क में टेंसरफ्लो फेडरेटेड, फेडरेटेड एआई टेक्नोलॉजी एनेबलर (फेट), और पीसिफ्ट शामिल हैं। पीसिफ्ट पायटॉर्च डीप लर्निंग लाइब्रेरी पर आधारित एक ओपन-सोर्स फेडरेटेड लर्निंग लाइब्रेरी है। पीसिफ्ट सर्वर और एजेंटों के बीच एन्क्रिप्टेड गणना का उपयोग करके निजी, सुरक्षित डीप लर्निंग सुनिश्चित करने के लिए डिज़ाइन किया गया है। जबकि टेंसरफ्लो फेडरेटेड गूगल के टेंसरफ्लो प्लेटफॉर्म पर निर्मित एक और ओपन-सोर्स फ्रेमवर्क है। टेंसरफ्लो फेडरेटेड के अलावा अपने स्वयं के अल्गोरिदम बनाने की अनुमति देने के अलावा, टेंसरफ्लो फेडरेटेड उपयोगकर्ताओं को अपने स्वयं के मॉडल और डेटा पर शामिल किए गए फेडरेटेड लर्निंग अल्गोरिदम को सिम्युलेट करने की अनुमति देता है। अंत में, फेट भी वेबैंक एआई द्वारा डिज़ाइन किया गया एक ओपन-सोर्स फ्रेमवर्क है, और इसका उद्देश्य फेडरेटेड एआई पारिस्थितिकी तंत्र को एक सुरक्षित गणना फ्रेमवर्क प्रदान करना है।
फेडरेटेड लर्निंग की चुनौतियाँ
चूंकि फेडरेटेड लर्निंग अभी भी अपेक्षाकृत नई है, कई चुनौतियाँ अभी भी इसकी पूरी क्षमता को प्राप्त करने के लिए बातचीत करने की आवश्यकता है। एज डिवाइसों की स्थानीय प्रशिक्षण क्षमताओं, डेटा लेबलिंग और मानकीकरण, और मॉडल अभिसरण संभावित रोडब्लॉक हैं जिन्हें फेडरेटेड लर्निंग दृष्टिकोणों को पार करने की आवश्यकता है।
स्थानीय प्रशिक्षण के लिए एज डिवाइसों की गणना क्षमताओं पर विचार किया जाना चाहिए जब फेडरेटेड लर्निंग दृष्टिकोणों को डिज़ाइन किया जाता है। जबकि अधिकांश स्मार्टफ़ोन, टैबलेट और अन्य आईओटी संगत उपकरण मशीन लर्निंग मॉडल्स को प्रशिक्षित करने में सक्षम हैं, यह आमतौर पर डिवाइस के प्रदर्शन को बाधित करता है। मॉडल सटीकता और डिवाइस प्रदर्शन के बीच समझौते किए जाने चाहिए।
डेटा लेबलिंग और मानकीकरण फेडरेटेड लर्निंग सिस्टम को पार करने के लिए एक और चुनौती है। पर्यवेक्षित लर्निंग मॉडल्स को प्रशिक्षित करने के लिए स्पष्ट रूप से और लगातार लेबल किए गए प्रशिक्षण डेटा की आवश्यकता होती है, जो प्रणाली के हिस्से वाले कई क्लाइंट डिवाइसों में करना मुश्किल हो सकता है। इस कारण से, मॉडल डेटा पाइपलाइन विकसित करना महत्वपूर्ण है जो घटनाओं और उपयोगकर्ता क्रियाओं के आधार पर एक मानक तरीके से स्वचालित रूप से लेबल लागू करता है।
मॉडल अभिसरण समय फेडरेटेड लर्निंग के लिए एक और चुनौती है, क्योंकि फेडरेटेड लर्निंग मॉडल्स आमतौर पर स्थानीय रूप से प्रशिक्षित मॉडल्स की तुलना में अधिक समय लेते हैं। प्रशिक्षण में शामिल उपकरणों की संख्या मॉडल प्रशिक्षण में एक अनिश्चितता का तत्व जोड़ती है, क्योंकि कनेक्शन समस्याएं, अनियमित अपडेट, और यहां तक कि विभिन्न अनुप्रयोग उपयोग समय भी अभिसरण समय में वृद्धि और विश्वसनीयता में कमी का योगदान कर सकते हैं। इस कारण से, फेडरेटेड लर्निंग समाधान आमतौर पर तब सबसे अधिक उपयोगी होते हैं जब वे केंद्रीय रूप से एक मॉडल को प्रशिक्षित करने की तुलना में महत्वपूर्ण लाभ प्रदान करते हैं, जैसे कि जब डेटासेट बहुत बड़े और वितरित होते हैं।

फोटो: जेरोमेमेट्रोनोम विकिमीडिया कॉमन्स के माध्यम से, सीसी बाय एसए 4.0 (https://en.wikipedia.org/wiki/File:Federated_learning_process_central_case.png)












