ठूंठ बैकप्रॉपैगेशन क्या है? - यूनाइट.एआई
हमसे जुडे
एआई मास्टरक्लास:

एआई 101

बैकप्रॉपैगेशन क्या है?

mm
Updated on

बैकप्रॉपैगेशन क्या है?

गहन शिक्षण प्रणालियाँ अत्यंत जटिल पैटर्न सीखने में सक्षम हैं, और वे अपने वजन को समायोजित करके इसे पूरा करते हैं। एक गहरे तंत्रिका नेटवर्क के वजन को सटीक रूप से कैसे समायोजित किया जाता है? के माध्यम से उन्हें समायोजित किया जाता है एक प्रक्रिया बुलाया बैकप्रोगैगेशन. बैकप्रॉपैगेशन के बिना, गहरे तंत्रिका नेटवर्क छवियों को पहचानने और प्राकृतिक भाषा की व्याख्या करने जैसे कार्य करने में सक्षम नहीं होंगे। यह समझना कि बैकप्रोपेगेशन कैसे काम करता है, सामान्य रूप से गहरे तंत्रिका नेटवर्क को समझने के लिए महत्वपूर्ण है, तो आइए बैकप्रोपेगेशन पर चर्चा करें और देखें कि नेटवर्क के वजन को समायोजित करने के लिए प्रक्रिया का उपयोग कैसे किया जाता है।

बैकप्रॉपैगेशन को समझना मुश्किल हो सकता है, और बैकप्रोपेगेशन को अंजाम देने के लिए उपयोग की जाने वाली गणनाएं काफी जटिल हो सकती हैं। यह लेख आपको जटिल गणित का थोड़ा सा उपयोग करते हुए, बैकप्रोपेगेशन की सहज समझ देने का प्रयास करेगा। हालाँकि, बैकप्रॉपेगेशन के पीछे के गणित पर कुछ चर्चा आवश्यक है।

बैकप्रोपेगेशन का लक्ष्य

आइए बैकप्रोपेगेशन के लक्ष्य को परिभाषित करके शुरुआत करें। एक गहरे तंत्रिका नेटवर्क का भार तंत्रिका नेटवर्क की इकाइयों के बीच कनेक्शन की ताकत है। जब तंत्रिका नेटवर्क स्थापित होता है तो इस बारे में धारणाएँ बनाई जाती हैं कि एक परत की इकाइयाँ इससे जुड़ी परतों से कैसे जुड़ी हैं। जैसे ही डेटा तंत्रिका नेटवर्क के माध्यम से चलता है, वजन की गणना की जाती है और धारणाएं बनाई जाती हैं। जब डेटा नेटवर्क की अंतिम परत तक पहुँचता है, तो एक भविष्यवाणी की जाती है कि सुविधाएँ डेटासेट में कक्षाओं से कैसे संबंधित हैं। पूर्वानुमानित मूल्यों और वास्तविक मूल्यों के बीच का अंतर हानि/त्रुटि और बैकप्रोपेगेशन का लक्ष्य है घाटे को कम करना है. यह नेटवर्क के भार को समायोजित करके पूरा किया जाता है, जिससे धारणाएं इनपुट सुविधाओं के बीच वास्तविक संबंधों की तरह बन जाती हैं।

एक गहन तंत्रिका नेटवर्क का प्रशिक्षण

बैकप्रॉपैगेशन से पहले एक पर किया जा सकता है तंत्रिका नेटवर्क, तंत्रिका नेटवर्क का नियमित/अग्रेषित प्रशिक्षण पास किया जाना चाहिए। जब एक तंत्रिका नेटवर्क बनाया जाता है, तो वज़न का एक सेट आरंभ किया जाता है। नेटवर्क के प्रशिक्षित होते ही वज़न का मान बदल दिया जाएगा। तंत्रिका नेटवर्क के फॉरवर्ड ट्रेनिंग पास की कल्पना तीन अलग-अलग चरणों के रूप में की जा सकती है: न्यूरॉन सक्रियण, न्यूरॉन ट्रांसफर और फॉरवर्ड प्रसार।

एक गहरे तंत्रिका नेटवर्क को प्रशिक्षित करते समय, हमें कई गणितीय कार्यों का उपयोग करने की आवश्यकता होती है। एक गहरे तंत्रिका नेटवर्क में न्यूरॉन्स आने वाले डेटा और एक सक्रियण फ़ंक्शन से बने होते हैं, जो नोड को सक्रिय करने के लिए आवश्यक मूल्य निर्धारित करता है। एक न्यूरॉन के सक्रियण मूल्य की गणना कई घटकों के साथ की जाती है, जो इनपुट का भारित योग होता है। वजन और इनपुट मान सक्रियण की गणना के लिए उपयोग किए जा रहे नोड्स के सूचकांक पर निर्भर करते हैं। सक्रियण मूल्य की गणना करते समय एक अन्य संख्या को ध्यान में रखा जाना चाहिए, एक पूर्वाग्रह मूल्य। पूर्वाग्रह मूल्यों में उतार-चढ़ाव नहीं होता है, इसलिए उन्हें वजन और इनपुट के साथ गुणा नहीं किया जाता है, उन्हें बस जोड़ा जाता है। इसका मतलब यह है कि सक्रियण मूल्य की गणना के लिए निम्नलिखित समीकरण का उपयोग किया जा सकता है:

सक्रियण = योग (वजन * इनपुट) + पूर्वाग्रह

न्यूरॉन सक्रिय होने के बाद, न्यूरॉन के वास्तविक आउटपुट का आउटपुट क्या होगा यह निर्धारित करने के लिए एक सक्रियण फ़ंक्शन का उपयोग किया जाता है। अलग-अलग शिक्षण कार्यों के लिए अलग-अलग सक्रियण फ़ंक्शन इष्टतम हैं, लेकिन आमतौर पर उपयोग किए जाने वाले सक्रियण कार्यों में सिग्मॉइड फ़ंक्शन, तनह फ़ंक्शन और ReLU फ़ंक्शन शामिल हैं।

एक बार वांछित सक्रियण फ़ंक्शन के माध्यम से सक्रियण मान चलाकर न्यूरॉन के आउटपुट की गणना की जाती है, तो आगे प्रसार किया जाता है। अग्रेषित प्रसार में केवल एक परत के आउटपुट लेना और उन्हें अगली परत का इनपुट बनाना शामिल है। फिर नए इनपुट का उपयोग नए सक्रियण कार्यों की गणना करने के लिए किया जाता है, और इस ऑपरेशन का आउटपुट निम्न परत पर भेज दिया जाता है। यह प्रक्रिया तंत्रिका नेटवर्क के अंत तक जारी रहती है।

नेटवर्क में बैकप्रोपेगेशन

बैकप्रोपेगेशन की प्रक्रिया एक मॉडल के प्रशिक्षण पास के अंतिम निर्णय लेती है, और फिर यह इन निर्णयों में त्रुटियों को निर्धारित करती है। त्रुटियों की गणना नेटवर्क के आउटपुट/निर्णयों और नेटवर्क के अपेक्षित/वांछित आउटपुट के बीच तुलना करके की जाती है।

एक बार नेटवर्क के निर्णयों में त्रुटियों की गणना हो जाने के बाद, यह जानकारी नेटवर्क के माध्यम से वापस प्रसारित की जाती है और नेटवर्क के मापदंडों को रास्ते में बदल दिया जाता है। नेटवर्क के भार को अद्यतन करने के लिए जिस विधि का उपयोग किया जाता है वह कैलकुलस पर आधारित है, विशेष रूप से, यह श्रृंखला-नियम पर आधारित है। हालाँकि, बैकप्रॉपैगेशन के विचार को समझने के लिए कैलकुलस की समझ आवश्यक नहीं है। बस यह जान लें कि जब न्यूरॉन से आउटपुट मान प्रदान किया जाता है, तो आउटपुट मान के ढलान की गणना ट्रांसफर फ़ंक्शन के साथ की जाती है, जिससे व्युत्पन्न आउटपुट उत्पन्न होता है। बैकप्रॉपैगेशन करते समय, एक विशिष्ट न्यूरॉन के लिए त्रुटि की गणना निम्नलिखित के अनुसार की जाती है सूत्र:

त्रुटि = (अपेक्षित_आउटपुट - वास्तविक_आउटपुट) * न्यूरॉन के आउटपुट मान का ढलान

आउटपुट परत में न्यूरॉन्स पर काम करते समय, वर्ग मान का उपयोग अपेक्षित मान के रूप में किया जाता है। त्रुटि की गणना करने के बाद, त्रुटि को छिपी हुई परत में न्यूरॉन्स के लिए इनपुट के रूप में उपयोग किया जाता है, जिसका अर्थ है कि इस छिपी हुई परत के लिए त्रुटि आउटपुट परत के भीतर पाए जाने वाले न्यूरॉन्स की भारित त्रुटियां हैं। त्रुटि गणना भार नेटवर्क के साथ नेटवर्क के माध्यम से पीछे की ओर यात्रा करती है।

नेटवर्क के लिए त्रुटियों की गणना करने के बाद, नेटवर्क में भार को अद्यतन किया जाना चाहिए। जैसा कि उल्लेख किया गया है, त्रुटि की गणना में आउटपुट मान का ढलान निर्धारित करना शामिल है। ढलान की गणना करने के बाद, नेटवर्क में वजन को समायोजित करने के लिए ग्रेडिएंट डिसेंट नामक एक प्रक्रिया का उपयोग किया जा सकता है। ढाल एक ढलान है, जिसके कोण/ढिरता को मापा जा सकता है। ढलान की गणना "y ओवर" या "रन" पर "उदय" को प्लॉट करके की जाती है। तंत्रिका नेटवर्क और त्रुटि दर के मामले में, "y" गणना की गई त्रुटि है, जबकि "x" नेटवर्क का पैरामीटर है। नेटवर्क के मापदंडों का परिकलित त्रुटि मानों से संबंध होता है, और जैसे-जैसे नेटवर्क का भार समायोजित होता है, त्रुटि बढ़ती या घटती है।

"ग्रेडिएंट डिसेंट" वज़न को अद्यतन करने की प्रक्रिया है ताकि त्रुटि दर कम हो जाए। बैकप्रॉपैगेशन का उपयोग तंत्रिका नेटवर्क के मापदंडों और त्रुटि दर के बीच संबंध की भविष्यवाणी करने के लिए किया जाता है, जो नेटवर्क को ग्रेडिएंट डिसेंट के लिए सेट करता है। ग्रेडिएंट डिसेंट के साथ एक नेटवर्क को प्रशिक्षित करने में आगे के प्रसार के माध्यम से वजन की गणना करना, त्रुटि को वापस प्रसारित करना और फिर नेटवर्क के वजन को अपडेट करना शामिल है।

विशेषज्ञता वाले ब्लॉगर और प्रोग्रामर मशीन लर्निंग और गहरी सीख विषय। डैनियल को उम्मीद है कि वह दूसरों को सामाजिक भलाई के लिए एआई की शक्ति का उपयोग करने में मदद करेगा।