कृत्रिम बुद्धिमत्ता

मोआरए: पीईएफटी के लिए उच्च-रैंक अद्यतन

प्रकाशित 14 जून 2024

अपडेट किया गया 15 मई 2026

Kunal Kejriwal

लोरा या लो-रैंक अनुकूलन एक पैरामीटर-कुशल फाइन-ट्यूनिंग विधि है जो बड़े भाषा मॉडल को विशिष्ट डाउनस्ट्रीम कार्यों के लिए अनुकूलित करने के लिए उपयोग की जाती है। लोरा फ्रेमवर्क दो निम्न-रैंक मैट्रिक्स का उपयोग करके अद्यतन वजन को विभाजित और अनुमानित करता है, और फिर इन मैट्रिक्स को मूल मॉडल पैरामीटर में विलय करने की अनुमति देता है। लोरा फ्रेमवर्क का मुख्य लाभ यह है कि यह फाइन-ट्यूनिंग के बाद इन मैट्रिक्स को बिना किसी अंतर के मूल मॉडल पैरामीटर में विलय करने की अनुमति देता है। हालांकि, हाल के प्रयोगों से पता चलता है कि लोरा फ्रेमवर्क कुछ कार्यों में पूर्ण फाइन-ट्यूनिंग के समान प्रदर्शन नहीं कर सकता है, जैसे कि निरंतर पूर्व-प्रशिक्षण और जटिल तर्क कार्य।

इस लेख में, हम मोआरए फ्रेमवर्क के बारे में चर्चा करेंगे, जो एक नई विधि है जो उच्च-रैंक अद्यतन को प्राप्त करने के लिए एक वर्ग मैट्रिक्स का उपयोग करती है। मोआरए फ्रेमवर्क लोरा फ्रेमवर्क के समान है, लेकिन यह एक वर्ग मैट्रिक्स का उपयोग करके उच्च-रैंक अद्यतन को प्राप्त करने की अनुमति देता है। इस लेख में, हम मोआरए फ्रेमवर्क के तर्क, वास्तुकला, और प्रयोगों के परिणामों के बारे में चर्चा करेंगे।

इस लेख का उद्देश्य मोआरए फ्रेमवर्क को गहराई से समझना है, और हम इसके तंत्र, तरीकों, वास्तुकला और राज्य-कला फ्रेमवर्क के साथ इसकी तुलना करेंगे। तो आइए शुरू करें।

मोआरए: पीईएफटी के लिए उच्च-रैंक अद्यतन

जैसा कि भाषा मॉडल का आकार और क्षमता बढ़ रही है, पीईएफटी या पैरामीटर-कुशल फाइन-ट्यूनिंग बड़े भाषा मॉडल को विशिष्ट डाउनस्ट्रीम कार्यों के लिए अनुकूलित करने के लिए एक लोकप्रिय और कुशल विधि बन गई है। पूर्ण फाइन-ट्यूनिंग की तुलना में, पीईएफटी केवल एक अंश मॉडल पैरामीटर को अद्यतन करता है, जो कुछ कार्यों में पूर्ण फाइन-ट्यूनिंग के समान प्रदर्शन प्राप्त कर सकता है। हालांकि, लोरा फ्रेमवर्क के विभिन्न संस्करणों को मूल्यांकन करने के लिए जीएलयूई का उपयोग किया जाता है, जो इसकी प्रभावशीलता को मूल्यांकन करने के लिए एक सीमित दृष्टिकोण हो सकता है।

लोरा फ्रेमवर्क के विभिन्न संस्करणों को मूल्यांकन करने के लिए जीएलयूई का उपयोग किया जाता है, जो इसकी प्रभावशीलता को मूल्यांकन करने के लिए एक सीमित दृष्टिकोण हो सकता है। लोरा फ्रेमवर्क के विभिन्न संस्करणों को मूल्यांकन करने के लिए जीएलयूई का उपयोग किया जाता है, जो इसकी प्रभावशीलता को मूल्यांकन करने के लिए एक सीमित दृष्टिकोण हो सकता है।

उपरोक्त छवि में, (ए) लोरा का प्रतिनिधित्व करता है, और (बी) मोआरए का प्रतिनिधित्व करता है। डब्ल्यू मॉडल का जमे हुए वजन है, एम मोआरए में प्रशिक्षण मैट्रिक्स है, ए और बी लोरा में प्रशिक्षण निम्न-रैंक मैट्रिक्स हैं, और आर लोरा और मोआरए में रैंक का प्रतिनिधित्व करता है। जैसा कि देखा जा सकता है, मोआरए फ्रेमवर्क लोरा आधारित मॉडल की तुलना में अधिक क्षमता प्रदर्शित करता है।

मोआरए: तरीका और वास्तुकला

निम्न-रैंक अद्यतन का प्रभाव

लोरा फ्रेमवर्क का मुख्य सिद्धांत पूर्ण फाइन-ट्यूनिंग में पूर्ण-रैंक अद्यतन को अनुमानित करने के लिए निम्न-रैंक अद्यतन का उपयोग करना है। लोरा फ्रेमवर्क दो निम्न-रैंक मैट्रिक्स का उपयोग करके वजन अद्यतन की गणना करता है। लोरा फ्रेमवर्क का प्रशिक्षण शुरू होने पर वजन अद्यतन 0 होने के लिए, लोरा फ्रेमवर्क एक निम्न-रैंक मैट्रिक्स को गॉसियन वितरण के साथ और दूसरे को 0 के साथ आरंभ करता है। लोरा फ्रेमवर्क में वजन अद्यतन पूर्ण फाइन-ट्यूनिंग में पूर्ण-रैंक अद्यतन की तुलना में निम्न-रैंक होता है, हालांकि लोरा फ्रेमवर्क में निम्न-रैंक अद्यतन कुछ कार्यों में पूर्ण-रैंक अद्यतन के समान प्रदर्शन प्रदान करता है।

तरीका

मोआरए: प्रयोग और परिणाम

मोआरए फ्रेमवर्क के प्रदर्शन को मूल्यांकन करने के लिए, इसे विभिन्न कार्यों पर मूल्यांकन किया जाता है, जिनमें यूयूआईडी जोड़े को याद रखना, फाइन-ट्यूनिंग कार्य, और पूर्व-प्रशिक्षण शामिल हैं।

यूयूआईडी जोड़े को याद रखना

मोआरए फ्रेमवर्क को यूयूआईडी जोड़े को याद रखने के लिए प्रशिक्षित किया जाता है, और इसके परिणामों की तुलना पूर्ण फाइन-ट्यूनिंग और लोरा फ्रेमवर्क से की जाती है। प्रशिक्षण हानि के परिणाम निम्नलिखित छवि में दिखाए गए हैं।

जैसा कि देखा जा सकता है, मोआरए फ्रेमवर्क लोरा फ्रेमवर्क की तुलना में बेहतर प्रदर्शन प्रदान करता है, जो उच्च-रैंक अद्यतन रणनीति का लाभ है। प्रशिक्षण सटीकता की रिपोर्ट विभिन्न प्रशिक्षण चरणों में निम्नलिखित तालिका में दिखाई गई है।

फाइन-ट्यूनिंग कार्य

मोआरए फ्रेमवर्क को फाइन-ट्यूनिंग कार्यों के लिए मूल्यांकन किया जाता है, जिनमें निर्देश ट्यूनिंग, गणितीय तर्क, और निरंतर पूर्व-प्रशिक्षण शामिल हैं। परिणाम निम्नलिखित तालिका में दिखाए गए हैं।

पूर्व-प्रशिक्षण

मोआरए फ्रेमवर्क को पूर्व-प्रशिक्षण के लिए मूल्यांकन किया जाता है, और इसके परिणामों की तुलना लोरा और रेलोरा फ्रेमवर्क से की जाती है। पूर्व-प्रशिक्षण हानि और जटिलता के परिणाम निम्नलिखित छवियों में दिखाए गए हैं।

अंतिम विचार

इस लेख में, हमने मोआरए फ्रेमवर्क के बारे में चर्चा की, जो एक नई विधि है जो उच्च-रैंक अद्यतन को प्राप्त करने के लिए एक वर्ग मैट्रिक्स का उपयोग करती है। मोआरए फ्रेमवर्क लोरा फ्रेमवर्क के समान है, लेकिन यह एक वर्ग मैट्रिक्स का उपयोग करके उच्च-रैंक अद्यतन को प्राप्त करने की अनुमति देता है।

Kunal Kejriwal

एक इंजीनियर पेशे से, एक लेखक दिल से। कुनाल एक तकनीकी लेखक हैं जिन्हें एआई और एमएल के प्रति गहरा प्यार और समझ है, जो अपने आकर्षक और जानकारीपूर्ण दस्तावेज़ के माध्यम से इन क्षेत्रों में जटिल अवधारणाओं को सरल बनाने के लिए समर्पित हैं।