कृत्रिम बुद्धिमत्ता

जर्मन ऑटो-अनुवाद मॉडल का उच्च कार्बन फुटप्रिंट

Published September 29, 2021

Updated April 28, 2026

Martin Anderson

मशीन लर्निंग अनुवाद मॉडल द्वारा निर्मित कार्बन फुटप्रिंट पर नए शोध से पता चलता है कि जर्मन शायद प्रशिक्षण के लिए सबसे कार्बन-गहन लोकप्रिय भाषा हो सकती है, हालांकि यह पूरी तरह से स्पष्ट नहीं है कि क्यों। नई रिपोर्ट का उद्देश्य अधिक कार्बन-कुशल एआई प्रशिक्षण विधियों के अनुसंधान में अतिरिक्त मार्ग खोलना है, मशीन लर्निंग सिस्टम द्वारा बिजली की खपत की सीमा के बारे में बढ़ती जागरूकता के संदर्भ में।

प्रीप्रिंट पेपर का शीर्षक कर्ब योर कार्बन एमिशन: बेंचमार्किंग कार्बन एमिशन इन मशीन ट्रांसलेशन है, और यह भारत के मैनिपाल इंस्टीट्यूट ऑफ टेक्नोलॉजी के शोधकर्ताओं से है।

लेखकों ने विभिन्न संभावित अंतर-भाषा अनुवाद मॉडल के लिए प्रशिक्षण समय और कार्बन उत्सर्जन मूल्यों की गणना की, और पाया कि ‘एक उल्लेखनीय विसंगति’ तीन सबसे कार्बन-गहन भाषा जोड़ियों और तीन सबसे कार्बन-आर्थिक मॉडल के बीच समय लिया गया था।

10 प्रशिक्षण युगों में जारी कार्बन उत्सर्जन का औसत। बाएं, ConvSeq (नीचे देखें) का उपयोग करके परिणाम, दाएं, Transformers। स्रोत: https://arxiv.org/pdf/2109.12584.pdf

10 प्रशिक्षण युगों में जारी कार्बन उत्सर्जन का औसत। बाएं, ConvSeq का उपयोग करके परिणाम, दाएं, Transformers। स्रोत: https://arxiv.org/pdf/2109.12584.pdf

इस पत्र में पाया गया कि प्रशिक्षण के लिए सबसे ‘पारिस्थितिक’ भाषा जोड़ियां अंग्रेजी>फ्रेंच, फ्रेंच>अंग्रेजी और, विरोधाभासी, जर्मन से अंग्रेजी हैं, जबकि जर्मन उच्चतम उपभोक्ता जोड़ियों में से सभी में शामिल है: फ्रेंच>जर्मन, अंग्रेजी>जर्मन और जर्मन>फ्रेंच।

यौगिक ब्याज

निष्कर्षों से पता चलता है कि शब्दावली विविधता ‘प्रदर्शन के एक पर्याप्त स्तर तक पहुंचने के लिए प्रशिक्षण समय के सीधे अनुपात में है’, और यह नोट करते हैं कि जर्मन भाषा में तीन परीक्षण की गई भाषाओं में से सबसे उच्च शब्दावली विविधता स्कोर है, जैसा कि इसके प्रकार-टोकन अनुपात (टीटीआर) द्वारा अनुमानित है – एक शब्दावली के आकार के आधार पर पाठ की लंबाई का एक माप।

जर्मन को अनुवाद मॉडल में संसाधित करने की बढ़ी हुई मांगें प्रयोग के लिए उपयोग किए गए स्रोत डेटा में परिलक्षित नहीं होती हैं। वास्तव में, स्रोत डेटा से उत्पन्न जर्मन भाषा टोकन की संख्या (299445) अंग्रेजी (320108) की तुलना में कम है, और फ्रेंच (335917) की तुलना में बहुत कम है।

प्राकृतिक भाषा प्रसंस्करण (एनएलपी) के दृष्टिकोण से, जर्मन यौगिक शब्दों को उनके घटक शब्दों में विभाजित करना एक चुनौती है। एनएलपी प्रणाली अक्सर यह कार्य करती हैं बिना किसी पूर्व-‘विभाजित’ आसपास के व्याकरण या संदर्भ संकेतों के, जो कम टीटीआर स्कोर वाली भाषाओं जैसे अंग्रेजी में पाए जा सकते हैं। इस प्रक्रिया को यौगिक विभाजन या विघटन कहा जाता है।

जर्मन भाषा में दुनिया के कुछ सबसे लंबे व्यक्तिगत शब्द हैं, हालांकि 2013 में इसने अपने 65-अक्षर पूर्व रिकॉर्ड धारक की आधिकारिक मान्यता खो दी, जो इस लेख में अपनी लाइन की आवश्यकता है:

रिंडफ्लेशेटिकेटियरंग्सुएबरवाचुंग्सौफगाबेनुएबरट्रागुंग्सगेसेट्ज

शब्द गाय के मांस लेबल निगरानी कानून को संदर्भित करता है, लेकिन उस वर्ष यूरोपीय नियमों में परिवर्तन के कारण इसका अस्तित्व समाप्त हो गया, जिसने दानूब नौकायन कंपनी के कप्तान की विधवा (49 अक्षर) जैसे अन्य लोकप्रिय स्टैलवार्ट्स के लिए स्थान छोड़ दिया:

डोनाडम्पफ्सचिफ्फाह्र्ट्सगेसेलशाफ्ट्सकैपिटेन्सविटवे

सामान्य तौर पर, जर्मन की वाक्य रचना कई पश्चिमी भाषाओं में एनएलपी प्रथाओं के आधार पर शब्द-क्रम धारणाओं से विचलन की आवश्यकता होती है, जिसमें लोकप्रिय (बर्लिन स्थित) स्पेसी एनएलपी फ्रेमवर्क ने 2016 में अपनी मूल भाषा मॉडल को अपनाया था।

एक अंग्रेजी और जर्मन वाक्य में परियोजना मappings जर्मन भाषा में शब्दावली तत्वों के बीच जटिल अंतर्संबंधों को प्रदर्शित करते हैं। स्रोत: https://explosion.ai/blog/german-model

डेटा और परीक्षण

स्रोत डेटा के लिए, शोधकर्ताओं ने मल्टी30के डेटासेट का उपयोग किया, जिसमें फ्रेंच, जर्मन और अंग्रेजी भाषाओं में 30,000 नमूने हैं।

शोधकर्ताओं द्वारा उपयोग किए गए दो मॉडलों में से पहला फेसबुक एआई का 2017 कॉन्वोल्यूशनल सीक्वेंस टू सीक्वेंस (कॉन्वसेक) था, एक न्यूरल नेटवर्क जिसमें कॉन्वोल्यूशनल लेयर्स होती हैं लेकिन रिकरेंट यूनिट्स की कमी होती है, और इसके बजाय फिल्टर का उपयोग टेक्स्ट से विशेषताओं को प्राप्त करने के लिए किया जाता है। यह सभी ऑपरेशन को एक गणनात्मक रूप से कुशल समानांतर तरीके से करने की अनुमति देता है।

दूसरा दृष्टिकोण गूगल के प्रभावशाली ट्रांसफॉर्मर आर्किटेक्चर का उपयोग करता है, जो 2017 में भी है। ट्रांसफॉर्मर रूपांतरण में रेखीय परतें, ध्यान तंत्र और सामान्यीकरण दिनचर्या शामिल हैं। स्वीकार किया जाता है कि मूल रिलीज़ मॉडल कार्बन अकुशलता के लिए आलोचना के अधीन आया है, जिसमें बाद के सुधारों के विवाद हैं।

प्रयोग गूगल कोलाब पर किए गए थे, एक टेस्ला के80 जीपीयू पर समान रूप से। भाषाओं की तुलना ब्लू (बाइलिंगुअल इवैल्यूएशन अंडरस्टडी) स्कोर मेट्रिक और कोडकार्बन मशीन लर्निंग एमिशन कैलकुलेटर का उपयोग करके की गई थी। डेटा को 10 युगों में प्रशिक्षित किया गया था।

निष्कर्ष

शोधकर्ताओं ने पाया कि यह जर्मन से संबंधित भाषा जोड़ियों के लिए प्रशिक्षण का विस्तारित समय था जो उच्च कार्बन उपभोग में संतुलन को बदल देता था। हालांकि कुछ अन्य भाषा जोड़ियों, जैसे कि अंग्रेजी>फ्रेंच और फ्रेंच>अंग्रेजी में भी उच्च कार्बन उपभोग था, वे अधिक तेजी से प्रशिक्षित हुए और अधिक आसानी से हल हो गए, जिसमें शोधकर्ताओं ने उपभोग के इन उछालों को ‘अप्रासंगिक’ के रूप में वर्णित किया था। जर्मन को शामिल करने वाली भाषा जोड़ियों द्वारा उपभोग की तुलना में।

एनकोडर/डिकोडर कार्बन उत्सर्जन द्वारा भाषा जोड़ियों का विश्लेषण।

शोधकर्ता निष्कर्ष निकालते हैं:

‘हमारे निष्कर्ष यह स्पष्ट संकेत देते हैं कि कुछ भाषा जोड़ियां दूसरों की तुलना में अधिक कार्बन-गहन हैं, एक प्रवृत्ति जो विभिन्न वास्तुकला में भी बनी रहती है।’

वे जारी रखते हैं:

‘हालांकि, यह अभी भी अनुत्तरित प्रश्न हैं कि क्यों एक विशेष भाषा जोड़ी के लिए मॉडल को प्रशिक्षित करने में इतना अंतर है, और क्या विभिन्न वास्तुकला इन कार्बन-गहन भाषा जोड़ियों के लिए अधिक उपयुक्त हो सकती है, और यदि यह सच है तो क्यों।’

पत्र पर जोर देता है कि प्रशिक्षण मॉडल के माध्यम से कार्बन उपभोग में विसंगति के कारण पूरी तरह से स्पष्ट नहीं हैं। वे गैर-लैटिन आधारित भाषाओं के साथ इस शोध को विकसित करने की उम्मीद करते हैं।

1.20pm GMT+2 – पाठ त्रुटि सुधारित।

Martin Anderson

मशीन लर्निंग पर लेखक, मानव इमेज सिंथेसिस में डोमेन विशेषज्ञ। मेटाफिजिक.एआई में अनुसंधान सामग्री के पूर्व प्रमुख।
व्यक्तिगत साइट: martinanderson.ai
संपर्क: [email protected]
ट्विटर: @manders_ai

Unite.AI

जर्मन ऑटो-अनुवाद मॉडल का उच्च कार्बन फुटप्रिंट

यौगिक ब्याज

डेटा और परीक्षण

निष्कर्ष

You may like