рдХреГрддреНрд░рд┐рдо рдмреБрджреНрдзрд┐рдорддреНрддрд╛
рдорд╛рдЗрдХреНрд░реЛрд╕реЙрдлреНрдЯ рдХреЗ рдСрд░реНрдХрд╛-2 рдПрдЖрдИ рдореЙрдбрд▓ рдХрд╛ рд╕реНрдерд╛рдпреА рдПрдЖрдИ рдореЗрдВ рдорд╣рддреНрд╡рдкреВрд░реНрдг рдХрджрдо рдХреНрдпреЛрдВ рд╣реИ?

पिछले दशक में कृत्रिम बुद्धिमत्ता द्वारा की गई उल्लेखनीय प्रगति के बावजूद, जिसमें रणनीतिक खेलों जैसे चेस और जीओ में मानव चैंपियनों को हराना और प्रोटीन की 3डी संरचना की भविष्यवाणी शामिल है, बड़े भाषा मॉडल (एलएलएम) का व्यापक अपनाना एक परिवर्तन का संकेत देता है। ये मॉडल, जो मानव-कंप्यूटर इंटरैक्शन को बदलने के लिए तैयार हैं, शिक्षा, ग्राहक सेवा, जानकारी पुनर्प्राप्ति, सॉफ्टवेयर विकास, मीडिया और स्वास्थ्य सेवा सहित विभिन्न क्षेत्रों में अपरिहार्य हो गए हैं। जबकि ये तकनीकी प्रगति वैज्ञानिक सफलता और औद्योगिक विकास को अनलॉक करती है, एक उल्लेखनीय नकारात्मक पहलू ग्रह के लिए मौजूद है।
एलएलएम को प्रशिक्षित करने और उपयोग करने की प्रक्रिया में एक बड़ी मात्रा में ऊर्जा की खपत होती है, जिसके परिणामस्वरूप एक महत्वपूर्ण पर्यावरणीय प्रभाव होता है, जो बढ़े हुए कार्बन फुटप्रिंट और ग्रीनहाउस गैस उत्सर्जन से चिह्नित होता है। मैसाचुसेट्स अम्हर्स्ट विश्वविद्यालय के सूचना और कंप्यूटर विज्ञान कॉलेज में एक हालिया अध्ययन से पता चलता है कि एलएलएम को प्रशिक्षित करने से 626,000 पाउंड कार्बन डाइऑक्साइड का उत्सर्जन हो सकता है, जो लगभग पांच कारों के जीवनकाल के उत्सर्जन के बराबर है। एआई स्टार्टअप हगिंग फेस ने पाया कि इस साल की शुरुआत में लॉन्च किए गए बड़े भाषा मॉडल ब्लूम के प्रशिक्षण से 25 मेट्रिक टन कार्बन डाइऑक्साइड उत्सर्जन हुआ। इसी तरह, फेसबुक के एआई मॉडल मीना का कार्बन फुटप्रिंट प्रशिक्षण प्रक्रिया के दौरान 240,000 मील से अधिक की दूरी तय करने वाली कार के पर्यावरणीय प्रभाव के बराबर है।
एलएलएम को प्रशिक्षित करने के बावजूद, एलएलएम के लिए महत्वपूर्ण क्लाउड कंप्यूटिंग की मांग अब विमानन उद्योग की तुलना में अधिक उत्सर्जन का योगदान करती है। एक डेटा सेंटर 50,000 घरों के बराबर बिजली की खपत कर सकता है। एक अन्य अध्ययन से पता चलता है कि एक बड़े भाषा मॉडल को प्रशिक्षित करने से पांच कारों के बराबर ऊर्जा का उपयोग करके पूरे जीवनकाल में सीओ२ का उत्सर्जन हो सकता है। अनुमानों से पता चलता है कि एआई उत्सर्जन 2025 तक 300% बढ़ जाएगा, जो एआई प्रगति को पर्यावरणीय जिम्मेदारी के साथ संतुलित करने की तत्काल्यकता पर जोर देता है और एआई को अधिक पर्यावरण अनुकूल बनाने के लिए पहल को प्रोत्साहित करता है। एआई प्रगति के प्रतिकूल पर्यावरणीय प्रभाव को संबोधित करने के लिए, स्थायी एआई एक महत्वपूर्ण अध्ययन क्षेत्र के रूप में उभर रहा है।
स्थायी एआई
स्थायी एआई कृत्रिम बुद्धिमत्ता प्रणालियों के विकास और तैनाती में एक परिवर्तन का प्रतिनिधित्व करता है, जो पर्यावरणीय प्रभाव, नैतिक विचारों और दीर्घकालिक सामाजिक लाभों को कम करने पर केंद्रित है। इस दृष्टिकोण का उद्देश्य ऊर्जा-कुशल, पर्यावरण अनुकूल और मानव मूल्यों के साथ संरेखित बुद्धिमान प्रणालियों का निर्माण करना है। स्थायी एआई कंप्यूटरों के लिए स्वच्छ ऊर्जा का उपयोग, कम शक्ति का उपयोग करने वाले स्मार्ट एल्गोरिदम और निष्पक्ष और पारदर्शी निर्णय सुनिश्चित करने के लिए नैतिक दिशानिर्देशों का पालन करने पर केंद्रित है। यह ध्यान रखना महत्वपूर्ण है कि एआई के लिए स्थायित्व और स्थायी एआई के बीच एक अंतर है; पूर्व में मौजूदा प्रक्रियाओं को अनुकूलित करने के लिए एआई का उपयोग शामिल हो सकता है, जिसमें आवश्यक रूप से इसके पर्यावरणीय या सामाजिक परिणामों पर विचार नहीं किया जाता है, जबकि बाद में एआई विकास के हर चरण में स्थायित्व के सिद्धांतों को एकीकृत करता है, डिज़ाइन से लेकर तैनाती तक, ग्रह और समाज पर एक सकारात्मक और स्थायी प्रभाव पैदा करने के लिए।
एलएलएम से एसएलएम तक
स्थायी एआई की खोज में, माइक्रोसॉफ्ट एलएलएम की क्षमताओं के साथ संरेखित करने के लिए स्मॉल लैंग्वेज मॉडल (एसएलएम) विकसित करने पर काम कर रहा है। इस प्रयास में, उन्होंने हाल ही में ऑर्का-2 पेश किया है, जो जीपीटी-4 की तरह तर्क करने के लिए डिज़ाइन किया गया है। अपने पूर्ववर्ती ऑर्का-1 के विपरीत, जिसमें 13 बिलियन पैरामीटर हैं, ऑर्का-2 में 7 बिलियन पैरामीटर हैं और दो प्रमुख तकनीकों का उपयोग करता है।
- निर्देश ट्यूनिंग: ऑर्का-2 नमूनों से सीखकर, अपनी सामग्री की गुणवत्ता, शून्य-शॉट क्षमताओं और तर्क कौशल में सुधार करता है।
- व्याख्या ट्यूनिंग: निर्देश ट्यूनिंग में सीमाओं को पहचानते हुए, ऑर्का-2 व्याख्या ट्यूनिंग पेश करता है। इसमें शिक्षक मॉडल के लिए विस्तृत व्याख्याएं तैयार करना, तर्क संकेतों को समृद्ध करना और समग्र समझ में सुधार करना शामिल है।
ऑर्का-2 इन तकनीकों का उपयोग करके एलएलएम द्वारा प्राप्त किए जाने वाले उच्च कुशल तर्क को प्राप्त करने के लिए करता है, जिसमें बहुत अधिक पैरामीटर होते हैं। मुख्य विचार मॉडल को यह तय करने में सक्षम बनाना है कि किसी समस्या का समाधान करने का सबसे अच्छा तरीका क्या है, चाहे वह त्वरित उत्तर देना हो या चरणबद्ध तरीके से सोचना हो। माइक्रोसॉफ्ट इसे “सावधान तर्क” कहता है।
ऑर्का-2 को प्रशिक्षित करने के लिए, माइक्रोसॉफ्ट एफएलएएन एनोटेशन, ऑर्का-1 और ऑर्का-2 डेटासेट का उपयोग करके एक नया प्रशिक्षण डेटासेट बनाता है। वे आसान प्रश्नों से शुरू करते हैं, कुछ मुश्किल प्रश्न जोड़ते हैं, और फिर मॉडल को और भी चतुर बनाने के लिए बात करने वाले मॉडल से डेटा का उपयोग करते हैं।
ऑर्का-2 का तर्क, पाठ पूर्ति, आधार, सच्चाई और सुरक्षा सहित व्यापक मूल्यांकन किया जाता है। परिणाम सिंथेटिक डेटा पर विशेष प्रशिक्षण के माध्यम से एसएलएम तर्क में सुधार की संभावना को दर्शाते हैं। कुछ सीमाओं के बावजूद, ऑर्का-2 मॉडल तर्क, नियंत्रण और सुरक्षा में भविष्य के सुधार के लिए आशा को दर्शाते हैं, मॉडल को प्रशिक्षित करने के बाद सामरिक रूप से सिंथेटिक डेटा का उपयोग करने की प्रभावशीलता को साबित करते हैं।
ऑर्का-2 का स्थायी एआई की ओर महत्व
ऑर्का-2 स्थायी एआई की दिशा में एक महत्वपूर्ण कदम का प्रतिनिधित्व करता है, जो यह व्यापक धारणा को चुनौती देता है कि केवल बड़े मॉडल, जो महत्वपूर्ण ऊर्जा की खपत करते हैं, वास्तव में एआई क्षमताओं को आगे बढ़ा सकते हैं। यह छोटा भाषा मॉडल एक वैकल्पिक दृष्टिकोण प्रस्तुत करता है, जो यह सुझाव देता है कि भाषा मॉडल में उत्कृष्टता प्राप्त करने के लिए विशाल डेटासेट और व्यापक कंप्यूटिंग शक्ति की आवश्यकता नहीं है। इसके बजाय, यह बुद्धिमान डिज़ाइन और प्रभावी एकीकरण के महत्व पर जोर देता है।
यह सफलता नए अवसरों को खोलती है, जो एआई को बढ़ाने से लेकर अधिक पर्यावरण अनुकूल और समावेशी दृष्टिकोण पर केंद्रित है। यह एक महत्वपूर्ण कदम है जो उन्नत एआई विकास को अधिक समावेशी और पर्यावरण अनुकूल बनाने की दिशा में है, जो तकनीकी प्रगति को पर्यावरणीय जिम्मेदारी के साथ संतुलित करता है।
नीचे की पंक्ति:
माइक्रोसॉफ्ट का ऑर्का-2 स्थायी एआई की दिशा में एक महत्वपूर्ण कदम का प्रतिनिधित्व करता है, जो यह व्यापक धारणा को चुनौती देता है कि केवल बड़े मॉडल ही एआई को आगे बढ़ा सकते हैं। बुद्धिमान डिज़ाइन पर आकार को प्राथमिकता देकर, ऑर्का-2 नए अवसरों को खोलता है, जो उन्नत एआई विकास के लिए एक अधिक समावेशी और पर्यावरण अनुकूल दृष्टिकोण प्रदान करता है। यह परिवर्तन एक नए युग की शुरुआत का प्रतीक है जो बुद्धिमान प्रणाली डिज़ाइन में एक नई दिशा की ओर इशारा करता है।












