Connect with us

рдЬреЗрдирд░реЗрдЯрд┐рд╡ рдПрдЖрдИ рдХрд╛ рднрд╡рд┐рд╖реНрдп рдПрдЬ рд╣реИ

рд╡рд┐рдЪрд╛рд░ рдиреЗрддрд╛

рдЬреЗрдирд░реЗрдЯрд┐рд╡ рдПрдЖрдИ рдХрд╛ рднрд╡рд┐рд╖реНрдп рдПрдЬ рд╣реИ

mm

चैटजीपीटी और सामान्य रूप से जेनरेटिव एआई का आगमन, प्रौद्योगिकी के इतिहास में एक महत्वपूर्ण क्षण है, जो इंटरनेट और स्मार्टफोन के उदय के समान है। जेनरेटिव एआई ने बुद्धिमान बातचीत करने, परीक्षा पास करने, जटिल कार्यक्रम/कोड बनाने और आकर्षक छवियों और वीडियो बनाने में अपनी क्षमता का प्रदर्शन किया है। जबकि ज्यादातर जेन एआई मॉडल क्लाउड में जीपीयू पर चलते हैं – प्रशिक्षण और अनुमान दोनों के लिए – यह एक दीर्घकालिक रूप से स्केलेबल समाधान नहीं है, विशेष रूप से अनुमान के लिए, लागत, शक्ति, विलंबता, गोपनीयता और सुरक्षा जैसे कारकों के कारण। यह लेख इन सभी कारकों को संबोधित करता है, साथ ही जेन एआई कंप्यूटे वर्कलोड्स को एज पर ले जाने के लिए प्रेरक उदाहरण प्रदान करता है।

अधिकांश अनुप्रयोग उच्च-प्रदर्शन प्रोसेसर पर चलते हैं – या तो डिवाइस पर (जैसे स्मार्टफोन, डेस्कटॉप, लैपटॉप) या डेटा सेंटर में। जैसे ही एआई का उपयोग करने वाले अनुप्रयोगों का हिस्सा बढ़ता है, केवल सीपीयू वाले ये प्रोसेसर अपर्याप्त हो जाते हैं। इसके अलावा, जेनरेटिव एआई वर्कलोड्स में तेजी से विस्तार एआई-सक्षम सर्वरों की मांग को बढ़ावा दे रहा है, जो महंगे और शक्ति-भूखे जीपीयू के साथ हैं, जो बदले में बुनियादी ढांचे की लागत को बढ़ा रहे हैं। ये एआई-सक्षम सर्वर एक नियमित सर्वर की कीमत से 7 गुना अधिक हो सकते हैं और जीपीयू इस अतिरिक्त लागत के 80% के लिए जिम्मेदार हैं।

इसके अलावा, एक क्लाउड-आधारित सर्वर 500W से 2000W की खपत करता है, जबकि एक एआई-सक्षम सर्वर 2000W से 8000W के बीच खपत करता है – 4 गुना अधिक! इन सर्वरों को समर्थन देने के लिए, डेटा सेंटरों को अतिरिक्त शीतलन मॉड्यूल और बुनियादी ढांचे के उन्नयन की आवश्यकता होती है – जो कि कंप्यूट इन्वेस्टमेंट से भी अधिक हो सकते हैं। डेटा सेंटर पहले से ही प्रति वर्ष 300 टीडब्ल्यूएच की खपत करते हैं, विश्वभर की कुल शक्ति की खपत का लगभग 1% यदि एआई अपनाने के रुझान जारी रहते हैं, तो 2030 तक डेटा सेंटर द्वारा विश्वभर की शक्ति की खपत का 5% तक उपयोग किया जा सकता है। इसके अलावा, जेनरेटिव एआई डेटा सेंटर में एक अभूतपूर्व निवेश किया जा रहा है। अनुमान है कि डेटा सेंटर 2027 तक पूंजी व्यय के लिए $500 बिलियन की खपत करेंगे, मुख्य रूप से एआई बुनियादी ढांचे की आवश्यकताओं से प्रेरित होकर।

डेटा सेंटरों की बिजली की खपत, जो पहले से ही 300 टीडब्ल्यूएच है, जेनरेटिव एआई के अपनाने के साथ काफी बढ़ जाएगी।

एआई कंप्यूट लागत के साथ-साथ ऊर्जा की खपत जेनरेटिव एआई के बड़े पैमाने पर अपनाने को बाधित करेगी। स्केलिंग चुनौतियों को एआई कंप्यूट को एज पर ले जाकर और एआई वर्कलोड्स के लिए अनुकूलित प्रोसेसिंग समाधान का उपयोग करके पार किया जा सकता है। इस दृष्टिकोण से, ग्राहक को लेटेंसी, गोपनीयता, विश्वसनीयता के साथ-साथ बढ़ी हुई क्षमता जैसे अन्य लाभ भी मिलते हैं।

कंप्यूट डेटा का अनुसरण एज पर करता है

एक दशक पहले से, जब एआई अकादमिक दुनिया से उभरा, एआई मॉडल का प्रशिक्षण और अनुमान क्लाउड/डेटा सेंटर में हुआ। डेटा का अधिकांश हिस्सा एज पर उत्पन्न और उपभोग किया जा रहा है – विशेष रूप से वीडियो – इसलिए यह डेटा के अनुमान को एज पर ले जाने के लिए समझ में आया, जिससे उद्यमों के लिए कुल स्वामित्व लागत (टीसीओ) में कमी आई, जो नेटवर्क और कंप्यूट लागत में कमी के कारण थी। जबकि क्लाउड पर एआई अनुमान लागत आवर्ती है, एज पर अनुमान लागत एकमुश्त, हार्डवेयर व्यय है। मूल रूप से, सिस्टम को एक एज एआई प्रोसेसर के साथ बढ़ाने से परिचालन लागत में कमी आती है। जैसे कि पारंपरिक एआई वर्कलोड्स को एज पर स्थानांतरित करना (जैसे कि उपकरण, डिवाइस), जेनरेटिव एआई वर्कलोड्स भी इसका पालन करेंगे। यह उद्यमों और उपभोक्ताओं के लिए महत्वपूर्ण बचत लाएगा।

एज पर जाने के साथ-साथ अनुमान कार्यों को करने के लिए एक कुशल एआई एक्सेलरेटर का उपयोग करने से अन्य लाभ भी मिलते हैं। सबसे पहले, लेटेंसी है। उदाहरण के लिए, गेमिंग अनुप्रयोगों में, गैर-खिलाड़ी पात्र (एनपीसी) को जेनरेटिव एआई का उपयोग करके नियंत्रित और बढ़ाया जा सकता है। एक गेमिंग कंसोल या पीसी में एलएलएम मॉडल चलाने वाले एज एआई एक्सेलरेटर का उपयोग करके, गेमर इन पात्रों को विशिष्ट लक्ष्य दे सकते हैं, ताकि वे कहानी में अर्थपूर्ण रूप से भाग ले सकें। स्थानीय एज अनुमान से कम लेटेंसी खिलाड़ियों के आदेशों और क्रियाओं के प्रति एनपीसी की बातचीत और गतिविधियों को वास्तविक समय में प्रतिक्रिया देने की अनुमति देगी। यह एक लागत प्रभावी और शक्ति-कुशल तरीके से एक अत्यधिक इमर्सिव गेमिंग अनुभव प्रदान करेगा।

स्वास्थ्य देखभाल जैसे अनुप्रयोगों में, गोपनीयता और विश्वसनीयता अत्यंत महत्वपूर्ण हैं (जैसे कि रोगी मूल्यांकन, दवा सिफारिशें)। डेटा और संबंधित जेन एआई मॉडल को गोपनीयता (गोपनीयता) की रक्षा के लिए और किसी भी नेटवर्क आउटेज को रोकने के लिए ऑन-प्रिमाइसेस होना चाहिए जो क्लाउड में एआई मॉडल तक पहुंच को बाधित कर सकता है। एक एज एआई उपकरण जो एक जेन एआई मॉडल चला रहा है जो प्रत्येक उद्यम ग्राहक – इस मामले में एक स्वास्थ्य सेवा प्रदाता के लिए Purpose-निर्मित – गोपनीयता और विश्वसनीयता के मुद्दों को हल करने में सक्षम होगा, साथ ही साथ कम लेटेंसी और लागत प्रदान करेगा।

एज डिवाइस पर जेनरेटिव एआई गेमिंग में कम लेटेंसी सुनिश्चित करेगा और स्वास्थ्य देखभाल के लिए रोगी डेटा की रक्षा करेगा और विश्वसनीयता में सुधार करेगा।

क्लाउड पर चलने वाले कई जेन एआई मॉडल लगभग एक ट्रिलियन पैरामीटर हो सकते हैं – ये मॉडल सामान्य उद्देश्य प्रश्नों को प्रभावी ढंग से संबोधित कर सकते हैं। हालांकि, उद्यम-विशिष्ट अनुप्रयोगों के लिए, मॉडल को उपयोग के मामले के लिए प्रासंगिक परिणाम प्रदान करने होंगे। एक फास्ट फूड रेस्तरां में ऑर्डर लेने के लिए बनाए गए जेन एआई आधारित सहायक का उदाहरण लें – इस प्रणाली के लिए एक सहज ग्राहक इंटरैक्शन होने के लिए, अंतर्निहित जेन एआई मॉडल को रेस्तरां के मेनू आइटम, एलर्जी और सामग्री को जानने के लिए प्रशिक्षित किया जाना चाहिए। मॉडल के आकार को एक सुपरसेट लार्ज लैंग्वेज मॉडल (एलएलएम) का उपयोग करके अनुकूलित किया जा सकता है एक छोटा सा 10-30 बिलियन पैरामीटर एलएलएम प्रशिक्षित करने के लिए और फिर ग्राहक-विशिष्ट डेटा के साथ अतिरिक्त फाइन-ट्यूनिंग का उपयोग करने के लिए। ऐसा मॉडल बढ़ी हुई सटीकता और क्षमता के साथ परिणाम प्रदान कर सकता है। और मॉडल के छोटे आकार के कारण, इसे प्रभावी ढंग से एज पर एक एआई एक्सेलरेटर पर तैनात किया जा सकता है।

जेन एआई एज पर जीतेगा

क्लाउड पर चलने वाले जेन एआई की हमेशा आवश्यकता होगी, विशेष रूप से सामान्य-उद्देश्य अनुप्रयोगों जैसे कि चैटजीपीटी और क्लाउड के लिए। लेकिन जब यह उद्यम-विशिष्ट अनुप्रयोगों की बात आती है, जैसे कि एडोब फोटोशॉप के जेनरेटिव फिल या गिटहब कोपायलट, जेनरेटिव एआई एज पर न केवल भविष्य है, बल्कि यह वर्तमान भी है। Purpose-निर्मित एआई एक्सेलरेटर इसे संभव बनाने की कुंजी हैं।

рд╕рд┐рд▓рд┐рдХреЙрди рд╡реИрд▓реА рдХреЗ рдПрдХ рдЕрдиреБрднрд╡реА рдФрд░ рдХрд┐рдирд╛рд░рд╛ рдЗрдВрдХ рдХреЗ рд╕реАрдИрдУ рдХреЗ рд░реВрдк рдореЗрдВ, рд░рд╡рд┐ рдЕрдиреНрдирд╛рд╡рдЬреНрдЬрд╛рд▓рд╛ рд╡реНрдпрд╡рд╕рд╛рдп рд╡рд┐рдХрд╛рд╕, рд╡рд┐рдкрдгрди рдФрд░ рдЗрдВрдЬреАрдирд┐рдпрд░рд┐рдВрдЧ рдореЗрдВ 20 рд╡рд░реНрд╖ рд╕реЗ рдЕрдзрд┐рдХ рдХрд╛ рдЕрдиреБрднрд╡ рд▓рд╛рддреЗ рд╣реИрдВ, рдЬреЛ рдЕрдЧреНрд░рдгреА рдкреНрд░реМрджреНрдпреЛрдЧрд┐рдХреА рдЙрддреНрдкрд╛рджреЛрдВ рдХрд╛ рдирд┐рд░реНрдорд╛рдг рдХрд░рддреЗ рд╣реИрдВ рдФрд░ рдЙрдиреНрд╣реЗрдВ рдмрд╛рдЬрд╛рд░ рдореЗрдВ рд▓рд╛рддреЗ рд╣реИрдВред рдЕрдкрдиреА рд╡рд░реНрддрдорд╛рди рднреВрдорд┐рдХрд╛ рдореЗрдВ рдбреАрдк рд╡рд┐рдЬрди рдХреЗ рдореБрдЦреНрдп рдХрд╛рд░реНрдпрдХрд╛рд░реА рдЕрдзрд┐рдХрд╛рд░реА рдХреЗ рд░реВрдк рдореЗрдВ, рд░рд╡рд┐ рдЗрд╕рдХреЗ рдмреЛрд░реНрдб рдСрдл рдбрд╛рдпрд░реЗрдХреНрдЯрд░реНрд╕ рдореЗрдВ рдХрд╛рд░реНрдп рдХрд░рддреЗ рд╣реИрдВ рдФрд░ 50 рдорд┐рд▓рд┐рдпрди рдбреЙрд▓рд░ рдЬреБрдЯрд╛рддреЗ рд╣реИрдВ, рдЬрд┐рд╕рд╕реЗ рдХрдВрдкрдиреА рдХреЗ рдЖрд░рд╛-1 рдкреНрд░реЛрд╕реЗрд╕рд░ рдХреЛ рдкреВрд░реА рддрд░рд╣ рд╕реЗ рдЙрддреНрдкрд╛рджрди рдореЗрдВ рд▓рд╛рдпрд╛ рдЬрд╛ рд╕рдХреЗ рдФрд░ рджреВрд╕рд░реА рдкреАрдврд╝реА рдХреЗ рдкреНрд░реЛрд╕реЗрд╕рд░, рдЖрд░рд╛-2 рдХреЛ рдмрдбрд╝реЗ рдкреИрдорд╛рдиреЗ рдкрд░ рдЙрддреНрдкрд╛рджрд┐рдд рдХрд┐рдпрд╛ рдЬрд╛ рд╕рдХреЗред рдбреАрдк рд╡рд┐рдЬрди рдореЗрдВ рд╢рд╛рдорд┐рд▓ рд╣реЛрдиреЗ рд╕реЗ рдкрд╣рд▓реЗ, рд░рд╡рд┐ рдиреЗ рдЗрдВрдЯреЗрд▓ рдФрд░ рд╕реИрдирдбрд┐рд╕реНрдХ рдореЗрдВ рдХрд╛рд░реНрдпрдХрд╛рд░реА рдиреЗрддреГрддреНрд╡ рдХреА рднреВрдорд┐рдХрд╛ рдирд┐рднрд╛рдИ, рдЬрд╣рд╛рдВ рдЙрдиреНрд╣реЛрдВрдиреЗ рд░рд╛рдЬрд╕реНрд╡ рд╡реГрджреНрдзрд┐ рдХреЛ рдмрдврд╝рд╛рд╡рд╛ рджреЗрдиреЗ, рд░рдгрдиреАрддрд┐рдХ рд╕рд╛рдЭреЗрджрд╛рд░рд┐рдпреЛрдВ рдХреЛ рд╡рд┐рдХрд╕рд┐рдд рдХрд░рдиреЗ рдФрд░ рдЙрддреНрдкрд╛рдж рд░реЛрдбрдореИрдк рд╡рд┐рдХрд╕рд┐рдд рдХрд░рдиреЗ рдореЗрдВ рдорд╣рддреНрд╡рдкреВрд░реНрдг рднреВрдорд┐рдХрд╛ рдирд┐рднрд╛рдИ, рдЬреЛ рдЙрджреНрдпреЛрдЧ рдХреЛ рдЖрдЧреЗ рдмрдврд╝рд╛рдиреЗ рд╡рд╛рд▓реА рд╡рд┐рд╢реЗрд╖рддрд╛рдУрдВ рдФрд░ рдХреНрд╖рдорддрд╛рдУрдВ рдХреЗ рд╕рд╛рде рдЕрдЧреНрд░рдгреА рдереАрдВред