рд╡рд┐рдЪрд╛рд░ рдиреЗрддрд╛
рдЬреЗрдирд░реЗрдЯрд┐рд╡ рдПрдЖрдИ рдХрд╛ рднрд╡рд┐рд╖реНрдп рдПрдЬ рд╣реИ

चैटजीपीटी और सामान्य रूप से जेनरेटिव एआई का आगमन, प्रौद्योगिकी के इतिहास में एक महत्वपूर्ण क्षण है, जो इंटरनेट और स्मार्टफोन के उदय के समान है। जेनरेटिव एआई ने बुद्धिमान बातचीत करने, परीक्षा पास करने, जटिल कार्यक्रम/कोड बनाने और आकर्षक छवियों और वीडियो बनाने में अपनी क्षमता का प्रदर्शन किया है। जबकि ज्यादातर जेन एआई मॉडल क्लाउड में जीपीयू पर चलते हैं – प्रशिक्षण और अनुमान दोनों के लिए – यह एक दीर्घकालिक रूप से स्केलेबल समाधान नहीं है, विशेष रूप से अनुमान के लिए, लागत, शक्ति, विलंबता, गोपनीयता और सुरक्षा जैसे कारकों के कारण। यह लेख इन सभी कारकों को संबोधित करता है, साथ ही जेन एआई कंप्यूटे वर्कलोड्स को एज पर ले जाने के लिए प्रेरक उदाहरण प्रदान करता है।
अधिकांश अनुप्रयोग उच्च-प्रदर्शन प्रोसेसर पर चलते हैं – या तो डिवाइस पर (जैसे स्मार्टफोन, डेस्कटॉप, लैपटॉप) या डेटा सेंटर में। जैसे ही एआई का उपयोग करने वाले अनुप्रयोगों का हिस्सा बढ़ता है, केवल सीपीयू वाले ये प्रोसेसर अपर्याप्त हो जाते हैं। इसके अलावा, जेनरेटिव एआई वर्कलोड्स में तेजी से विस्तार एआई-सक्षम सर्वरों की मांग को बढ़ावा दे रहा है, जो महंगे और शक्ति-भूखे जीपीयू के साथ हैं, जो बदले में बुनियादी ढांचे की लागत को बढ़ा रहे हैं। ये एआई-सक्षम सर्वर एक नियमित सर्वर की कीमत से 7 गुना अधिक हो सकते हैं और जीपीयू इस अतिरिक्त लागत के 80% के लिए जिम्मेदार हैं।
इसके अलावा, एक क्लाउड-आधारित सर्वर 500W से 2000W की खपत करता है, जबकि एक एआई-सक्षम सर्वर 2000W से 8000W के बीच खपत करता है – 4 गुना अधिक! इन सर्वरों को समर्थन देने के लिए, डेटा सेंटरों को अतिरिक्त शीतलन मॉड्यूल और बुनियादी ढांचे के उन्नयन की आवश्यकता होती है – जो कि कंप्यूट इन्वेस्टमेंट से भी अधिक हो सकते हैं। डेटा सेंटर पहले से ही प्रति वर्ष 300 टीडब्ल्यूएच की खपत करते हैं, विश्वभर की कुल शक्ति की खपत का लगभग 1%। यदि एआई अपनाने के रुझान जारी रहते हैं, तो 2030 तक डेटा सेंटर द्वारा विश्वभर की शक्ति की खपत का 5% तक उपयोग किया जा सकता है। इसके अलावा, जेनरेटिव एआई डेटा सेंटर में एक अभूतपूर्व निवेश किया जा रहा है। अनुमान है कि डेटा सेंटर 2027 तक पूंजी व्यय के लिए $500 बिलियन की खपत करेंगे, मुख्य रूप से एआई बुनियादी ढांचे की आवश्यकताओं से प्रेरित होकर।

डेटा सेंटरों की बिजली की खपत, जो पहले से ही 300 टीडब्ल्यूएच है, जेनरेटिव एआई के अपनाने के साथ काफी बढ़ जाएगी।
एआई कंप्यूट लागत के साथ-साथ ऊर्जा की खपत जेनरेटिव एआई के बड़े पैमाने पर अपनाने को बाधित करेगी। स्केलिंग चुनौतियों को एआई कंप्यूट को एज पर ले जाकर और एआई वर्कलोड्स के लिए अनुकूलित प्रोसेसिंग समाधान का उपयोग करके पार किया जा सकता है। इस दृष्टिकोण से, ग्राहक को लेटेंसी, गोपनीयता, विश्वसनीयता के साथ-साथ बढ़ी हुई क्षमता जैसे अन्य लाभ भी मिलते हैं।
कंप्यूट डेटा का अनुसरण एज पर करता है
एक दशक पहले से, जब एआई अकादमिक दुनिया से उभरा, एआई मॉडल का प्रशिक्षण और अनुमान क्लाउड/डेटा सेंटर में हुआ। डेटा का अधिकांश हिस्सा एज पर उत्पन्न और उपभोग किया जा रहा है – विशेष रूप से वीडियो – इसलिए यह डेटा के अनुमान को एज पर ले जाने के लिए समझ में आया, जिससे उद्यमों के लिए कुल स्वामित्व लागत (टीसीओ) में कमी आई, जो नेटवर्क और कंप्यूट लागत में कमी के कारण थी। जबकि क्लाउड पर एआई अनुमान लागत आवर्ती है, एज पर अनुमान लागत एकमुश्त, हार्डवेयर व्यय है। मूल रूप से, सिस्टम को एक एज एआई प्रोसेसर के साथ बढ़ाने से परिचालन लागत में कमी आती है। जैसे कि पारंपरिक एआई वर्कलोड्स को एज पर स्थानांतरित करना (जैसे कि उपकरण, डिवाइस), जेनरेटिव एआई वर्कलोड्स भी इसका पालन करेंगे। यह उद्यमों और उपभोक्ताओं के लिए महत्वपूर्ण बचत लाएगा।
एज पर जाने के साथ-साथ अनुमान कार्यों को करने के लिए एक कुशल एआई एक्सेलरेटर का उपयोग करने से अन्य लाभ भी मिलते हैं। सबसे पहले, लेटेंसी है। उदाहरण के लिए, गेमिंग अनुप्रयोगों में, गैर-खिलाड़ी पात्र (एनपीसी) को जेनरेटिव एआई का उपयोग करके नियंत्रित और बढ़ाया जा सकता है। एक गेमिंग कंसोल या पीसी में एलएलएम मॉडल चलाने वाले एज एआई एक्सेलरेटर का उपयोग करके, गेमर इन पात्रों को विशिष्ट लक्ष्य दे सकते हैं, ताकि वे कहानी में अर्थपूर्ण रूप से भाग ले सकें। स्थानीय एज अनुमान से कम लेटेंसी खिलाड़ियों के आदेशों और क्रियाओं के प्रति एनपीसी की बातचीत और गतिविधियों को वास्तविक समय में प्रतिक्रिया देने की अनुमति देगी। यह एक लागत प्रभावी और शक्ति-कुशल तरीके से एक अत्यधिक इमर्सिव गेमिंग अनुभव प्रदान करेगा।
स्वास्थ्य देखभाल जैसे अनुप्रयोगों में, गोपनीयता और विश्वसनीयता अत्यंत महत्वपूर्ण हैं (जैसे कि रोगी मूल्यांकन, दवा सिफारिशें)। डेटा और संबंधित जेन एआई मॉडल को गोपनीयता (गोपनीयता) की रक्षा के लिए और किसी भी नेटवर्क आउटेज को रोकने के लिए ऑन-प्रिमाइसेस होना चाहिए जो क्लाउड में एआई मॉडल तक पहुंच को बाधित कर सकता है। एक एज एआई उपकरण जो एक जेन एआई मॉडल चला रहा है जो प्रत्येक उद्यम ग्राहक – इस मामले में एक स्वास्थ्य सेवा प्रदाता के लिए Purpose-निर्मित – गोपनीयता और विश्वसनीयता के मुद्दों को हल करने में सक्षम होगा, साथ ही साथ कम लेटेंसी और लागत प्रदान करेगा।

एज डिवाइस पर जेनरेटिव एआई गेमिंग में कम लेटेंसी सुनिश्चित करेगा और स्वास्थ्य देखभाल के लिए रोगी डेटा की रक्षा करेगा और विश्वसनीयता में सुधार करेगा।
क्लाउड पर चलने वाले कई जेन एआई मॉडल लगभग एक ट्रिलियन पैरामीटर हो सकते हैं – ये मॉडल सामान्य उद्देश्य प्रश्नों को प्रभावी ढंग से संबोधित कर सकते हैं। हालांकि, उद्यम-विशिष्ट अनुप्रयोगों के लिए, मॉडल को उपयोग के मामले के लिए प्रासंगिक परिणाम प्रदान करने होंगे। एक फास्ट फूड रेस्तरां में ऑर्डर लेने के लिए बनाए गए जेन एआई आधारित सहायक का उदाहरण लें – इस प्रणाली के लिए एक सहज ग्राहक इंटरैक्शन होने के लिए, अंतर्निहित जेन एआई मॉडल को रेस्तरां के मेनू आइटम, एलर्जी और सामग्री को जानने के लिए प्रशिक्षित किया जाना चाहिए। मॉडल के आकार को एक सुपरसेट लार्ज लैंग्वेज मॉडल (एलएलएम) का उपयोग करके अनुकूलित किया जा सकता है एक छोटा सा 10-30 बिलियन पैरामीटर एलएलएम प्रशिक्षित करने के लिए और फिर ग्राहक-विशिष्ट डेटा के साथ अतिरिक्त फाइन-ट्यूनिंग का उपयोग करने के लिए। ऐसा मॉडल बढ़ी हुई सटीकता और क्षमता के साथ परिणाम प्रदान कर सकता है। और मॉडल के छोटे आकार के कारण, इसे प्रभावी ढंग से एज पर एक एआई एक्सेलरेटर पर तैनात किया जा सकता है।
जेन एआई एज पर जीतेगा
क्लाउड पर चलने वाले जेन एआई की हमेशा आवश्यकता होगी, विशेष रूप से सामान्य-उद्देश्य अनुप्रयोगों जैसे कि चैटजीपीटी और क्लाउड के लिए। लेकिन जब यह उद्यम-विशिष्ट अनुप्रयोगों की बात आती है, जैसे कि एडोब फोटोशॉप के जेनरेटिव फिल या गिटहब कोपायलट, जेनरेटिव एआई एज पर न केवल भविष्य है, बल्कि यह वर्तमान भी है। Purpose-निर्मित एआई एक्सेलरेटर इसे संभव बनाने की कुंजी हैं।












