рд╡рд┐рдЪрд╛рд░ рдиреЗрддрд╛
рдХрдВрдкреНрдпреВрдЯреЗрд╢рдирд▓ рдкрд╛рд╡рд░ рдХрд╛ рдкрд╡рд┐рддреНрд░ рдЧреНрд░реЗрд▓ рдПрдЖрдИ рдореЗрдВ

असाधारण प्रगति के बावजूद, कृत्रिम बुद्धिमत्ता की क्षमताएं वास्तविक दुनिया की अपेक्षाओं की तुलना में अभी भी सीमित हैं। हम जटिल मॉडल बनाते हैं, न्यूरल नेटवर्क चलाते हैं और एल्गोरिदम का परीक्षण करते हैं, फिर भी प्रगति कभी-कभी उन स्थानों पर रुक जाती है जहां हम इसे कम से कम उम्मीद करते हैं।
समस्या अक्सर एल्गोरिदम या डेटा में नहीं होती है, बल्कि कंप्यूटेशनल पावर में होती है, जो संसाधनों को मॉडल को आवश्यक स्तर पर सीखने और संचालित करने की अनुमति देती है। तो इस बाधा के पीछे क्या है? आइए उस महत्वपूर्ण संसाधन की जांच करें जिसके बिना सबसे आशाजनक एआई परियोजनाएं प्रयोगशाला से परे नहीं जा सकती हैं।
कम्प्यूटे घाटा और इसके परिणाम
इस विषय को समझने के लिए, आइए मोबाइल संचार के इतिहास से शुरू करें। जब 3G और बाद में 4G नेटवर्क दिखाई दिए, तो इंटरनेट पहले से ही लगभग वैश्विक था। और जब 5G की शुरुआत हुई, तो कई लोगों ने एक पूरी तरह से तर्कसंगत प्रश्न पूछा: “इंटरनेट तेज होगा – लेकिन इतना क्यों?”
वास्तव में, इंटरनेट की गति में वृद्धि उपयोगकर्ता सुविधा के बारे में नहीं है। यह पूरे तकनीकी परिदृश्य को बदल देता है। उपयोग के मामले जो पहले असंभव थे, वे अब संभव हो जाते हैं। 5G 4G की तुलना में बहुत तेज निकला, और यह छलांग 1G से 2G तक की तरह क्रमिक नहीं थी, बल्कि यह एक्सपोनेंशियल थी। परिणामस्वरूप, नए अनुप्रयोग, उपकरण और पूरी तरह से तकनीक के वर्ग दिखाई दे सकते हैं।
यातायात प्रकाश कैमरे, वास्तविक समय यातायात विश्लेषण प्रणाली, और स्वचालित यातायात नियमन तंत्र – यह सब नई संचार प्रौद्योगिकियों के कारण संभव हो जाता है। पुलिस को नए तरीके से डेटा का आदान-प्रदान करने के तरीके मिलते हैं, और अंतरिक्ष में, दूरबीन और उपग्रह पृथ्वी पर विशाल मात्रा में जानकारी भेज सकते हैं। एक मूलभूत प्रौद्योगिकी में एक गुणात्मक छलांग पूरे पारिस्थितिकी तंत्र के विकास को बढ़ावा देती है।
कंप्यूटेशनल पावर के साथ भी यही सिद्धांत लागू होता है। मानवता की कुल कंप्यूटिंग क्षमता को कल्पनात्मक इकाइयों में देखें। आज, हमारे पास शायद दस ऐसी इकाइयाँ होंगी। उनके साथ, हम छवियों और वीडियो का उत्पादन कर सकते हैं, पाठ लिख सकते हैं, विपणन सामग्री बना सकते हैं … यह पहले से ही काफी बड़ा है, लेकिन अनुप्रयोगों की श्रृंखला मुख्य रूप से सीमित है।
अब कल्पना करें कि हमारे पास दस नहीं, बल्कि एक हजार ऐसी इकाइयाँ हैं। अचानक, जो प्रौद्योगिकियाँ पहले बहुत महंगी थीं, वे व्यावहारिक हो जाती हैं, और जो स्टार्टअप उच्च कंप्यूटेशनल लागत के कारण छोड़ दिए गए थे, वे आर्थिक रूप से समझ में आने लगते हैं।
उदाहरण के लिए, रोबोटैक्स लें। आज, वे मुख्य रूप से वाहन में स्थापित कमजोर स्थानीय कंप्यूटरों पर निर्भर करते हैं। हालांकि, यदि वीडियो फीड को बादल में भारी कंप्यूटेशनल संसाधनों के साथ प्रसारित किया जाए, तो डेटा को वास्तविक समय में संसाधित किया जा सकता है और वापस भेजा जा सकता है। और यह महत्वपूर्ण है: 100 किमी / घंटा की रफ्तार से चलने वाली कार को कुछ सेकंड के भीतर निर्णय लेने होते हैं – सीधे जाना, मुड़ना, ब्रेक लगाना या ब्रेक नहीं लगाना।
तब एक पूरी तरह से कार्यात्मक रोबोटैक्सी उद्योग संभव हो जाता है, न कि केवल अलग-अलग समाधान जो हम आज देखते हैं। कार में स्थापित कोई स्थानीय कंप्यूटर स्वाभाविक रूप से एक जुड़े हुए सिस्टम की तुलना में सीमित होता है। जितनी तेजी से हम इसे स्केल कर सकते हैं, उतनी ही तेजी से हमारे आसपास की दुनिया बदल जाएगी।
चिप्स तक पहुंच और एआई में “गोल्डन टिकट”
कंप्यूटेशनल पावर के संदर्भ में, यह सवाल उठता है: क्या आधुनिक चिप्स तक पहुंच एआई बाजार में प्रवेश करने के लिए “गोल्डन टिकट” बन रही है? क्या बड़े खिलाड़ी जो चिप निर्माताओं के साथ अनुबंध पर हस्ताक्षर करते हैं या स्वयं उन्हें उत्पादित करते हैं, वे बड़े उद्यम कंपनियों और बाकी सभी के बीच एक अंतर पैदा कर रहे हैं?
एक ऐसा अंतर केवल एक मामले में उत्पन्न होता है: यदि एक व्यवसाय मॉडल केवल बड़े ग्राहकों को चिप्स बेचने पर केंद्रित है। व्यवहार में, NVIDIA जैसे निर्माता सभी के लिए क्लाउड समाधान प्रदान करने का लक्ष्य रखते हैं। उनके अनुकूलित चिप्स क्लाउड में OpenAI और स्वतंत्र विकासकर्ताओं दोनों के लिए उपलब्ध हैं।
यहां तक कि Google, Anthropic, Microsoft, OpenAI, Amazon, और NVIDIA जैसी कंपनियों के बीच रणनीतिक गठबंधन मुख्य रूप से साझा संसाधन उपयोगिता के लिए साझेदारी हैं, बाजार को बंद करने के प्रयास नहीं। यह मॉडल कंप्यूटेशनल शक्ति के कुशल आवंटन को सक्षम बनाता है, जिससे तकनीकी विकास तेज होता है।
यदि हम कंप्यूटेशनल संसाधन उपयोग की श्रृंखला का पता लगाते हैं, तो यह अंतिम उपयोगकर्ता से शुरू होता है। उदाहरण के लिए, जब आप वीडियो कॉल और संदेश भेजने के लिए व्हाट्सएप का उपयोग करते हैं, तो कंपनी को सेवा को काम करना सुनिश्चित करना होगा: डेटा को संग्रहीत और संसाधित करना, वीडियो क्लीनअप के लिए मॉडल चलाना, प्रभाव जोड़ना और छवि गुणवत्ता में सुधार करना।
स्वामित्व वाले सर्वर को बनाए रखना महंगा है, वे पुराने हो जाते हैं और निरंतर रखरखाव की आवश्यकता होती है। इसलिए, क्लाउड समाधान, “क्लाउड”, दिखाई दिए। बाजार तीन खिलाड़ियों द्वारा नियंत्रित किया जाता है: Google Cloud, AWS, और Microsoft Azure। अन्य कंपनियां इस स्तर पर प्रतिस्पर्धा नहीं कर सकती हैं: बुनियादी ढांचे का पैमाना बहुत बड़ा है।
क्लाउड सेवाएं बड़े डेटा केंद्र हैं जिनमें शीतलन, बिजली आपूर्ति और दिन-रात रखरखाव होता है। वे सर्वर और NVIDIA, AMD, और अन्य निर्माताओं से विशेष चिप्स का घर हैं, जो बड़े पैमाने पर कंप्यूटेशनल प्रक्रियाओं को सक्षम बनाते हैं।
यहाँ हम उस मुख्य प्रश्न पर आते हैं जिस पर मैंने अपने पिछले कॉलम में डेटा सेंटर के बारे में चर्चा की थी, और यहाँ जारी रखना चाहता हूँ: इस प्रणाली में मुख्य बोतलनेक क्या है? क्या यह बिजली की कमी है, या कठिन जलवायु वाले क्षेत्रों में डेटा सेंटर को ठंडा करने में कठिनाई है? वास्तव में, रहस्य चिप्स में ही है …
पवित्र ग्रेल
NVIDIA आज लगभग 5 ट्रिलियन डॉलर के मूल्यांकन और दुनिया की सबसे सफल सार्वजनिक कंपनियों में से एक क्यों है? कारण सरल है: NVIDIA उन चिप्स का उत्पादन करती है जिन पर एआई मॉडल प्रशिक्षित और अनुमान लगाया जाता है।
प्रत्येक चिप बड़ी मात्रा में बिजली की खपत करती है जब बड़े मॉडल को प्रशिक्षित किया जाता है या डेटा की बढ़ती मात्रा को संसाधित किया जाता है। लेकिन यह ऊर्जा कितनी कुशलता से उपयोग की जाती है? यहीं विशेष चिप्स काम आती हैं; वे विशिष्ट कार्यों को सामान्य-उद्देश्य वाले जीपीयू की तुलना में बहुत अधिक कुशलता से संभालती हैं।
एआई मॉडल अलग-अलग होते हैं। OpenAI, उदाहरण के लिए, मॉडल का एक परिवार है, Anthropic का एक और है। अवधारणाएं समान हो सकती हैं, लेकिन गणितीय संरचनाएं और कंप्यूटेशनल प्रक्रियाएं अलग हैं। एक ही सामान्य-उद्देश्य वाली चिप, जब OpenAI मॉडल (जैसे ChatGPT) को प्रशिक्षित करने के लिए उपयोग की जाती है, तो यह एक “एक-आकार-फिट-सभी” उपकरण के रूप में कार्य करती है, एक मॉडल के लिए 100,000 घंटे की गणना की खपत करती है और दूसरे के लिए 150,000। कुशलता काफी भिन्न होती है और शायद ही कभी अनुकूलित होती है।
कंपनियां इस समस्या का समाधान विशेष चिप्स का उत्पादन करके करती हैं। उदाहरण के लिए, एक चिप ChatGPT आर्किटेक्चर के लिए अनुकूलित की जा सकती है और इसे 20 मिनट में प्रशिक्षित कर सकती है, जबकि दूसरी Anthropic की आर्किटेक्चर के लिए तैयार की जा सकती है और भी 20 मिनट में प्रशिक्षण पूरा कर सकती है। ऊर्जा की खपत और प्रशिक्षण समय सामान्य-उद्देश्य वाली चिप की तुलना में कई गुना कम हो जाते हैं।
जब ये चिप्स बड़ी कंपनियों को बेचे जाते हैं, जैसे Google, Amazon, Microsoft, या Azure, तो वे स्टैंडअलोन उत्पादों के रूप में पेश किए जाते हैं। उपयोगकर्ता एक चिप चुन सकते हैं जो YOLO मॉडल के लिए अनुकूलित है या एक सरल, सस्ता चिप Xen आर्किटेक्चर के लिए। इस तरह, कंपनियां अपने कार्यों के लिए विशेष रूप से तैयार कंप्यूटेशनल संसाधनों तक पहुंच प्राप्त करती हैं, न कि सामान्य-उद्देश्य वाले जीपीयू को खरीदती हैं। यदि उपयोगकर्ता के पास दस अलग-अलग कार्य हैं, तो वे दस अलग-अलग विशेष चिप्स का उपयोग कर सकते हैं।
रुझान स्पष्ट है: विशेष चिप्स धीरे-धीरे सामान्य-उद्देश्य वाली चिप्स को बदल रही हैं। कई स्टार्टअप अब एएसआईसी (एप्लिकेशन-स्पेसिफिक इंटीग्रेटेड सर्किट) के साथ काम कर रहे हैं, जो विशिष्ट कंप्यूटेशनल कार्यों के लिए डिज़ाइन की गई चिप्स हैं। पहली एएसआईसी बिटकॉइन माइनिंग के लिए दिखाई दी: शुरू में, क्रिप्टोकरेंसी को NVIDIA जीपीयू पर माइन किया गया था, फिर बिटकॉइन के लिए विशेष रूप से चिप्स बनाई गईं और वे अन्य कार्यों को करने में असमर्थ थीं।
मैं इसे व्यावहारिक रूप से देखता हूं: एक ही हार्डवेयर कॉन्फ़िगरेशन पूरी तरह से अलग परिणाम दे सकता है जो कार्य पर निर्भर करता है। मेरे स्टार्टअप Introspector में, हम वास्तविक परियोजनाओं में इन प्रक्रियाओं का अध्ययन करते हैं, और Keymakr के रणनीतिक सलाहकार के रूप में, मैं देखता हूं कि क्लाइंट विशेष चिप्स से कुशलता प्राप्त करते हैं, जिससे मॉडल तेजी से चलते हैं। जो परियोजनाएं पहले प्रशिक्षण या अनुमान के दौरान रुक जाती थीं, वे इस दृष्टिकोण से स्थिर परिणाम तक पहुंचती हैं।
हालांकि, संकीर्ण विशेषज्ञता जोखिम उठाती है। Anthropic की आर्किटेक्चर के लिए अनुकूलित एक चिप OpenAI मॉडल को प्रशिक्षित करने के लिए काम नहीं करेगी, और इसके विपरीत। प्रत्येक नई आर्किटेक्चर के लिए एक नई पीढ़ी के हार्डवेयर की आवश्यकता होती है, जो एक बड़े पैमाने पर “डिप्रिकेशन” का जोखिम पैदा करती है। यदि Anthropic कल एक नई आर्किटेक्चर जारी करता है, तो सभी पिछली पीढ़ी की चिप्स अक्षम या बेकार हो जाती हैं। नई चिप्स का उत्पादन अरबों डॉलर की लागत से आता है और वर्षों का समय ले सकता है।
यह एक दुविधा पैदा करता है: क्या हम विशेष चिप्स बनानी चाहिए जो एक संकीर्ण परिदृश्य में बिल्कुल सही काम करती हैं, या सामान्य-उद्देश्य वाली चिप्स का उत्पादन जारी रखना चाहिए जो सभी कार्यों को मध्यम रूप से हल करती हैं लेकिन आर्किटेक्चर बदलने पर पूरी तरह से प्रतिस्थापन की आवश्यकता नहीं होती?
इस संदर्भ में, कुशलता को तीन प्राथमिक मापदंडों द्वारा मापा जाता है: रनटाइम, बिजली की खपत, और गर्मी उत्पादन। ये मापदंड सीधे संबंधित हैं: जितना अधिक समय प्रणाली चलती है, उतनी ही अधिक ऊर्जा की खपत होती है और उतनी ही अधिक गर्मी पैदा होती है। एक मापदंड को कम करने से अन्य दो में सुधार होता है।
यहीं एआई प्रदर्शन का “पवित्र ग्रेल” है: यदि कम से कम एक मूलभूत कुशलता मापदंड को अनुकूलित किया जा सकता है, तो अन्य मापदंड लगभग स्वचालित रूप से सुधारित हो जाते हैं।
स्थायी प्रक्रिया
विशेष चिप्स के बढ़ते उपयोग के साथ, अति उत्पादन जोखिम का मुद्दा दबाव में आया है। वर्तमान में, उपकरणों का अधिशेष पहले से ही महत्वपूर्ण है, और कंपनियां इस मुद्दे को विभिन्न स्थायी तरीकों से संबोधित कर रही हैं, जिनमें मौजूदा संसाधनों का पुन: उपयोग शामिल है।
उपकरणों को रीसाइकल करना उच्च-प्रौद्योगिकी उद्योगों में स्थायी विकास का एक प्रमुख तत्व बन गया है। चिप्स में काफी मात्रा में कीमती और आधार धातुएं, सोना, तांबा, एल्युमिनियम, पैलेडियम और दुर्लभ-पृथ्वी सामग्री होती हैं, साथ ही साथ माइक्रोचिप्स और ट्रांजिस्टर में उपयोग की जाने वाली सामग्री होती है। एक बार जब उपकरण पुराना हो जाता है, तो इन मूल्यवान संसाधनों को उत्पादन में वापस लाया जा सकता है, जिससे नए घटकों की लागत कम हो जाती है और उद्योग का पर्यावरणीय प्रभाव भी कम हो जाता है।
कुछ विशेषज्ञ कारखाने और कंपनियां रीसाइकलिंग और पुराने घटकों से कीमती धातुओं को निकालने पर ध्यान केंद्रित करती हैं। उदाहरण के लिए, कुछ सुविधाएं सोने और तांबे को उच्च शुद्धता के साथ निकालने के लिए हाइड्रोमेटलर्जिकल प्रक्रियाओं और उन्नत रासायनिक तरीकों का उपयोग करती हैं, जिससे इन सामग्रियों को नए चिप्स में पुन: उपयोग किया जा सकता है।
इसके अलावा, कंपनियां बंद-लूप मॉडल लागू कर रही हैं, जहां पुराने उपकरणों को अपग्रेड किया जाता है या नए समाधानों में एकीकृत किया जाता है, जिससे प्राथमिक संसाधन निष्कर्षण की आवश्यकता कम हो जाती है। ऐसे दृष्टिकोण न केवल अपशिष्ट को कम करने में मदद करते हैं, बल्कि उत्पादन के कार्बन फुटप्रिंट को भी कम करते हैं, क्योंकि पारंपरिक खनन और धातु प्रसंस्करण के लिए महत्वपूर्ण ऊर्जा की आवश्यकता होती है।
चिप्स और उपकरणों के जीवन चक्र का स्थायी प्रबंधन एक उद्योग मानक बन सकता है, जहां तकनीकी प्रगति पर्यावरणीय जिम्मेदारी के साथ संरेखित होती है।












