рд╡рд┐рдЪрд╛рд░ рдиреЗрддрд╛
рдЖрд░реНрдЯрд┐рдлрд╝рд┐рд╢рд┐рдпрд▓ рдЗрдВрдЯреЗрд▓рд┐рдЬреЗрдВрд╕ рдореЗрдВ рдХрдореНрдкреНрдпреВрдЯреЗрд╢рдирд▓ рдкрд╛рд╡рд░ рдХрд╛ рдкрд╡рд┐рддреНрд░ рдЧреНрд░реЗрд▓

अद्भुत प्रगति के बावजूद, आर्टिफ़िशियल इंटेलिजेंस की क्षमताएं अभी भी वास्तविक दुनिया की अपेक्षाओं की तुलना में सीमित हैं। हम जटिल मॉडल बनाते हैं, न्यूरल नेटवर्क चलाते हैं और एल्गोरिदम का परीक्षण करते हैं, लेकिन कभी-कभी प्रगति उन स्थानों पर रुक जाती है जहां हम इसे कम से कम उम्मीद करते हैं।
समस्या अक्सर एल्गोरिदम या डेटा में नहीं होती है, बल्कि कम्प्यूटेशनल पावर में होती है, जो संसाधनों को सीखने और आवश्यक पैमाने पर संचालित करने की अनुमति देती है। तो इस बाधा के पीछे क्या है? आइए उस महत्वपूर्ण संसाधन की जांच करें जिसके बिना सबसे आशाजनक एआई परियोजनाएं प्रयोगशाला से परे नहीं जा सकती हैं।
कम्प्यूटेशनल पावर की कमी और इसके परिणाम
इस विषय को समझने के लिए, आइए मोबाइल संचार के इतिहास से शुरू करें। जब 3G और बाद में 4G नेटवर्क दिखाई दिए, तो इंटरनेट पहले से ही लगभग वैश्विक था। और जब 5G पेश किया गया, तो कई लोगों ने एक पूरी तरह से तर्कसंगत प्रश्न पूछा: “इंटरनेट तेज होगा – लेकिन इतना क्यों?”
वास्तव में, इंटरनेट की गति में वृद्धि उपयोगकर्ता की सुविधा के बारे में नहीं है। यह पूरे तकनीकी परिदृश्य को बदल देता है। ऐसे उपयोग के मामले सामने आते हैं जो पहले असंभव थे। 5G 4G की तुलना में बहुत तेज निकला, और यह छलांग धीरे-धीरे नहीं थी, जैसे 1G से 2G तक की छलांग, बल्कि यह एक्सपोनेंशियल थी। परिणामस्वरूप, नए अनुप्रयोग, उपकरण और पूरी तरह से नई तकनीक के वर्ग दिखाई दे सकते हैं।
ट्रैफिक लाइट कैमरे, रियल-टाइम ट्रैफिक विश्लेषण प्रणाली और स्वचालित ट्रैफिक नियमन तंत्र – यह सब नई संचार प्रौद्योगिकियों के कारण संभव हो जाता है। पुलिस को डेटा का आदान-प्रदान करने के नए तरीके मिलते हैं, और अंतरिक्ष में, दूरबीन और उपग्रह पृथ्वी पर विशाल मात्रा में जानकारी भेज सकते हैं। एक मौलिक प्रौद्योगिकी में गुणात्मक छलांग पूरे पारिस्थितिकी तंत्र के विकास को बढ़ावा देती है।
कम्प्यूटेशनल पावर के साथ भी यही सिद्धांत लागू होता है। मानवता की कुल कम्प्यूटिंग क्षमता को कल्पनात्मक इकाइयों में देखें। आज, हमारे पास, कहें, दस ऐसी इकाइयाँ हो सकती हैं। उनके साथ, हम चित्र और वीडियो बना सकते हैं, पाठ लिख सकते हैं, विपणन सामग्री तैयार कर सकते हैं… यह पहले से ही काफी बड़ा है, लेकिन अनुप्रयोगों की श्रृंखला मुख्य रूप से सीमित है।
अब कल्पना करें कि हमारे पास न केवल दस, बल्कि हजारों ऐसी इकाइयाँ हैं। अचानक, जो प्रौद्योगिकियाँ पहले बहुत महंगी थीं, वे अब संभव हो जाती हैं, और जो स्टार्टअप उच्च कम्प्यूटेशनल लागत के कारण छोड़ दिए गए थे, वे अब आर्थिक रूप से समझ में आने लगते हैं।
उदाहरण के लिए, रोबोटैक्सी लें। आज, वे मुख्य रूप से वाहन में स्थापित कमजोर स्थानीय कंप्यूटरों पर निर्भर करते हैं। हालांकि, यदि वीडियो फीड को विशाल कम्प्यूटेशनल संसाधनों वाले क्लाउड में प्रसारित किया जाए, तो डेटा को वास्तविक समय में संसाधित किया जा सकता है और वापस भेजा जा सकता है। और यह महत्वपूर्ण है: 100 किमी/घंटा की रफ्तार से चलने वाली कार को कुछ सेकंड के भीतर निर्णय लेने होते हैं – सीधे जाना, मुड़ना, ब्रेक लगाना या ब्रेक नहीं लगाना।
यह तब है जब एक पूरी तरह से कार्यात्मक रोबोटैक्सी उद्योग संभव हो जाता है, न कि केवल वे अलग-थलग समाधान जो हम आज देखते हैं। कार में स्थापित कोई स्थानीय कंप्यूटर अपने आप में सीमित होता है, जो जुड़े हुए सिस्टम की तरह नहीं है। जितनी तेजी से हम इसे स्केल कर सकते हैं, उतनी ही तेजी से हमारे आसपास की दुनिया बदल जाएगी।
एआई में चिप्स और “गोल्डन टिकट” तक पहुंच
कम्प्यूटेशनल पावर के संदर्भ में, यह सवाल उठता है: क्या आधुनिक चिप्स तक पहुंच एआई बाजार में प्रवेश करने के लिए “गोल्डन टिकट” बन रही है? क्या बड़े खिलाड़ी जो चिप निर्माताओं के साथ अनुबंध पर हस्ताक्षर करते हैं या उन्हें स्वयं उत्पादित करते हैं, बड़े उद्यम कंपनियों और बाकी सभी के बीच एक अंतर पैदा कर रहे हैं?
एक ऐसा अंतर केवल एक मामले में उत्पन्न होता है: यदि एक व्यवसाय मॉडल केवल बड़े ग्राहकों को चिप्स बेचने पर केंद्रित है। वास्तव में, निर्माता जैसे NVIDIA हर किसी के लिए क्लाउड समाधान प्रदान करने का लक्ष्य रखते हैं। उनके अनुकूलित चिप्स क्लाउड में ओपनएआई और स्वतंत्र विकासकर्ताओं दोनों के लिए उपलब्ध हैं।
गूगल, एंथ्रोपिक, माइक्रोसॉफ्ट, ओपनएआई, अमेज़न और NVIDIA जैसी कंपनियों के बीच रणनीतिक गठबंधन मुख्य रूप से साझा संसाधन उपयोगिता के लिए साझेदारी हैं, बाजार को बंद करने के प्रयास नहीं। यह मॉडल कम्प्यूटेशनल शक्ति के कुशल आवंटन को सक्षम बनाता है, जिससे तकनीकी विकास तेज होता है।
यदि हम कम्प्यूटेशनल संसाधनों के उपयोग की श्रृंखला का पता लगाते हैं, तो यह अंतिम उपयोगकर्ता से शुरू होता है। उदाहरण के लिए, जब आप वीडियो कॉल और संदेश भेजने के लिए व्हाट्सएप का उपयोग करते हैं, तो कंपनी को सुनिश्चित करना होता है कि सेवा काम करती है: डेटा को संग्रहीत और संसाधित करना, वीडियो क्लीनअप के लिए मॉडल चलाना, प्रभाव जोड़ना और छवि गुणवत्ता में सुधार करना।
स्वामित्व वाले सर्वर को बनाए रखना महंगा है, वे पुराने हो जाते हैं और निरंतर रखरखाव की आवश्यकता होती है। यही कारण है कि क्लाउड समाधान, “क्लाउड” का उदय हुआ। बाजार तीन खिलाड़ियों द्वारा नियंत्रित होता है: गूगल क्लाउड, एएमडब्ल्यूएस और माइक्रोसॉफ्ट एज़्योर। अन्य कंपनियां इस स्तर पर प्रतिस्पर्धा नहीं कर सकती हैं: बुनियादी ढांचे का पैमाना बहुत विशाल है।
क्लाउड सेवाएं विशाल डेटा केंद्र हैं जिनमें शीतलन, शक्ति आपूर्ति और चौबीसों घंटे रखरखाव होता है। वे NVIDIA, AMD और अन्य निर्माताओं के सर्वर और विशेष चिप्स को हाउस करते हैं, जो बड़े पैमाने पर कम्प्यूटेशनल प्रक्रियाओं को सक्षम बनाते हैं।
यहाँ हम उस मुख्य प्रश्न पर आते हैं जिस पर मैंने अपने पिछले कॉलम में डेटा सेंटर के बारे में चर्चा की थी और जिसे मैं यहाँ जारी रखना चाहता हूँ: इस प्रणाली में मुख्य बोतलनेक क्या है? क्या यह बिजली की कमी है, या डेटा सेंटर को उन क्षेत्रों में ठंडा करने में कठिनाई जहां जलवायु इसे विशेष रूप से चुनौतीपूर्ण बना देती है? वास्तव में, रहस्य चिप्स में ही छुपा है…
पवित्र ग्रेल
एनवीडिया आज लगभग 5 ट्रिलियन डॉलर के मूल्यांकन के साथ दुनिया की सबसे सफल सार्वजनिक कंपनियों में से एक क्यों है? कारण सरल है: NVIDIA वे चिप्स बनाती है जिन पर एआई मॉडल प्रशिक्षित और चलाए जाते हैं।
इनमें से प्रत्येक चिप बड़े मॉडलों को प्रशिक्षित करने या बढ़ती मात्रा में डेटा को संसाधित करने के दौरान विशाल मात्रा में बिजली की खपत करती है। लेकिन ऊर्जा का उपयोग कितनी कुशलता से किया जाता है? यहीं विशेष चिप्स काम आती हैं; वे विशिष्ट कार्यों को सामान्य-उद्देश्य वाले जीपीयू की तुलना में बहुत अधिक कुशलता से संभालती हैं।
एआई मॉडल अलग-अलग होते हैं। उदाहरण के लिए, ओपनएआई के पास एक मॉडल परिवार है, एंथ्रोपिक के पास दूसरा है। अवधारणाएं समान हो सकती हैं, लेकिन गणितीय संरचनाएं और कम्प्यूटेशनल प्रक्रियाएं अलग हैं। एक ही सामान्य-उद्देश्य वाला चिप, ओपनएआई मॉडल (जैसे कि चैटजीपीटी) को प्रशिक्षित करने के लिए 100,000 घंटे की कम्प्यूटेशन का उपभोग कर सकता है, जबकि एंथ्रोपिक मॉडल (जैसे कि क्लाउड) के लिए 150,000 घंटे। कुशलता में काफी अंतर होता है और शायद ही कभी अनुकूलित होता है।
कंपनियां इस समस्या का समाधान विशेष चिप्स का उत्पादन करके करती हैं। उदाहरण के लिए, एक चिप चैटजीपीटी आर्किटेक्चर के लिए अनुकूलित हो सकती है और इसे 20 मिनट में प्रशिक्षित कर सकती है, जबकि दूसरी एंथ्रोपिक की आर्किटेक्चर के लिए तैयार की जा सकती है और भी 20 मिनट में प्रशिक्षण पूरा कर सकती है। ऊर्जा की खपत और प्रशिक्षण समय एक सामान्य-उद्देश्य वाले चिप की तुलना में कई गुना कम हो जाते हैं।
जब ये चिप्स बड़ी कंपनियों जैसे गूगल, अमेज़न, माइक्रोसॉफ्ट या एज़्योर को बेचे जाते हैं, तो वे स्टैंडअलोन उत्पादों के रूप में पेश किए जाते हैं। उपयोगकर्ता योलो मॉडल या जेन आर्किटेक्चर के लिए अनुकूलित चिप चुनने का विकल्प चुन सकते हैं। इस तरह, कंपनियां अपने कार्यों के लिए विशेष रूप से तैयार कम्प्यूटेशनल संसाधनों तक पहुंच प्राप्त करती हैं, न कि सामान्य-उद्देश्य वाले जीपीयू खरीदती हैं। यदि एक उपयोगकर्ता के पास दस अलग-अलग कार्य हैं, तो वे दस अलग-अलग विशेष चिप्स का उपयोग कर सकते हैं।
रुझान स्पष्ट है: विशेष चिप्स धीरे-धीरे सामान्य-उद्देश्य वाले चिप्स की जगह ले रही हैं। कई स्टार्टअप अब एएसआईसी (एप्लिकेशन-स्पेसिफिक इंटीग्रेटेड सर्किट) के साथ काम कर रहे हैं, जो विशिष्ट कम्प्यूटेशनल कार्यों के लिए डिज़ाइन किए गए चिप्स हैं। पहले एएसआईसी बिटकॉइन माइनिंग के लिए दिखाई दिए: शुरुआत में, क्रिप्टोकरेंसी को एनवीडिया जीपीयू पर माइन किया जाता था, फिर बिटकॉइन के लिए विशेष रूप से चिप्स बनाई गईं जो अन्य कार्यों को करने में असमर्थ थीं।
मैं इसे व्यावहारिक रूप से देखता हूं: एक ही हार्डवेयर कॉन्फ़िगरेशन पूरी तरह से अलग परिणाम दे सकता है, यह इस बात पर निर्भर करता है कि कार्य क्या है। मेरे स्टार्टअप इंट्रोस्पेक्टर में, हम वास्तविक परियोजनाओं में इन प्रक्रियाओं का अध्ययन करते हैं, और कीमाकर के रणनीतिक सलाहकार के रूप में, मैं देखता हूं कि क्लाइंट विशेष चिप्स से कैसे लाभान्वित होते हैं, जो मॉडलों को तेजी से चलाने की अनुमति देते हैं। जो परियोजनाएं पहले प्रशिक्षण या अनुमान के दौरान रुक जाती थीं, वे इस दृष्टिकोण से स्थिर परिणाम तक पहुंचती हैं।
हालांकि, संकीर्ण विशेषज्ञता जोखिम उठाती है। एंथ्रोपिक की आर्किटेक्चर के लिए अनुकूलित एक चिप ओपनएआई मॉडल को प्रशिक्षित करने के लिए काम नहीं करेगी, और इसके विपरीत। प्रत्येक नई आर्किटेक्चर के लिए एक नई हार्डवेयर पीढ़ी की आवश्यकता होती है, जो बड़े पैमाने पर “पुरानी पीढ़ी” का जोखिम पैदा करती है। यदि एंथ्रोपिक कल एक नई आर्किटेक्चर जारी करता है, तो सभी पिछली पीढ़ी के चिप्स अक्षम या बेकार हो जाते हैं। नए चिप्स का उत्पादन अरबों डॉलर की लागत से आता है और कई वर्षों तक चल सकता है।
यह एक दुविधा पैदा करता है: क्या हम विशेष चिप्स बनाने चाहिए जो एक संकीर्ण परिदृश्य में बिल्कुल सही काम करती हैं, या सामान्य-उद्देश्य वाले चिप्स का उत्पादन जारी रखना चाहिए जो सभी कार्यों को मध्यम रूप से अच्छी तरह से हल करते हैं लेकिन आर्किटेक्चर बदलने पर पूरी तरह से प्रतिस्थापन की आवश्यकता नहीं होती?
इस संदर्भ में, कुशलता को तीन मुख्य मापदंडों द्वारा मापा जाता है: रनटाइम, बिजली की खपत और गर्मी उत्पादन। ये मेट्रिक्स सीधे संबंधित हैं: जितना अधिक समय प्रणाली चलती है, उतनी ही अधिक ऊर्जा की खपत होती है और उतनी ही अधिक गर्मी पैदा होती है। एक पैरामीटर को कम करने से अन्य दो में स्वचालित रूप से सुधार होता है।
यहीं एआई प्रदर्शन का “पवित्र ग्रेल” है: यदि कम से कम एक मूलभूत दक्षता मापदंड को अनुकूलित किया जा सकता है, तो अन्य मापदंड लगभग स्वचालित रूप से भी सुधारित हो जाते हैं।
स्थायी प्रक्रिया
विशेष चिप्स के बढ़ते उपयोग के साथ, अधिशेष उपकरणों के जोखिम का मुद्दा तेजी से प्रासंगिक हो गया है। वर्तमान में, उपकरणों का अधिशेष पहले से ही महत्वपूर्ण है, और कंपनियां इस मुद्दे को विभिन्न स्थायी तरीकों से संबोधित कर रही हैं, जिनमें मौजूदा संसाधनों का पुन: उपयोग शामिल है।
उपकरणों को रीसाइकल करना उच्च-प्रौद्योगिकी उद्योगों में स्थायी विकास का एक महत्वपूर्ण तत्व बन गया है। चिप्स में कीमती और आधार धातुओं, सोने, तांबे, एल्युमिनियम, पैलेडियम और दुर्लभ-पृथ्वी सामग्री के साथ-साथ माइक्रोचिप्स और ट्रांजिस्टर में उपयोग की जाने वाली सामग्री की बड़ी मात्रा होती है। एक बार जब उपकरण पुराना हो जाता है, तो इन मूल्यवान संसाधनों को उत्पादन में वापस लाया जा सकता है, जिससे नए घटकों की लागत कम हो जाती है और साथ ही उद्योग के पर्यावरणीय प्रभाव को भी कम किया जा सकता है।
कुछ विशेषज्ञ कारखाने और कंपनियां पुराने घटकों से कीमती धातुओं को निकालने और रीसाइकल करने पर ध्यान केंद्रित करती हैं। उदाहरण के लिए, कुछ सुविधाएं सोने और तांबे को उच्च शुद्धता के साथ निकालने के लिए हाइड्रोमेटलर्जिकल प्रक्रियाओं और उन्नत रासायनिक विधियों का उपयोग करती हैं, जो नए चिप्स में पुन: उपयोग किए जा सकते हैं।
इसके अलावा, कंपनियां बंद लूप मॉडल लागू कर रही हैं, जहां पुराने उपकरणों को अपग्रेड किया जाता है या नए समाधानों में एकीकृत किया जाता है, जिससे प्राथमिक संसाधन निष्कर्षण की आवश्यकता कम हो जाती है। ऐसे दृष्टिकोण न केवल अपशिष्ट को कम करने में मदद करते हैं, बल्कि उत्पादन के कार्बन फुटप्रिंट को भी कम करते हैं, क्योंकि पारंपरिक खनन और धातु प्रसंस्करण में महत्वपूर्ण ऊर्जा की आवश्यकता होती है।
चिप्स और उपकरणों के जीवन चक्र का स्थायी प्रबंधन उद्योग मानक बन सकता है, जहां तकनीकी प्रगति पर्यावरणीय जिम्मेदारी के साथ संरेखित होती है।












