विचार नेता

सर्वत्र समस्या: क्यों “डेटा कहीं भी” एआई युग की परिभाषित बुनियादी ढांचा चुनौती बन रहा है

प्रकाशित 12 जून 2026

Abhas Ricky, सीएसओ, क्लाउडेरा

आज एआई में सबसे महत्वपूर्ण प्रश्न यह नहीं है कि कौन सा मॉडल सबसे चतुर है। यह प्रश्न है कि डेटा कहां रहता है और क्या बुद्धिमत्ता उस तक पहुंच सकती है।

एक दशक से अधिक समय से, एआई उद्योग एक सांत्वना देने वाले तर्क पर काम कर रहा था: डेटा को केंद्रीकृत करें, कंप्यूट को केंद्रीकृत करें, और प्रतिभा इसका अनुसरण करेगी। हाइपरस्केलर मॉडल – विशाल प्रशिक्षण डेटासेट को बड़े क्लाउड क्लस्टर में केंद्रीकृत करना और उन्हें मॉडल पैरामीटर में संपीड़ित करने के लिए बड़े पैमाने पर जीपीयू कंप्यूट का उपयोग करना – असाधारण परिणाम देता है, लेकिन यह एक ऐसा ढांचा भी है जो अब अपनी सफलता के वजन के तहत संघर्ष कर रहा है।

इसे “डेटा कहीं भी” समस्या कहें। जैसे ही एआई अनुसंधान प्रयोगशाला से बाहर निकलकर अस्पतालों, कारखानों, वित्तीय संस्थानों और संप्रभु सरकारों के संचालन तंत्र में प्रवेश करता है, यह जानकारी जो इन प्रणालियों को सूचित करना चाहिए, वह स्वाभाविक रूप से वितरित, क्षेत्राधिकार से बंधी हुई और संचालन रूप से अचल है। यूरोपीय नियामक यह जोर देते हैं कि उनके नागरिकों के वित्तीय रिकॉर्ड महाद्वीप को नहीं छोड़ सकते हैं। बासेल में एक फार्मास्यूटिकल कंपनी के क्लिनिकल परीक्षण डेटा को सियोल से आने वाले जीनोमिक्स डेटासेट के साथ एक ही क्लाउड बाल्टी में सह-निवास नहीं करना चाहिए।

चाहे जो भी मामला हो, बुद्धिमत्ता को डेटा के पास जाना होगा। डेटा, जोर देकर कहते हैं, बुद्धिमत्ता के पास नहीं आएगा।

स्थानांतरण की अर्थव्यवस्था

यह संरचनात्मक तनाव एक ही समय में एआई अर्थव्यवस्था में एक क्रांति द्वारा तेज हो जाता है। उद्योग प्रशिक्षण-केंद्रित से अनुमान-केंद्रित खर्च में एक तectonic पुनर्संतुलन के माध्यम से जा रहा है, और डेटा वास्तुकला के लिए इसके परिणाम गहरे हैं।

डेलॉइट ने अनुमान लगाया कि 2025 में अनुमान कार्यभार ने सभी एआई कंप्यूट के आधे हिस्से के लिए खाता है, एक आंकड़ा जो 2026 में दो-तिहाई तक कूद जाएगा। अनुपात उलटने की गति आश्चर्यजनक है। विश्लेषकों का अनुमान है कि 2026 तक, अनुमान मांग प्रशिक्षण मांग से 118 गुना अधिक हो जाएगी। 2030 तक, अनुमान कुल एआई कंप्यूट के 75% के लिए खाता हो सकता है, जो $7 ट्रिलियन के बुनियादी ढांचे में निवेश को चला रहा है।

लागत गणित भी उतना ही विचित्र है। प्रत्येक $1 बिलियन जो एक एआई मॉडल को प्रशिक्षित करने पर खर्च किया जाता है, संगठनों को मॉडल के उत्पादन जीवनकाल में $15-20 बिलियन की अनुमान लागत का सामना करना पड़ता है: एक अनुपात जो जीपीटी -4 द्वारा कठोर रूप से चित्रित किया गया है, जिसकी प्रशिक्षण लागत लगभग $150 मिलियन थी, लेकिन संचयी अनुमान लागत 2024 के अंत तक $2.3 बिलियन तक पहुंच गई। प्रशिक्षण, एक बार एआई निवेशकों और खरीदारी अधिकारियों के लिए शीर्षलेख जुनून, को एक बार का ट्यूशन शुल्क के रूप में पुनः परिभाषित किया जा रहा है। अनुमान चलने वाली बुद्धिमत्ता की संचालन लागत है, और यह अब प्रमुख आइटम है।

फिर भी, यहाँ एक विरोधाभास है: अनुमान लागत एक जीपीटी -3.5 स्तर प्रणाली के लिए नवंबर 2022 और अक्टूबर 2024 के बीच 280 गुना से अधिक गिर गई, हार्डवेयर लागत में लगभग 30% की वार्षिक गिरावट और 40% प्रति वर्ष ऊर्जा दक्षता में सुधार के साथ। कीमतें गिरती हैं; खपत तेजी से तेज होती है। प्रति-इकाई अनुमान लागत 100 गुना गिर गई, जबकि माइक्रोसॉफ्ट और गूगल ने उस अवधि में एआई कार्यभार में 31 गुना वृद्धि की सूचना दी।

जेवोन्स पराडॉक्स, जहां दक्षता लाभ अधिक संसाधन उपयोग को चलाते हैं, ने जीपीयू क्लस्टर में एक आधुनिक अभिव्यक्ति पाई है।

जहां डेटा रहता है, बुद्धिमत्ता को उसका पालन करना चाहिए

अनुमान अर्थव्यवस्था मूलभूत रूप से बुनियादी ढांचे की आवश्यकताओं को फिर से आकार देती है, और कहीं अधिक डेटा गुरुत्वाकर्षण के आसपास। अनुमान, प्रशिक्षण के विपरीत, एक बैच नौकरी नहीं है जो एक बार एक डेटा केंद्र में चलाई जाती है। यह एक निरंतर, विलंब-संवेदनशील, भौगोलिक रूप से वितरित सेवा है, और केवल उतनी ही अच्छी है जितनी डेटा वह प्रश्न के क्षण में पहुंच सकती है।

यह “डेटा कहीं भी” चुनौती का मूल है।

उदाहरण के लिए, एक भाषा मॉडल जो एक रोगी के लाइव आईसीयू टेलीमेट्री पर तर्क कर रहा है, 200-मिलीसेकंड राउंड ट्रिप के लिए एक हाइपरस्केलर के पूर्वी तट क्लस्टर की अनुमति नहीं दे सकता है। एक वित्तीय सेवा धोखाधड़ी मॉडल जो लेनदेन के बिंदु पर अनुमान चला रहा है, जीडीपीआर का उल्लंघन करने के लिए खाता डेटा को एक क्षेत्राधिकार में निकाल नहीं सकता है। एक संप्रभु एआई तैनाती विदेशी व्यावसायिक इकाई द्वारा स्वामित्व और संचालित बुनियादी ढांचे पर आधारित नहीं हो सकती है।

अग्रिम प्रयोगशालाएं इस बात से अच्छी तरह वाकिफ हैं। एंथ्रोपिक के गूगल क्लाउड के साथ एक मिलियन टीपीयू तक के समझौते ने 2026 तक एक गिगावाट से अधिक एआई कंप्यूट क्षमता प्रदान की, जो वैश्विक बुनियादी ढांचे के नक्शे को आकार देने के लिए अग्रणी प्रयोगशालाओं द्वारा असाधारण पैमाने पर निवेश का संकेत देता है।

डेटा तीव्रता का वर्गीकरण

सभी एआई प्रणालियों का सामना इस चुनौती से समान रूप से नहीं होता है और यह विभिन्न प्रकार के एआई मॉडल और जटिलता पर विचार करने के लिए सूचित करने वाला है। आइए इसे तीन मूल उदाहरणों के साथ तोड़ दें: एलएलएम, छवि, और भौतिक मॉडल।

बड़े भाषा मॉडल – क्लाउड, जीपीटी, और जेमिनी परिवार – मुख्य रूप से भाषा टोकन में सौदा करते हैं: अपेक्षाकृत हल्के, संपीड़ित, और गोपनीयता-संरक्षण तकनीकों जैसे कि डिफरेंशियल गोपनीयता या संघीय सीखने के लिए अनुकूल। उनकी डेटा कहीं भी समस्या बहुत जटिल है।

उत्पादक दृश्य मॉडल एक और कठिन मामला प्रस्तुत करते हैं। ब्लैक फॉरेस्ट लैब्स के फ्लक्स.2 जैसे सिस्टम एक सेकंड से कम समय में उच्च-रिज़ॉल्यूशन, फोटोरियलिस्टिक छवियां उत्पन्न कर सकते हैं शक्तिशाली हार्डवेयर पर, लेकिन एक छवि का उत्पादन करने के लिए पाठ की तुलना में बहुत अधिक डेटा और कंप्यूट की आवश्यकता होती है। जैसे ही दृश्य एआई रचनात्मक उपकरणों से परे औद्योगिक निरीक्षण, चिकित्सा इमेजिंग और उपग्रह विश्लेषण में आगे बढ़ता है, अंतर्निहित डेटा अक्सर बड़ा, संवेदनशील और हिलाने में मुश्किल होता है, जिससे डेटा के निवास स्थान पर एआई चलाने की आवश्यकता बढ़ जाती है।

भौतिक एआई अधिक जटिल श्रेणी है। एनवीडिया के जेंसेन हुआंग ने घोषणा की है कि “भौतिक एआई आ गया है, और हर औद्योगिक कंपनी एक रोबोटिक्स कंपनी बन जाएगी।” नए मॉडल जैसे एनवीडिया के कॉस्मोस 3 मशीनों को भौतिक दुनिया की सामान्य समझ देने के लिए सिमुलेशन, दृष्टि और तर्क को जोड़ते हैं, जबकि कंपनियां जैसे कि फिजिकल इंटेलिजेंस वास्तविक दुनिया के सेंसर डेटा – जिसमें बल, गति और दृश्य इनपुट शामिल हैं – पर रोबोट को प्रशिक्षित कर रही हैं ताकि अधिक अनुकूलनीय, स्वायत्त व्यवहार को सक्षम किया जा सके।

बड़े तर्क मॉडल में सुधार के लिए लागू की जाने वाली उसी स्केलिंग गतिविधियों को अब वास्तविक दुनिया के डेटा जैसे कि कंपन, ध्वनि और सेंसर इनपुट पर लागू किया जा रहा है। लेकिन यह जानकारी स्वाभाविक रूप से स्थानीय है। एक फैक्ट्री फ्लोर पर एक रोबोट वास्तविक समय दृश्य और स्पर्श डेटा को दूरस्थ क्लाउड में संसाधित करने के लिए नहीं भेज सकता है जिससे देरी हो सकती है जो सुरक्षा जोखिम पैदा कर सकती है, जिसका अर्थ है कि एआई को तेजी से बढ़ना चाहिए जहां डेटा उत्पन्न होता है।

विश्वास, व्याख्या, और परिणाम

यहीं पर “डेटा कहीं भी” चुनौती बुनियादी ढांचे से परे हो जाती है और एक शासन मुद्दा बन जाती है। जैसे ही एआई को उच्च-जोखिम वाले निर्णयों पर लागू किया जाता है – स्वास्थ्य सेवा निदान से लेकर वित्तीय जोखिम मॉडल तक और भौतिक नियंत्रण प्रणाली तक – डेटा के निवास स्थान के बारे में प्रश्न परिणामों के लिए जिम्मेदार कौन है, इसके साथ जुड़े हुए हैं।

आज के नियामक वातावरण में, व्याख्या वैकल्पिक नहीं है। यूरोपीय संघ के एआई अधिनियम के लिए, उदाहरण के लिए, उच्च जोखिम वाली प्रणालियों को अपने आउटपुट के लिए आधार का प्रदर्शन करने की आवश्यकता है, जो कठिन है यदि सूचित निर्णय लेने वाला डेटा विभिन्न प्रणालियों, क्षेत्राधिकारों और नियामक ढांचों में वितरित हो।

विश्वास, इसलिए, व्यापक रूप से अपनाने के लिए पूर्वापेक्षा बन जाता है। डेटा वातावरण पर नियंत्रण मॉडल खुद पर नियंत्रण के रूप में महत्वपूर्ण हो जाता है।

एआई बुनियादी ढांचे की अगली पीढ़ी

“डेटा कहीं भी” चुनौती का समाधान एआई के लिए अगले दशक के प्रतिस्पर्धी मानचित्र को परिभाषित करेगा। संघीय अनुमान, सुरक्षित डेटा-प्रोसेसिंग वातावरण, एज-ऑप्टिमाइज्ड मॉडल, और ऑर्केस्ट्रेशन सिस्टम जो डेटा को कहां रहने की अनुमति है, यह नहीं है निष्ठा तकनीकी सुविधाएं, लेकिन एआई के विस्तार के लिए पूर्वापेक्षाएं हैं जिन मामलों में डेटा को केंद्रीकृत किया जा सकता है।

वे कंपनियां और सरकारें जो बुद्धिमत्ता को डेटा तक पहुंचाने के बजाय डेटा को बुद्धिमत्ता तक ले जाने के लिए बुनियादी ढांचा बनाने में सक्षम होंगी, वे एआई युग की सबसे टिकाऊ खाई को कमांड करेंगी। एक चतुर मॉडल को प्रशिक्षित करना एक हल और कमोडिटीकृत समस्या बन गया है। इसे जिम्मेदारी से, किनारे पर, क्षेत्राधिकार की सीमाओं के पार, डेटा के खिलाफ जो हिल नहीं सकता है, यह समस्या बनी हुई है।

डेटा कहीं भी नहीं है नारा। यह उद्यम एआई में सबसे कठिन असुलझी समस्या है। और यह तय करेगा कि पिछले दशक के प्रशिक्षण निवेश द्वारा अनलॉक की गई असाधारण क्षमता क्या कभी विश्वास करने योग्य परिणामों में अनुवादित होगी जो दुनिया पर विश्वास कर सकती है।

Abhas Ricky, सीएसओ, क्लाउडेरा

मुख्य रणनीति अधिकारी के रूप में, अभास क्लाउडेरा के लिए समग्र कॉर्पोरेट रणनीति का नेतृत्व करते हैं और कंपनी के दृष्टिकोण का निर्माण करने, व्यवसाय और ग्राहक लक्ष्य ऑपरेटिंग मॉडल का निर्माण करने, प्रमुख हितधारकों के साथ स्पष्ट रूप से परिभाषित ओकेआर के माध्यम से इसके बारे में संवाद करने और उस योजना को महसूस करने के लिए प्रमुख परिवर्तनकारी पहलों को निष्पादित करने के लिए जिम्मेदार हैं। वह विकास और नवाचार को बढ़ावा देने और निर्माण/खरीद भागीदार निर्णय लेने के लिए भी जिम्मेदार है, जिसमें मूल्य निर्धारण और पैकेजिंग, कॉर्पोरेट विकास और क्लाउडेरा के नवाचार त्वरक शामिल हैं जो नए उत्पादों को लॉन्च करने के लिए हैं। इससे पहले, उन्होंने कंपनी में मुख्य कर्मचारी और व्यवसाय परिवर्तन के लिए उपाध्यक्ष के रूप में कार्य किया था।

क्लाउडेरा/हॉर्टनवर्क्स विलय से पहले, उन्होंने वैश्विक प्रमुख ग्राहक नवाचार और मूल्य प्रबंधन के रूप में हॉर्टनवर्क्स के बाजार में प्रयासों को बढ़ाने में मदद की। एक प्रबंधन सलाहकार के रूप में प्रशिक्षित, वह समाज में कार्रवाई और परिवर्तन को बढ़ावा देने के लिए उत्साहित हैं और विश्व आर्थिक मंच, फाउंडर्स ऑफ द फ्यूचर और अन्य गैर-लाभकारी संगठनों सहित कई संगठनों के साथ परियोजनाओं का नेतृत्व किया है।

Unite.AI

सर्वत्र समस्या: क्यों “डेटा कहीं भी” एआई युग की परिभाषित बुनियादी ढांचा चुनौती बन रहा है

स्थानांतरण की अर्थव्यवस्था

जहां डेटा रहता है, बुद्धिमत्ता को उसका पालन करना चाहिए

डेटा तीव्रता का वर्गीकरण

विश्वास, व्याख्या, और परिणाम

एआई बुनियादी ढांचे की अगली पीढ़ी

You may like