рд╡рд┐рдЪрд╛рд░ рдиреЗрддрд╛
рд╕рд░реНрд╡рддреНрд░ рд╕рдорд╕реНрдпрд╛: рдХреНрдпреЛрдВ “рдбреЗрдЯрд╛ рдХрд╣реАрдВ рднреА” рдПрдЖрдИ рдпреБрдЧ рдХреА рдкрд░рд┐рднрд╛рд╖рд┐рдд рдмреБрдирд┐рдпрд╛рджреА рдврд╛рдВрдЪрд╛ рдЪреБрдиреМрддреА рдмрди рд░рд╣рд╛ рд╣реИ

आज एआई में सबसे महत्वपूर्ण प्रश्न यह नहीं है कि कौन सा मॉडल सबसे चतुर है। यह प्रश्न है कि डेटा कहां रहता है और क्या बुद्धिमत्ता उस तक पहुंच सकती है।
एक दशक से अधिक समय से, एआई उद्योग एक सांत्वना देने वाले तर्क पर काम कर रहा था: डेटा को केंद्रीकृत करें, कंप्यूट को केंद्रीकृत करें, और प्रतिभा इसका अनुसरण करेगी। हाइपरस्केलर मॉडल – विशाल प्रशिक्षण डेटासेट को बड़े क्लाउड क्लस्टर में केंद्रीकृत करना और उन्हें मॉडल पैरामीटर में संपीड़ित करने के लिए बड़े पैमाने पर जीपीयू कंप्यूट का उपयोग करना – असाधारण परिणाम देता है, लेकिन यह एक ऐसा ढांचा भी है जो अब अपनी सफलता के वजन के तहत संघर्ष कर रहा है।
इसे “डेटा कहीं भी” समस्या कहें। जैसे ही एआई अनुसंधान प्रयोगशाला से बाहर निकलकर अस्पतालों, कारखानों, वित्तीय संस्थानों और संप्रभु सरकारों के संचालन तंत्र में प्रवेश करता है, यह जानकारी जो इन प्रणालियों को सूचित करना चाहिए, वह स्वाभाविक रूप से वितरित, क्षेत्राधिकार से बंधी हुई और संचालन रूप से अचल है। यूरोपीय नियामक यह जोर देते हैं कि उनके नागरिकों के वित्तीय रिकॉर्ड महाद्वीप को नहीं छोड़ सकते हैं। बासेल में एक फार्मास्यूटिकल कंपनी के क्लिनिकल परीक्षण डेटा को सियोल से आने वाले जीनोमिक्स डेटासेट के साथ एक ही क्लाउड बाल्टी में सह-निवास नहीं करना चाहिए।
चाहे जो भी मामला हो, बुद्धिमत्ता को डेटा के पास जाना होगा। डेटा, जोर देकर कहते हैं, बुद्धिमत्ता के पास नहीं आएगा।
स्थानांतरण की अर्थव्यवस्था
यह संरचनात्मक तनाव एक ही समय में एआई अर्थव्यवस्था में एक क्रांति द्वारा तेज हो जाता है। उद्योग प्रशिक्षण-केंद्रित से अनुमान-केंद्रित खर्च में एक तectonic पुनर्संतुलन के माध्यम से जा रहा है, और डेटा वास्तुकला के लिए इसके परिणाम गहरे हैं।
डेलॉइट ने अनुमान लगाया कि 2025 में अनुमान कार्यभार ने सभी एआई कंप्यूट के आधे हिस्से के लिए खाता है, एक आंकड़ा जो 2026 में दो-तिहाई तक कूद जाएगा। अनुपात उलटने की गति आश्चर्यजनक है। विश्लेषकों का अनुमान है कि 2026 तक, अनुमान मांग प्रशिक्षण मांग से 118 गुना अधिक हो जाएगी। 2030 तक, अनुमान कुल एआई कंप्यूट के 75% के लिए खाता हो सकता है, जो $7 ट्रिलियन के बुनियादी ढांचे में निवेश को चला रहा है।
लागत गणित भी उतना ही विचित्र है। प्रत्येक $1 बिलियन जो एक एआई मॉडल को प्रशिक्षित करने पर खर्च किया जाता है, संगठनों को मॉडल के उत्पादन जीवनकाल में $15-20 बिलियन की अनुमान लागत का सामना करना पड़ता है: एक अनुपात जो जीपीटी -4 द्वारा कठोर रूप से चित्रित किया गया है, जिसकी प्रशिक्षण लागत लगभग $150 मिलियन थी, लेकिन संचयी अनुमान लागत 2024 के अंत तक $2.3 बिलियन तक पहुंच गई। प्रशिक्षण, एक बार एआई निवेशकों और खरीदारी अधिकारियों के लिए शीर्षलेख जुनून, को एक बार का ट्यूशन शुल्क के रूप में पुनः परिभाषित किया जा रहा है। अनुमान चलने वाली बुद्धिमत्ता की संचालन लागत है, और यह अब प्रमुख आइटम है।
फिर भी, यहाँ एक विरोधाभास है: अनुमान लागत एक जीपीटी -3.5 स्तर प्रणाली के लिए नवंबर 2022 और अक्टूबर 2024 के बीच 280 गुना से अधिक गिर गई, हार्डवेयर लागत में लगभग 30% की वार्षिक गिरावट और 40% प्रति वर्ष ऊर्जा दक्षता में सुधार के साथ। कीमतें गिरती हैं; खपत तेजी से तेज होती है। प्रति-इकाई अनुमान लागत 100 गुना गिर गई, जबकि माइक्रोसॉफ्ट और गूगल ने उस अवधि में एआई कार्यभार में 31 गुना वृद्धि की सूचना दी।
जेवोन्स पराडॉक्स, जहां दक्षता लाभ अधिक संसाधन उपयोग को चलाते हैं, ने जीपीयू क्लस्टर में एक आधुनिक अभिव्यक्ति पाई है।
जहां डेटा रहता है, बुद्धिमत्ता को उसका पालन करना चाहिए
अनुमान अर्थव्यवस्था मूलभूत रूप से बुनियादी ढांचे की आवश्यकताओं को फिर से आकार देती है, और कहीं अधिक डेटा गुरुत्वाकर्षण के आसपास। अनुमान, प्रशिक्षण के विपरीत, एक बैच नौकरी नहीं है जो एक बार एक डेटा केंद्र में चलाई जाती है। यह एक निरंतर, विलंब-संवेदनशील, भौगोलिक रूप से वितरित सेवा है, और केवल उतनी ही अच्छी है जितनी डेटा वह प्रश्न के क्षण में पहुंच सकती है।
यह “डेटा कहीं भी” चुनौती का मूल है।
उदाहरण के लिए, एक भाषा मॉडल जो एक रोगी के लाइव आईसीयू टेलीमेट्री पर तर्क कर रहा है, 200-मिलीसेकंड राउंड ट्रिप के लिए एक हाइपरस्केलर के पूर्वी तट क्लस्टर की अनुमति नहीं दे सकता है। एक वित्तीय सेवा धोखाधड़ी मॉडल जो लेनदेन के बिंदु पर अनुमान चला रहा है, जीडीपीआर का उल्लंघन करने के लिए खाता डेटा को एक क्षेत्राधिकार में निकाल नहीं सकता है। एक संप्रभु एआई तैनाती विदेशी व्यावसायिक इकाई द्वारा स्वामित्व और संचालित बुनियादी ढांचे पर आधारित नहीं हो सकती है।
अग्रिम प्रयोगशालाएं इस बात से अच्छी तरह वाकिफ हैं। एंथ्रोपिक के गूगल क्लाउड के साथ एक मिलियन टीपीयू तक के समझौते ने 2026 तक एक गिगावाट से अधिक एआई कंप्यूट क्षमता प्रदान की, जो वैश्विक बुनियादी ढांचे के नक्शे को आकार देने के लिए अग्रणी प्रयोगशालाओं द्वारा असाधारण पैमाने पर निवेश का संकेत देता है।
डेटा तीव्रता का वर्गीकरण
सभी एआई प्रणालियों का सामना इस चुनौती से समान रूप से नहीं होता है और यह विभिन्न प्रकार के एआई मॉडल और जटिलता पर विचार करने के लिए सूचित करने वाला है। आइए इसे तीन मूल उदाहरणों के साथ तोड़ दें: एलएलएम, छवि, और भौतिक मॉडल।
बड़े भाषा मॉडल – क्लाउड, जीपीटी, और जेमिनी परिवार – मुख्य रूप से भाषा टोकन में सौदा करते हैं: अपेक्षाकृत हल्के, संपीड़ित, और गोपनीयता-संरक्षण तकनीकों जैसे कि डिफरेंशियल गोपनीयता या संघीय सीखने के लिए अनुकूल। उनकी डेटा कहीं भी समस्या बहुत जटिल है।
उत्पादक दृश्य मॉडल एक और कठिन मामला प्रस्तुत करते हैं। ब्लैक फॉरेस्ट लैब्स के फ्लक्स.2 जैसे सिस्टम एक सेकंड से कम समय में उच्च-रिज़ॉल्यूशन, फोटोरियलिस्टिक छवियां उत्पन्न कर सकते हैं शक्तिशाली हार्डवेयर पर, लेकिन एक छवि का उत्पादन करने के लिए पाठ की तुलना में बहुत अधिक डेटा और कंप्यूट की आवश्यकता होती है। जैसे ही दृश्य एआई रचनात्मक उपकरणों से परे औद्योगिक निरीक्षण, चिकित्सा इमेजिंग और उपग्रह विश्लेषण में आगे बढ़ता है, अंतर्निहित डेटा अक्सर बड़ा, संवेदनशील और हिलाने में मुश्किल होता है, जिससे डेटा के निवास स्थान पर एआई चलाने की आवश्यकता बढ़ जाती है।
भौतिक एआई अधिक जटिल श्रेणी है। एनवीडिया के जेंसेन हुआंग ने घोषणा की है कि “भौतिक एआई आ गया है, और हर औद्योगिक कंपनी एक रोबोटिक्स कंपनी बन जाएगी।” नए मॉडल जैसे एनवीडिया के कॉस्मोस 3 मशीनों को भौतिक दुनिया की सामान्य समझ देने के लिए सिमुलेशन, दृष्टि और तर्क को जोड़ते हैं, जबकि कंपनियां जैसे कि फिजिकल इंटेलिजेंस वास्तविक दुनिया के सेंसर डेटा – जिसमें बल, गति और दृश्य इनपुट शामिल हैं – पर रोबोट को प्रशिक्षित कर रही हैं ताकि अधिक अनुकूलनीय, स्वायत्त व्यवहार को सक्षम किया जा सके।
बड़े तर्क मॉडल में सुधार के लिए लागू की जाने वाली उसी स्केलिंग गतिविधियों को अब वास्तविक दुनिया के डेटा जैसे कि कंपन, ध्वनि और सेंसर इनपुट पर लागू किया जा रहा है। लेकिन यह जानकारी स्वाभाविक रूप से स्थानीय है। एक फैक्ट्री फ्लोर पर एक रोबोट वास्तविक समय दृश्य और स्पर्श डेटा को दूरस्थ क्लाउड में संसाधित करने के लिए नहीं भेज सकता है जिससे देरी हो सकती है जो सुरक्षा जोखिम पैदा कर सकती है, जिसका अर्थ है कि एआई को तेजी से बढ़ना चाहिए जहां डेटा उत्पन्न होता है।
विश्वास, व्याख्या, और परिणाम
यहीं पर “डेटा कहीं भी” चुनौती बुनियादी ढांचे से परे हो जाती है और एक शासन मुद्दा बन जाती है। जैसे ही एआई को उच्च-जोखिम वाले निर्णयों पर लागू किया जाता है – स्वास्थ्य सेवा निदान से लेकर वित्तीय जोखिम मॉडल तक और भौतिक नियंत्रण प्रणाली तक – डेटा के निवास स्थान के बारे में प्रश्न परिणामों के लिए जिम्मेदार कौन है, इसके साथ जुड़े हुए हैं।
आज के नियामक वातावरण में, व्याख्या वैकल्पिक नहीं है। यूरोपीय संघ के एआई अधिनियम के लिए, उदाहरण के लिए, उच्च जोखिम वाली प्रणालियों को अपने आउटपुट के लिए आधार का प्रदर्शन करने की आवश्यकता है, जो कठिन है यदि सूचित निर्णय लेने वाला डेटा विभिन्न प्रणालियों, क्षेत्राधिकारों और नियामक ढांचों में वितरित हो।
विश्वास, इसलिए, व्यापक रूप से अपनाने के लिए पूर्वापेक्षा बन जाता है। डेटा वातावरण पर नियंत्रण मॉडल खुद पर नियंत्रण के रूप में महत्वपूर्ण हो जाता है।
एआई बुनियादी ढांचे की अगली पीढ़ी
“डेटा कहीं भी” चुनौती का समाधान एआई के लिए अगले दशक के प्रतिस्पर्धी मानचित्र को परिभाषित करेगा। संघीय अनुमान, सुरक्षित डेटा-प्रोसेसिंग वातावरण, एज-ऑप्टिमाइज्ड मॉडल, और ऑर्केस्ट्रेशन सिस्टम जो डेटा को कहां रहने की अनुमति है, यह नहीं है निष्ठा तकनीकी सुविधाएं, लेकिन एआई के विस्तार के लिए पूर्वापेक्षाएं हैं जिन मामलों में डेटा को केंद्रीकृत किया जा सकता है।
वे कंपनियां और सरकारें जो बुद्धिमत्ता को डेटा तक पहुंचाने के बजाय डेटा को बुद्धिमत्ता तक ले जाने के लिए बुनियादी ढांचा बनाने में सक्षम होंगी, वे एआई युग की सबसे टिकाऊ खाई को कमांड करेंगी। एक चतुर मॉडल को प्रशिक्षित करना एक हल और कमोडिटीकृत समस्या बन गया है। इसे जिम्मेदारी से, किनारे पर, क्षेत्राधिकार की सीमाओं के पार, डेटा के खिलाफ जो हिल नहीं सकता है, यह समस्या बनी हुई है।
डेटा कहीं भी नहीं है नारा। यह उद्यम एआई में सबसे कठिन असुलझी समस्या है। और यह तय करेगा कि पिछले दशक के प्रशिक्षण निवेश द्वारा अनलॉक की गई असाधारण क्षमता क्या कभी विश्वास करने योग्य परिणामों में अनुवादित होगी जो दुनिया पर विश्वास कर सकती है।












