рд╡рд┐рдЪрд╛рд░ рдиреЗрддрд╛

рд╕рд░реНрд╡рддреНрд░ рд╕рдорд╕реНрдпрд╛: рдХреНрдпреЛрдВ “рдбреЗрдЯрд╛ рдХрд╣реАрдВ рднреА” рдПрдЖрдИ рдпреБрдЧ рдХреА рдкрд░рд┐рднрд╛рд╖рд┐рдд рдмреБрдирд┐рдпрд╛рджреА рдврд╛рдВрдЪрд╛ рдЪреБрдиреМрддреА рдмрди рд░рд╣рд╛ рд╣реИ

mm

आज एआई में सबसे महत्वपूर्ण प्रश्न यह नहीं है कि कौन सा मॉडल सबसे चतुर है। यह प्रश्न है कि डेटा कहां रहता है और क्या बुद्धिमत्ता उस तक पहुंच सकती है।

एक दशक से अधिक समय से, एआई उद्योग एक सांत्वना देने वाले तर्क पर काम कर रहा था: डेटा को केंद्रीकृत करें, कंप्यूट को केंद्रीकृत करें, और प्रतिभा इसका अनुसरण करेगी। हाइपरस्केलर मॉडल – विशाल प्रशिक्षण डेटासेट को बड़े क्लाउड क्लस्टर में केंद्रीकृत करना और उन्हें मॉडल पैरामीटर में संपीड़ित करने के लिए बड़े पैमाने पर जीपीयू कंप्यूट का उपयोग करना – असाधारण परिणाम देता है, लेकिन यह एक ऐसा ढांचा भी है जो अब अपनी सफलता के वजन के तहत संघर्ष कर रहा है।

इसे “डेटा कहीं भी” समस्या कहें। जैसे ही एआई अनुसंधान प्रयोगशाला से बाहर निकलकर अस्पतालों, कारखानों, वित्तीय संस्थानों और संप्रभु सरकारों के संचालन तंत्र में प्रवेश करता है, यह जानकारी जो इन प्रणालियों को सूचित करना चाहिए, वह स्वाभाविक रूप से वितरित, क्षेत्राधिकार से बंधी हुई और संचालन रूप से अचल है। यूरोपीय नियामक यह जोर देते हैं कि उनके नागरिकों के वित्तीय रिकॉर्ड महाद्वीप को नहीं छोड़ सकते हैं। बासेल में एक फार्मास्यूटिकल कंपनी के क्लिनिकल परीक्षण डेटा को सियोल से आने वाले जीनोमिक्स डेटासेट के साथ एक ही क्लाउड बाल्टी में सह-निवास नहीं करना चाहिए।

चाहे जो भी मामला हो, बुद्धिमत्ता को डेटा के पास जाना होगा। डेटा, जोर देकर कहते हैं, बुद्धिमत्ता के पास नहीं आएगा।

स्थानांतरण की अर्थव्यवस्था

यह संरचनात्मक तनाव एक ही समय में एआई अर्थव्यवस्था में एक क्रांति द्वारा तेज हो जाता है। उद्योग प्रशिक्षण-केंद्रित से अनुमान-केंद्रित खर्च में एक तectonic पुनर्संतुलन के माध्यम से जा रहा है, और डेटा वास्तुकला के लिए इसके परिणाम गहरे हैं।

डेलॉइट ने अनुमान लगाया कि 2025 में अनुमान कार्यभार ने सभी एआई कंप्यूट के आधे हिस्से के लिए खाता है, एक आंकड़ा जो 2026 में दो-तिहाई तक कूद जाएगा। अनुपात उलटने की गति आश्चर्यजनक है। विश्लेषकों का अनुमान है कि 2026 तक, अनुमान मांग प्रशिक्षण मांग से 118 गुना अधिक हो जाएगी। 2030 तक, अनुमान कुल एआई कंप्यूट के 75% के लिए खाता हो सकता है, जो $7 ट्रिलियन के बुनियादी ढांचे में निवेश को चला रहा है।

लागत गणित भी उतना ही विचित्र है। प्रत्येक $1 बिलियन जो एक एआई मॉडल को प्रशिक्षित करने पर खर्च किया जाता है, संगठनों को मॉडल के उत्पादन जीवनकाल में $15-20 बिलियन की अनुमान लागत का सामना करना पड़ता है: एक अनुपात जो जीपीटी -4 द्वारा कठोर रूप से चित्रित किया गया है, जिसकी प्रशिक्षण लागत लगभग $150 मिलियन थी, लेकिन संचयी अनुमान लागत 2024 के अंत तक $2.3 बिलियन तक पहुंच गई। प्रशिक्षण, एक बार एआई निवेशकों और खरीदारी अधिकारियों के लिए शीर्षलेख जुनून, को एक बार का ट्यूशन शुल्क के रूप में पुनः परिभाषित किया जा रहा है। अनुमान चलने वाली बुद्धिमत्ता की संचालन लागत है, और यह अब प्रमुख आइटम है।

फिर भी, यहाँ एक विरोधाभास है: अनुमान लागत एक जीपीटी -3.5 स्तर प्रणाली के लिए नवंबर 2022 और अक्टूबर 2024 के बीच 280 गुना से अधिक गिर गई, हार्डवेयर लागत में लगभग 30% की वार्षिक गिरावट और 40% प्रति वर्ष ऊर्जा दक्षता में सुधार के साथ। कीमतें गिरती हैं; खपत तेजी से तेज होती है। प्रति-इकाई अनुमान लागत 100 गुना गिर गई, जबकि माइक्रोसॉफ्ट और गूगल ने उस अवधि में एआई कार्यभार में 31 गुना वृद्धि की सूचना दी।

जेवोन्स पराडॉक्स, जहां दक्षता लाभ अधिक संसाधन उपयोग को चलाते हैं, ने जीपीयू क्लस्टर में एक आधुनिक अभिव्यक्ति पाई है।

जहां डेटा रहता है, बुद्धिमत्ता को उसका पालन करना चाहिए

अनुमान अर्थव्यवस्था मूलभूत रूप से बुनियादी ढांचे की आवश्यकताओं को फिर से आकार देती है, और कहीं अधिक डेटा गुरुत्वाकर्षण के आसपास। अनुमान, प्रशिक्षण के विपरीत, एक बैच नौकरी नहीं है जो एक बार एक डेटा केंद्र में चलाई जाती है। यह एक निरंतर, विलंब-संवेदनशील, भौगोलिक रूप से वितरित सेवा है, और केवल उतनी ही अच्छी है जितनी डेटा वह प्रश्न के क्षण में पहुंच सकती है।

यह “डेटा कहीं भी” चुनौती का मूल है।

उदाहरण के लिए, एक भाषा मॉडल जो एक रोगी के लाइव आईसीयू टेलीमेट्री पर तर्क कर रहा है, 200-मिलीसेकंड राउंड ट्रिप के लिए एक हाइपरस्केलर के पूर्वी तट क्लस्टर की अनुमति नहीं दे सकता है। एक वित्तीय सेवा धोखाधड़ी मॉडल जो लेनदेन के बिंदु पर अनुमान चला रहा है, जीडीपीआर का उल्लंघन करने के लिए खाता डेटा को एक क्षेत्राधिकार में निकाल नहीं सकता है। एक संप्रभु एआई तैनाती विदेशी व्यावसायिक इकाई द्वारा स्वामित्व और संचालित बुनियादी ढांचे पर आधारित नहीं हो सकती है।

अग्रिम प्रयोगशालाएं इस बात से अच्छी तरह वाकिफ हैं। एंथ्रोपिक के गूगल क्लाउड के साथ एक मिलियन टीपीयू तक के समझौते ने 2026 तक एक गिगावाट से अधिक एआई कंप्यूट क्षमता प्रदान की, जो वैश्विक बुनियादी ढांचे के नक्शे को आकार देने के लिए अग्रणी प्रयोगशालाओं द्वारा असाधारण पैमाने पर निवेश का संकेत देता है।

डेटा तीव्रता का वर्गीकरण

सभी एआई प्रणालियों का सामना इस चुनौती से समान रूप से नहीं होता है और यह विभिन्न प्रकार के एआई मॉडल और जटिलता पर विचार करने के लिए सूचित करने वाला है। आइए इसे तीन मूल उदाहरणों के साथ तोड़ दें: एलएलएम, छवि, और भौतिक मॉडल।

बड़े भाषा मॉडल – क्लाउड, जीपीटी, और जेमिनी परिवार – मुख्य रूप से भाषा टोकन में सौदा करते हैं: अपेक्षाकृत हल्के, संपीड़ित, और गोपनीयता-संरक्षण तकनीकों जैसे कि डिफरेंशियल गोपनीयता या संघीय सीखने के लिए अनुकूल। उनकी डेटा कहीं भी समस्या बहुत जटिल है।

उत्पादक दृश्य मॉडल एक और कठिन मामला प्रस्तुत करते हैं। ब्लैक फॉरेस्ट लैब्स के फ्लक्स.2 जैसे सिस्टम एक सेकंड से कम समय में उच्च-रिज़ॉल्यूशन, फोटोरियलिस्टिक छवियां उत्पन्न कर सकते हैं शक्तिशाली हार्डवेयर पर, लेकिन एक छवि का उत्पादन करने के लिए पाठ की तुलना में बहुत अधिक डेटा और कंप्यूट की आवश्यकता होती है। जैसे ही दृश्य एआई रचनात्मक उपकरणों से परे औद्योगिक निरीक्षण, चिकित्सा इमेजिंग और उपग्रह विश्लेषण में आगे बढ़ता है, अंतर्निहित डेटा अक्सर बड़ा, संवेदनशील और हिलाने में मुश्किल होता है, जिससे डेटा के निवास स्थान पर एआई चलाने की आवश्यकता बढ़ जाती है।

भौतिक एआई अधिक जटिल श्रेणी है। एनवीडिया के जेंसेन हुआंग ने घोषणा की है कि “भौतिक एआई आ गया है, और हर औद्योगिक कंपनी एक रोबोटिक्स कंपनी बन जाएगी।” नए मॉडल जैसे एनवीडिया के कॉस्मोस 3 मशीनों को भौतिक दुनिया की सामान्य समझ देने के लिए सिमुलेशन, दृष्टि और तर्क को जोड़ते हैं, जबकि कंपनियां जैसे कि फिजिकल इंटेलिजेंस वास्तविक दुनिया के सेंसर डेटा – जिसमें बल, गति और दृश्य इनपुट शामिल हैं – पर रोबोट को प्रशिक्षित कर रही हैं ताकि अधिक अनुकूलनीय, स्वायत्त व्यवहार को सक्षम किया जा सके।

बड़े तर्क मॉडल में सुधार के लिए लागू की जाने वाली उसी स्केलिंग गतिविधियों को अब वास्तविक दुनिया के डेटा जैसे कि कंपन, ध्वनि और सेंसर इनपुट पर लागू किया जा रहा है। लेकिन यह जानकारी स्वाभाविक रूप से स्थानीय है। एक फैक्ट्री फ्लोर पर एक रोबोट वास्तविक समय दृश्य और स्पर्श डेटा को दूरस्थ क्लाउड में संसाधित करने के लिए नहीं भेज सकता है जिससे देरी हो सकती है जो सुरक्षा जोखिम पैदा कर सकती है, जिसका अर्थ है कि एआई को तेजी से बढ़ना चाहिए जहां डेटा उत्पन्न होता है।

विश्वास, व्याख्या, और परिणाम

यहीं पर “डेटा कहीं भी” चुनौती बुनियादी ढांचे से परे हो जाती है और एक शासन मुद्दा बन जाती है। जैसे ही एआई को उच्च-जोखिम वाले निर्णयों पर लागू किया जाता है – स्वास्थ्य सेवा निदान से लेकर वित्तीय जोखिम मॉडल तक और भौतिक नियंत्रण प्रणाली तक – डेटा के निवास स्थान के बारे में प्रश्न परिणामों के लिए जिम्मेदार कौन है, इसके साथ जुड़े हुए हैं।

आज के नियामक वातावरण में, व्याख्या वैकल्पिक नहीं है। यूरोपीय संघ के एआई अधिनियम के लिए, उदाहरण के लिए, उच्च जोखिम वाली प्रणालियों को अपने आउटपुट के लिए आधार का प्रदर्शन करने की आवश्यकता है, जो कठिन है यदि सूचित निर्णय लेने वाला डेटा विभिन्न प्रणालियों, क्षेत्राधिकारों और नियामक ढांचों में वितरित हो।

विश्वास, इसलिए, व्यापक रूप से अपनाने के लिए पूर्वापेक्षा बन जाता है। डेटा वातावरण पर नियंत्रण मॉडल खुद पर नियंत्रण के रूप में महत्वपूर्ण हो जाता है।

एआई बुनियादी ढांचे की अगली पीढ़ी

“डेटा कहीं भी” चुनौती का समाधान एआई के लिए अगले दशक के प्रतिस्पर्धी मानचित्र को परिभाषित करेगा। संघीय अनुमान, सुरक्षित डेटा-प्रोसेसिंग वातावरण, एज-ऑप्टिमाइज्ड मॉडल, और ऑर्केस्ट्रेशन सिस्टम जो डेटा को कहां रहने की अनुमति है, यह नहीं है निष्ठा तकनीकी सुविधाएं, लेकिन एआई के विस्तार के लिए पूर्वापेक्षाएं हैं जिन मामलों में डेटा को केंद्रीकृत किया जा सकता है।

वे कंपनियां और सरकारें जो बुद्धिमत्ता को डेटा तक पहुंचाने के बजाय डेटा को बुद्धिमत्ता तक ले जाने के लिए बुनियादी ढांचा बनाने में सक्षम होंगी, वे एआई युग की सबसे टिकाऊ खाई को कमांड करेंगी। एक चतुर मॉडल को प्रशिक्षित करना एक हल और कमोडिटीकृत समस्या बन गया है। इसे जिम्मेदारी से, किनारे पर, क्षेत्राधिकार की सीमाओं के पार, डेटा के खिलाफ जो हिल नहीं सकता है, यह समस्या बनी हुई है।

डेटा कहीं भी नहीं है नारा। यह उद्यम एआई में सबसे कठिन असुलझी समस्या है। और यह तय करेगा कि पिछले दशक के प्रशिक्षण निवेश द्वारा अनलॉक की गई असाधारण क्षमता क्या कभी विश्वास करने योग्य परिणामों में अनुवादित होगी जो दुनिया पर विश्वास कर सकती है।

рдореБрдЦреНрдп рд░рдгрдиреАрддрд┐ рдЕрдзрд┐рдХрд╛рд░реА рдХреЗ рд░реВрдк рдореЗрдВ, рдЕрднрд╛рд╕ рдХреНрд▓рд╛рдЙрдбреЗрд░рд╛ рдХреЗ рд▓рд┐рдП рд╕рдордЧреНрд░ рдХреЙрд░реНрдкреЛрд░реЗрдЯ рд░рдгрдиреАрддрд┐ рдХрд╛ рдиреЗрддреГрддреНрд╡ рдХрд░рддреЗ рд╣реИрдВ рдФрд░ рдХрдВрдкрдиреА рдХреЗ рджреГрд╖реНрдЯрд┐рдХреЛрдг рдХрд╛ рдирд┐рд░реНрдорд╛рдг рдХрд░рдиреЗ, рд╡реНрдпрд╡рд╕рд╛рдп рдФрд░ рдЧреНрд░рд╛рд╣рдХ рд▓рдХреНрд╖реНрдп рдСрдкрд░реЗрдЯрд┐рдВрдЧ рдореЙрдбрд▓ рдХрд╛ рдирд┐рд░реНрдорд╛рдг рдХрд░рдиреЗ, рдкреНрд░рдореБрдЦ рд╣рд┐рддрдзрд╛рд░рдХреЛрдВ рдХреЗ рд╕рд╛рде рд╕реНрдкрд╖реНрдЯ рд░реВрдк рд╕реЗ рдкрд░рд┐рднрд╛рд╖рд┐рдд рдУрдХреЗрдЖрд░ рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗ рдЗрд╕рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рд╕рдВрд╡рд╛рдж рдХрд░рдиреЗ рдФрд░ рдЙрд╕ рдпреЛрдЬрдирд╛ рдХреЛ рдорд╣рд╕реВрд╕ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдкреНрд░рдореБрдЦ рдкрд░рд┐рд╡рд░реНрддрдирдХрд╛рд░реА рдкрд╣рд▓реЛрдВ рдХреЛ рдирд┐рд╖реНрдкрд╛рджрд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдЬрд┐рдореНрдореЗрджрд╛рд░ рд╣реИрдВред рд╡рд╣ рд╡рд┐рдХрд╛рд╕ рдФрд░ рдирд╡рд╛рдЪрд╛рд░ рдХреЛ рдмрдврд╝рд╛рд╡рд╛ рджреЗрдиреЗ рдФрд░ рдирд┐рд░реНрдорд╛рдг/рдЦрд░реАрдж рднрд╛рдЧреАрджрд╛рд░ рдирд┐рд░реНрдгрдп рд▓реЗрдиреЗ рдХреЗ рд▓рд┐рдП рднреА рдЬрд┐рдореНрдореЗрджрд╛рд░ рд╣реИ, рдЬрд┐рд╕рдореЗрдВ рдореВрд▓реНрдп рдирд┐рд░реНрдзрд╛рд░рдг рдФрд░ рдкреИрдХреЗрдЬрд┐рдВрдЧ, рдХреЙрд░реНрдкреЛрд░реЗрдЯ рд╡рд┐рдХрд╛рд╕ рдФрд░ рдХреНрд▓рд╛рдЙрдбреЗрд░рд╛ рдХреЗ рдирд╡рд╛рдЪрд╛рд░ рддреНрд╡рд░рдХ рд╢рд╛рдорд┐рд▓ рд╣реИрдВ рдЬреЛ рдирдП рдЙрддреНрдкрд╛рджреЛрдВ рдХреЛ рд▓реЙрдиреНрдЪ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рд╣реИрдВред рдЗрд╕рд╕реЗ рдкрд╣рд▓реЗ, рдЙрдиреНрд╣реЛрдВрдиреЗ рдХрдВрдкрдиреА рдореЗрдВ рдореБрдЦреНрдп рдХрд░реНрдордЪрд╛рд░реА рдФрд░ рд╡реНрдпрд╡рд╕рд╛рдп рдкрд░рд┐рд╡рд░реНрддрди рдХреЗ рд▓рд┐рдП рдЙрдкрд╛рдзреНрдпрдХреНрд╖ рдХреЗ рд░реВрдк рдореЗрдВ рдХрд╛рд░реНрдп рдХрд┐рдпрд╛ рдерд╛ред

рдХреНрд▓рд╛рдЙрдбреЗрд░рд╛/рд╣реЙрд░реНрдЯрдирд╡рд░реНрдХреНрд╕ рд╡рд┐рд▓рдп рд╕реЗ рдкрд╣рд▓реЗ, рдЙрдиреНрд╣реЛрдВрдиреЗ рд╡реИрд╢реНрд╡рд┐рдХ рдкреНрд░рдореБрдЦ рдЧреНрд░рд╛рд╣рдХ рдирд╡рд╛рдЪрд╛рд░ рдФрд░ рдореВрд▓реНрдп рдкреНрд░рдмрдВрдзрди рдХреЗ рд░реВрдк рдореЗрдВ рд╣реЙрд░реНрдЯрдирд╡рд░реНрдХреНрд╕ рдХреЗ рдмрд╛рдЬрд╛рд░ рдореЗрдВ рдкреНрд░рдпрд╛рд╕реЛрдВ рдХреЛ рдмрдврд╝рд╛рдиреЗ рдореЗрдВ рдорджрдж рдХреАред рдПрдХ рдкреНрд░рдмрдВрдзрди рд╕рд▓рд╛рд╣рдХрд╛рд░ рдХреЗ рд░реВрдк рдореЗрдВ рдкреНрд░рд╢рд┐рдХреНрд╖рд┐рдд, рд╡рд╣ рд╕рдорд╛рдЬ рдореЗрдВ рдХрд╛рд░реНрд░рд╡рд╛рдИ рдФрд░ рдкрд░рд┐рд╡рд░реНрддрди рдХреЛ рдмрдврд╝рд╛рд╡рд╛ рджреЗрдиреЗ рдХреЗ рд▓рд┐рдП рдЙрддреНрд╕рд╛рд╣рд┐рдд рд╣реИрдВ рдФрд░ рд╡рд┐рд╢реНрд╡ рдЖрд░реНрдерд┐рдХ рдордВрдЪ, рдлрд╛рдЙрдВрдбрд░реНрд╕ рдСрдл рдж рдлреНрдпреВрдЪрд░ рдФрд░ рдЕрдиреНрдп рдЧреИрд░-рд▓рд╛рднрдХрд╛рд░реА рд╕рдВрдЧрдардиреЛрдВ рд╕рд╣рд┐рдд рдХрдИ рд╕рдВрдЧрдардиреЛрдВ рдХреЗ рд╕рд╛рде рдкрд░рд┐рдпреЛрдЬрдирд╛рдУрдВ рдХрд╛ рдиреЗрддреГрддреНрд╡ рдХрд┐рдпрд╛ рд╣реИред