рд╡рд┐рдЪрд╛рд░ рдиреЗрддрд╛
рдЧреЗрдо-рдЬреЗрдирд░реЗрдЯреЗрдб рдбреЗрдЯрд╛ рдПрдЖрдИ рдкреНрд░рд╢рд┐рдХреНрд╖рдг рдореЗрдВ рд╕рдмрд╕реЗ рдХрдо рдореВрд▓реНрдп рд╡рд╛рд▓рд╛ рд╕рдВрд╕рд╛рдзрди рд╣реЛ рд╕рдХрддрд╛ рд╣реИ

एआई कंपनियों ने पिछले पांच वर्षों में इंटरनेट पर उपलब्ध प्रत्येक पाठ, प्रत्येक छवि, और प्रत्येक टुकड़े को खा लिया है। वह आपूर्ति सीमित है, और हम उस बिंदु के करीब आ रहे हैं जहां बस पर्याप्त डेटा नहीं बचा है जो उस प्रगति की गति को बनाए रखने के लिए पर्याप्त हो जिस पर यह निर्भर हो गया है।
हालांकि, एआई उद्योग द्वारा बड़े पैमाने पर उपेक्षित एक स्पष्ट उम्मीदवार है।
मैं जीवनयापन के लिए गेम सिस्टम बनाता हूं, और जो डेटा उनमें से प्रत्येक दिन बहता है वह अधिकांश एआई शोधकर्ताओं के लिए कुछ भी नहीं है। और फिर भी गेमिंग के बाहर लगभग कोई भी इस पर ध्यान नहीं दे रहा है।
गेमिंग प्लेटफ़ॉर्म प्रतिदिन व्यवहारिक डेटा के टेराबाइट्स का उत्पादन करते हैं, वास्तविक समय के निर्णयों, आर्थिक गतिविधि और सामाजिक परस्पर क्रिया के संरचित प्रवाह, सभी सुसंगत भौतिक नियमों पर आधारित वातावरण में।
इस डेटा का लगभग कोई हिस्सा एआई प्रशिक्षण के लिए उपयोग नहीं किया गया है। और जिन कंपनियों ने इसका उपयोग किया है, डीपमाइंड से लेकर एनवीडिया तक, उन्होंने क्षेत्र में कुछ सबसे महत्वपूर्ण सफलता हासिल की है।
एआई की डेटा समस्या
एपोक एआई से एक अध्ययन प्रोजेक्ट करता है कि मानव-उत्पन्न पाठ डेटा का स्टॉक 2026 और 2032 के बीच कहीं पूरी तरह से उपयोग किया जाएगा। चैटजीपीटी, जेमिनी और क्लाउड के पीछे के मॉडल ने पहले से ही इंटरनेट पर लगभग सब कुछ खा लिया है।
सिंथेटिक डेटा या एआई द्वारा उत्पन्न पाठ जो एआई में वापस फीड करने के लिए है उद्योग का गो-टू वर्कअराउंड है। लेकिन अपने स्वयं के आउटपुट पर प्रशिक्षित मॉडल समय के साथ एक दस्तावेज़ घटना के माध्यम से बिगड़ जाते हैं जिसे शोधकर्ता मॉडल कollapse कहते हैं।
मुझे लगता है कि क्षेत्र को जो चाहिए वह एक समृद्ध, इंटरैक्टिव, मल्टीमॉडल जानकारी है जहां कारण और प्रभाव वास्तविक समय में होते हैं और प्रत्येक क्रिया का एक मापनीय परिणाम होता है। गेम्स यही उत्पादन करते हैं, और वे इसे लगभग किसी और चीज़ के मुकाबले मेल खाते हैं।
गेमिंग प्लेटफ़ॉर्म अपने सिस्टम के माध्यम से प्रतिदिन व्यवहारिक डेटा के टेराबाइट्स को धक्का देते हैं। खिलाड़ी आंदोलन, रणनीतिक विकल्प, प्रतिक्रिया समय, आर्थिक लेनदेन और सामाजिक परस्पर क्रिया सभी संरचित, समय-समय पर धाराओं के माध्यम से बहते हैं जिन्हें अधिकांश एआई शोधकर्ताओं ने कभी नहीं छुआ है।
गेम-जेनरेटेड डेटा पर एक हालिया अकादमिक पेपर बाहर एक नौ-श्रेणी की टैक्सोनॉमी इस जानकारी को रखता है और तर्क देता है कि इसका अधिकांश हिस्सा एआई उद्योग द्वारा पूरी तरह से अनदेखा किया जाता है।
मैं अपने अनुभव से इसकी पुष्टि कर सकता हूं। किसी भी दिन हमारे गेम सिस्टम के माध्यम से बहने वाला डेटा की मात्रा को किसी अन्य एआई शोध क्षेत्र में सोने की खान माना जाएगा। गेम्स में, यह बस संग्रहीत या त्याग दिया जाता है।
गेम डेटा क्यों अलग है
जब आप लंबे समय तक गेम इंजन के अंदर बनाते हैं, तो आपको एहसास होने लगता है कि आपके पास कितना संरचित डेटा है जिसे एआई में कोई नहीं मांगता है। प्रत्येक सत्र सिंक्रोनाइज़ भौतिकी, खिलाड़ी व्यवहार और सिस्टम-स्तरीय कारण और प्रभाव का उत्पादन करता है, जो किसी और जगह पर मिलना मुश्किल है।
गेम इंजन भौतिकी को लागू करते हैं। वस्तुएं नियमित नियमों के अनुसार गिरती हैं, टकराती हैं और टूट जाती हैं, जिसका अर्थ है कि डेटा में कारण संबंध शामिल होते हैं जो मॉडल को अनुमान लगाने के लिए पैटर्न के बजाय सिस्टम स्तर पर बेक किए जाते हैं।
जब एक खिलाड़ी एक प्रक्षेप्य लॉन्च करता है, तो इंजन ट्रेजेक्टरी, हवा के प्रतिरोध और प्रभाव की गणना करता है। एआई एक ऐसे वातावरण से सीखता है जो प्रत्येक परस्पर क्रिया के माध्यम से भौतिकी को सीधे प्रदर्शित करता है, न कि एक ऐसे वातावरण में जो भौतिक कानूनों को सांख्यिकीय अनुमान के रूप में मानता है।
मल्टीमॉडल संरेखण समस्या भी है। एक गेम में, दृश्य डेटा, ऑडियो संकेत, खिलाड़ी इनपुट और पर्यावरण राज्य सभी एक साथ होते हैं और एक साथ लॉग किए जाते हैं। उस तरह की प्राकृतिक संरेखण को दोहराने के लिए वास्तविक दुनिया के डेटासेट में, शोधकर्ताओं को आमतौर पर प्रत्येक मॉडलिटी को हाथ से लेबल और संरेखित करना पड़ता है।
गेम प्रक्रियात्मक सामग्री जनरेशन के माध्यम से पैमाने पर एज केस भी उत्पन्न करते हैं। नो मैन्स स्काई में 18 क्विंटिलियन अनोखे ग्रह हैं, और एआई के लिए, वह परिवर्तनशीलता बहुत महत्वपूर्ण है क्योंकि एज केस यह निर्धारित करते हैं कि एक मॉडल विश्वसनीय रूप से काम करता है या खतरनाक रूप से विफल रहता है।
और फिर उभरने वाली जटिलता है, जो शायद सबसे मूल्यवान गुण है। जब ओपनएआई एक सरल छिपने-छिपाने के खेल में एजेंटों को रखा, तो उन एजेंटों ने पूरी तरह से स्वयं छह विशिष्ट चरणों की जटिल रणनीति विकसित की सैकड़ों लाखों राउंड के दौरान।
उन्होंने चलने वाली वस्तुओं से आश्रय बनाए, रैंप का उपयोग किलेबंदी को भंग करने के लिए किया, और यहां तक कि भौतिकी ग्लिच का फायदा उठाकर दीवारों पर बक्से को सर्फ करने के लिए भी। इसमें से कुछ भी प्रोग्राम नहीं किया गया था। यह सभी गेम पर्यावरण के भीतर प्रतिस्पर्धा से उभरा, बिना एक भी कोड के जिसने उन्हें ऐसा करने के लिए कहा।
एआई शोध में उस तरह की स्व-प्रेरित जटिलता स्केल पर आवश्यक है, और गेम्स ही ऐसे वातावरण हैं जो इसे विश्वसनीय रूप से और महंगी मानव पर्यवेक्षण के बिना उत्पन्न करते हैं।
गेम बोर्ड से नोबेल पुरस्कार तक
गेम-ट्रेंड एआई का वास्तविक दुनिया में स्थानांतरण का सबसे स्पष्ट प्रमाण एक प्रणाली है जिसने नोबेल पुरस्कार जीता है, और यह वह उदाहरण है जिसे मैं लोगों से बात करते हुए वापस आता हूं जब वे मुझसे पूछते हैं कि मैंने अपना करियर गेम्स और एआई के चारों ओर क्यों बनाया।
डीपमाइंड ने 2016 में अल्फागो के साथ शुरू किया, फिर अल्फाजीरो बनाया, जिसने बिना किसी मानव ज्ञान के शतरंज, गो और शोगी सिखाया। अल्फाजीरो की आर्किटेक्चर अल्फाफोल्ड के लिए आधार बन गई, जिसने सुलझाया 50 वर्ष पुरानी प्रोटीन फोल्डिंग समस्या और इसके निर्माताओं को 2024 में रसायन विज्ञान में नोबेल पुरस्कार से सम्मानित किया गया।
डीपमाइंड के सीईओ डेमिस हассाबिस इस पाइपलाइन के बारे में खुले हैं। उन्होंने बताया वैज्ञानिक अमेरिकी कि गेम्स कभी अंतिम लक्ष्य नहीं थे बल्कि एआई तकनीकों को विकसित करने और परीक्षण करने का सबसे कुशल तरीका था trước कि वह उन्हें वास्तविक वैज्ञानिक समस्याओं पर लागू करे।
मुझे याद है कि मैंने यह पढ़ा और महसूस किया कि किसी ने ठीक वही व्यक्त किया है जो मैं वर्षों से गेम विकास के अंदर से देख रहा था।
उस ट्रेजेक्टरी ने तब से क्षेत्र भर में दोहराया है। ओपनएआई द्वारा पहले मानकीकृत जिमनासियम के माध्यम से प्रबलित लर्निंग वातावरण अब रोबोटिक्स, स्वायत्त वाहनों और औद्योगिक स्वचालन में शोध का आधार बनते हैं।
एजेंट, पर्यावरण, क्रिया और पुरस्कार की गेम जैसी संरचना शोध सुविधा के रूप में शुरू हुई और अब किसी भी एआई सिस्टम के लिए डिफ़ॉल्ट फ्रेमवर्क बन गई है जिसे भौतिक दुनिया में कार्य करने की आवश्यकता है।
गेम्स के रूप में नया सिम्युलेशन परत
दिसंबर 2025 में, एनवीडिया नाइट्रोजन को जारी किया, जो 1,000 से अधिक खिताबों में 40,000 घंटे के गेमप्ले पर प्रशिक्षित एक फाउंडेशन मॉडल है। मॉडल सार्वजनिक रूप से उपलब्ध गेमप्ले वीडियो देखता है, कंट्रोलर ओवरले से खिलाड़ी क्रियाओं को निकालता है और सीधे कच्चे पिक्सल से गेम खेलना सीखता है।
देखे गए गेम पर जो उसने पहले कभी नहीं देखा था, नाइट्रोजन दिखाया कार्य सफलता में 52% की वृद्धि दिखाई दी, जो मॉडल की तुलना में स्क्रैच से प्रशिक्षित मॉडल से अधिक है। लेकिन वास्तविक महत्व आर्किटेक्चर के नीचे है।
नाइट्रोजन एनवीडिया के जीआर 00 टी रोबोटिक्स फ्रेमवर्क पर चलता है, जो कंपनी इसके आइजैक सिम प्लेटफ़ॉर्म में शारीरिक एआई और सिम-टू-रियल ट्रांसफर के लिए उपयोग करती है। गेमिंग एजेंट और फैक्ट्री रोबोट एक ही अंतर्निहित सिस्टम साझा करते हैं।
एनवीडिया के जिम फैन ने परियोजना को “एक जीपीटी के लिए क्रियाओं” बनाने के प्रयास के रूप में वर्णित किया, एक सामान्य-उद्देश्य मॉडल जो किसी भी वातावरण में संचालित करना सीखता है।
जो कोई मॉडल का उपभोग करता है उन डेटा का उत्पादन करने वाले गेम सिस्टम बनाता है, मैं इस उद्योग के लिए इसका क्या मतलब है यह बताने में असमर्थ हूं।
और यह केवल एनवीडिया तक सीमित नहीं है। वेमो ने लॉग किया है 20 अरब से अधिक सिम्युलेटेड मील अपने स्वायत्त वाहनों को प्रशिक्षित करने के लिए, सभी गेम-इंजन शैली के वातावरण में जो दुर्घटनाओं को रिहर्स करते हैं जो वास्तविक सड़कों पर परीक्षण करने के लिए बहुत खतरनाक या दुर्लभ हैं।
सर्जिकल प्लेटफ़ॉर्म जो गेम इंजन पर बने हैं, प्रशिक्षुओं के प्रदर्शन में नाटकीय सुधार दिखा रहे हैं। शहरी योजनाकार शहर के पैमाने पर यातायात अनुकूलन के लिए समान उपकरण का उपयोग करते हैं।
सर्जिकल प्लेटफ़ॉर्म जो गेम इंजन पर बने हैं, प्रशिक्षुओं के प्रदर्शन में नाटकीय सुधार दिखा रहे हैं। शहरी योजनाकार शहर के पैमाने पर यातायात अनुकूलन के लिए समान उपकरण का उपयोग करते हैं। गेम इंजन एक सार्वभौमिक सिम्युलेशन परत बन गया है जहां भी एआई को अपने वातावरण के साथ परस्पर क्रिया के माध्यम से सीखने की आवश्यकता होती है।
कोई भी बात नहीं करने वाला बुनियादी ढांचा
जब लोग एआई इंफ्रास्ट्रक्चर पर चर्चा करते हैं, तो वे आमतौर पर डेटा सेंटर, जीपीयू क्लस्टर और कंप्यूट का मतलब रखते हैं। मैंने जितने वर्षों से गेम्स में काम किया है, मैं उन लोगों की संख्या को एक हाथ से गिन सकता हूं जिन्होंने एआई स्थान में गेम वातावरण का उल्लेख किया है। यह डिस्कनेक्ट जल्द ही बहुत तेजी से बंद हो जाएगा।
यह तब और भी स्पष्ट हो जाएगा जब पारंपरिक डेटासेट सूख जाएंगे। जो उद्योग समृद्ध इंटरैक्टिव डेटा का उत्पादन करते हैं वे अनिवार्य रूप से एआई शोध के केंद्र में स्थानांतरित हो जाएंगे, और गेम, सिमुलेशन और वर्चुअल दुनिया किसी और चीज़ की तुलना में इस अंतर को भरने के लिए बेहतर स्थिति में हैं।
पैसा पहले से ही इस रुझान का पालन कर रहा है। गेमिंग क्षेत्र में एआई 2025 में 4.54 अरब डॉलर का मूल्य था और 2035 तक 81 अरब डॉलर तक पहुंचने का अनुमान है।
मैं जिन अधिकांश गेम स्टूडियो से बात करता हूं वे अभी भी खुद को मनोरंजन कंपनियों के रूप में मानते हैं। लेकिन जब आपके सिस्टम अगली पीढ़ी के एआई मॉडल को प्रशिक्षित करने के लिए आवश्यक डेटा का सटीक उत्पादन करते हैं, तो आप बुनियादी ढांचे के व्यवसाय में हैं चाहे आप ऐसा करने की योजना बनाएं या नहीं।












