Connect with us

рдЧреЗрдо-рдЬреЗрдирд░реЗрдЯреЗрдб рдбреЗрдЯрд╛ рдПрдЖрдИ рдкреНрд░рд╢рд┐рдХреНрд╖рдг рдореЗрдВ рд╕рдмрд╕реЗ рдХрдо рдореВрд▓реНрдп рд╡рд╛рд▓рд╛ рд╕рдВрд╕рд╛рдзрди рд╣реЛ рд╕рдХрддрд╛ рд╣реИ

рд╡рд┐рдЪрд╛рд░ рдиреЗрддрд╛

рдЧреЗрдо-рдЬреЗрдирд░реЗрдЯреЗрдб рдбреЗрдЯрд╛ рдПрдЖрдИ рдкреНрд░рд╢рд┐рдХреНрд╖рдг рдореЗрдВ рд╕рдмрд╕реЗ рдХрдо рдореВрд▓реНрдп рд╡рд╛рд▓рд╛ рд╕рдВрд╕рд╛рдзрди рд╣реЛ рд╕рдХрддрд╛ рд╣реИ

mm

एआई कंपनियों ने पिछले पांच वर्षों में इंटरनेट पर उपलब्ध प्रत्येक पाठ, प्रत्येक छवि, और प्रत्येक टुकड़े को खा लिया है। वह आपूर्ति सीमित है, और हम उस बिंदु के करीब आ रहे हैं जहां बस पर्याप्त डेटा नहीं बचा है जो उस प्रगति की गति को बनाए रखने के लिए पर्याप्त हो जिस पर यह निर्भर हो गया है।

हालांकि, एआई उद्योग द्वारा बड़े पैमाने पर उपेक्षित एक स्पष्ट उम्मीदवार है।

मैं जीवनयापन के लिए गेम सिस्टम बनाता हूं, और जो डेटा उनमें से प्रत्येक दिन बहता है वह अधिकांश एआई शोधकर्ताओं के लिए कुछ भी नहीं है। और फिर भी गेमिंग के बाहर लगभग कोई भी इस पर ध्यान नहीं दे रहा है।

गेमिंग प्लेटफ़ॉर्म प्रतिदिन व्यवहारिक डेटा के टेराबाइट्स का उत्पादन करते हैं, वास्तविक समय के निर्णयों, आर्थिक गतिविधि और सामाजिक परस्पर क्रिया के संरचित प्रवाह, सभी सुसंगत भौतिक नियमों पर आधारित वातावरण में।

इस डेटा का लगभग कोई हिस्सा एआई प्रशिक्षण के लिए उपयोग नहीं किया गया है। और जिन कंपनियों ने इसका उपयोग किया है, डीपमाइंड से लेकर एनवीडिया तक, उन्होंने क्षेत्र में कुछ सबसे महत्वपूर्ण सफलता हासिल की है।

एआई की डेटा समस्या

एपोक एआई से एक अध्ययन प्रोजेक्ट करता है कि मानव-उत्पन्न पाठ डेटा का स्टॉक 2026 और 2032 के बीच कहीं पूरी तरह से उपयोग किया जाएगा। चैटजीपीटी, जेमिनी और क्लाउड के पीछे के मॉडल ने पहले से ही इंटरनेट पर लगभग सब कुछ खा लिया है।

सिंथेटिक डेटा या एआई द्वारा उत्पन्न पाठ जो एआई में वापस फीड करने के लिए है उद्योग का गो-टू वर्कअराउंड है। लेकिन अपने स्वयं के आउटपुट पर प्रशिक्षित मॉडल समय के साथ एक दस्तावेज़ घटना के माध्यम से बिगड़ जाते हैं जिसे शोधकर्ता मॉडल कollapse कहते हैं।

मुझे लगता है कि क्षेत्र को जो चाहिए वह एक समृद्ध, इंटरैक्टिव, मल्टीमॉडल जानकारी है जहां कारण और प्रभाव वास्तविक समय में होते हैं और प्रत्येक क्रिया का एक मापनीय परिणाम होता है। गेम्स यही उत्पादन करते हैं, और वे इसे लगभग किसी और चीज़ के मुकाबले मेल खाते हैं।

गेमिंग प्लेटफ़ॉर्म अपने सिस्टम के माध्यम से प्रतिदिन व्यवहारिक डेटा के टेराबाइट्स को धक्का देते हैं। खिलाड़ी आंदोलन, रणनीतिक विकल्प, प्रतिक्रिया समय, आर्थिक लेनदेन और सामाजिक परस्पर क्रिया सभी संरचित, समय-समय पर धाराओं के माध्यम से बहते हैं जिन्हें अधिकांश एआई शोधकर्ताओं ने कभी नहीं छुआ है।

गेम-जेनरेटेड डेटा पर एक हालिया अकादमिक पेपर बाहर एक नौ-श्रेणी की टैक्सोनॉमी इस जानकारी को रखता है और तर्क देता है कि इसका अधिकांश हिस्सा एआई उद्योग द्वारा पूरी तरह से अनदेखा किया जाता है।

मैं अपने अनुभव से इसकी पुष्टि कर सकता हूं। किसी भी दिन हमारे गेम सिस्टम के माध्यम से बहने वाला डेटा की मात्रा को किसी अन्य एआई शोध क्षेत्र में सोने की खान माना जाएगा। गेम्स में, यह बस संग्रहीत या त्याग दिया जाता है।

गेम डेटा क्यों अलग है

जब आप लंबे समय तक गेम इंजन के अंदर बनाते हैं, तो आपको एहसास होने लगता है कि आपके पास कितना संरचित डेटा है जिसे एआई में कोई नहीं मांगता है। प्रत्येक सत्र सिंक्रोनाइज़ भौतिकी, खिलाड़ी व्यवहार और सिस्टम-स्तरीय कारण और प्रभाव का उत्पादन करता है, जो किसी और जगह पर मिलना मुश्किल है।

गेम इंजन भौतिकी को लागू करते हैं। वस्तुएं नियमित नियमों के अनुसार गिरती हैं, टकराती हैं और टूट जाती हैं, जिसका अर्थ है कि डेटा में कारण संबंध शामिल होते हैं जो मॉडल को अनुमान लगाने के लिए पैटर्न के बजाय सिस्टम स्तर पर बेक किए जाते हैं।

जब एक खिलाड़ी एक प्रक्षेप्य लॉन्च करता है, तो इंजन ट्रेजेक्टरी, हवा के प्रतिरोध और प्रभाव की गणना करता है। एआई एक ऐसे वातावरण से सीखता है जो प्रत्येक परस्पर क्रिया के माध्यम से भौतिकी को सीधे प्रदर्शित करता है, न कि एक ऐसे वातावरण में जो भौतिक कानूनों को सांख्यिकीय अनुमान के रूप में मानता है।

मल्टीमॉडल संरेखण समस्या भी है। एक गेम में, दृश्य डेटा, ऑडियो संकेत, खिलाड़ी इनपुट और पर्यावरण राज्य सभी एक साथ होते हैं और एक साथ लॉग किए जाते हैं। उस तरह की प्राकृतिक संरेखण को दोहराने के लिए वास्तविक दुनिया के डेटासेट में, शोधकर्ताओं को आमतौर पर प्रत्येक मॉडलिटी को हाथ से लेबल और संरेखित करना पड़ता है।

गेम प्रक्रियात्मक सामग्री जनरेशन के माध्यम से पैमाने पर एज केस भी उत्पन्न करते हैं। नो मैन्स स्काई में 18 क्विंटिलियन अनोखे ग्रह हैं, और एआई के लिए, वह परिवर्तनशीलता बहुत महत्वपूर्ण है क्योंकि एज केस यह निर्धारित करते हैं कि एक मॉडल विश्वसनीय रूप से काम करता है या खतरनाक रूप से विफल रहता है।

और फिर उभरने वाली जटिलता है, जो शायद सबसे मूल्यवान गुण है। जब ओपनएआई एक सरल छिपने-छिपाने के खेल में एजेंटों को रखा, तो उन एजेंटों ने पूरी तरह से स्वयं छह विशिष्ट चरणों की जटिल रणनीति विकसित की सैकड़ों लाखों राउंड के दौरान।

उन्होंने चलने वाली वस्तुओं से आश्रय बनाए, रैंप का उपयोग किलेबंदी को भंग करने के लिए किया, और यहां तक ​​कि भौतिकी ग्लिच का फायदा उठाकर दीवारों पर बक्से को सर्फ करने के लिए भी। इसमें से कुछ भी प्रोग्राम नहीं किया गया था। यह सभी गेम पर्यावरण के भीतर प्रतिस्पर्धा से उभरा, बिना एक भी कोड के जिसने उन्हें ऐसा करने के लिए कहा।

एआई शोध में उस तरह की स्व-प्रेरित जटिलता स्केल पर आवश्यक है, और गेम्स ही ऐसे वातावरण हैं जो इसे विश्वसनीय रूप से और महंगी मानव पर्यवेक्षण के बिना उत्पन्न करते हैं।

गेम बोर्ड से नोबेल पुरस्कार तक

गेम-ट्रेंड एआई का वास्तविक दुनिया में स्थानांतरण का सबसे स्पष्ट प्रमाण एक प्रणाली है जिसने नोबेल पुरस्कार जीता है, और यह वह उदाहरण है जिसे मैं लोगों से बात करते हुए वापस आता हूं जब वे मुझसे पूछते हैं कि मैंने अपना करियर गेम्स और एआई के चारों ओर क्यों बनाया।

डीपमाइंड ने 2016 में अल्फागो के साथ शुरू किया, फिर अल्फाजीरो बनाया, जिसने बिना किसी मानव ज्ञान के शतरंज, गो और शोगी सिखाया। अल्फाजीरो की आर्किटेक्चर अल्फाफोल्ड के लिए आधार बन गई, जिसने सुलझाया 50 वर्ष पुरानी प्रोटीन फोल्डिंग समस्या और इसके निर्माताओं को 2024 में रसायन विज्ञान में नोबेल पुरस्कार से सम्मानित किया गया।

डीपमाइंड के सीईओ डेमिस हассाबिस इस पाइपलाइन के बारे में खुले हैं। उन्होंने बताया वैज्ञानिक अमेरिकी कि गेम्स कभी अंतिम लक्ष्य नहीं थे बल्कि एआई तकनीकों को विकसित करने और परीक्षण करने का सबसे कुशल तरीका था trước कि वह उन्हें वास्तविक वैज्ञानिक समस्याओं पर लागू करे।

मुझे याद है कि मैंने यह पढ़ा और महसूस किया कि किसी ने ठीक वही व्यक्त किया है जो मैं वर्षों से गेम विकास के अंदर से देख रहा था।

उस ट्रेजेक्टरी ने तब से क्षेत्र भर में दोहराया है। ओपनएआई द्वारा पहले मानकीकृत जिमनासियम के माध्यम से प्रबलित लर्निंग वातावरण अब रोबोटिक्स, स्वायत्त वाहनों और औद्योगिक स्वचालन में शोध का आधार बनते हैं।

एजेंट, पर्यावरण, क्रिया और पुरस्कार की गेम जैसी संरचना शोध सुविधा के रूप में शुरू हुई और अब किसी भी एआई सिस्टम के लिए डिफ़ॉल्ट फ्रेमवर्क बन गई है जिसे भौतिक दुनिया में कार्य करने की आवश्यकता है।

गेम्स के रूप में नया सिम्युलेशन परत

दिसंबर 2025 में, एनवीडिया नाइट्रोजन को जारी किया, जो 1,000 से अधिक खिताबों में 40,000 घंटे के गेमप्ले पर प्रशिक्षित एक फाउंडेशन मॉडल है। मॉडल सार्वजनिक रूप से उपलब्ध गेमप्ले वीडियो देखता है, कंट्रोलर ओवरले से खिलाड़ी क्रियाओं को निकालता है और सीधे कच्चे पिक्सल से गेम खेलना सीखता है।

देखे गए गेम पर जो उसने पहले कभी नहीं देखा था, नाइट्रोजन दिखाया कार्य सफलता में 52% की वृद्धि दिखाई दी, जो मॉडल की तुलना में स्क्रैच से प्रशिक्षित मॉडल से अधिक है। लेकिन वास्तविक महत्व आर्किटेक्चर के नीचे है।

नाइट्रोजन एनवीडिया के जीआर 00 टी रोबोटिक्स फ्रेमवर्क पर चलता है, जो कंपनी इसके आइजैक सिम प्लेटफ़ॉर्म में शारीरिक एआई और सिम-टू-रियल ट्रांसफर के लिए उपयोग करती है। गेमिंग एजेंट और फैक्ट्री रोबोट एक ही अंतर्निहित सिस्टम साझा करते हैं।

एनवीडिया के जिम फैन ने परियोजना को “एक जीपीटी के लिए क्रियाओं” बनाने के प्रयास के रूप में वर्णित किया, एक सामान्य-उद्देश्य मॉडल जो किसी भी वातावरण में संचालित करना सीखता है।

जो कोई मॉडल का उपभोग करता है उन डेटा का उत्पादन करने वाले गेम सिस्टम बनाता है, मैं इस उद्योग के लिए इसका क्या मतलब है यह बताने में असमर्थ हूं।

और यह केवल एनवीडिया तक सीमित नहीं है। वेमो ने लॉग किया है 20 अरब से अधिक सिम्युलेटेड मील अपने स्वायत्त वाहनों को प्रशिक्षित करने के लिए, सभी गेम-इंजन शैली के वातावरण में जो दुर्घटनाओं को रिहर्स करते हैं जो वास्तविक सड़कों पर परीक्षण करने के लिए बहुत खतरनाक या दुर्लभ हैं।

सर्जिकल प्लेटफ़ॉर्म जो गेम इंजन पर बने हैं, प्रशिक्षुओं के प्रदर्शन में नाटकीय सुधार दिखा रहे हैं। शहरी योजनाकार शहर के पैमाने पर यातायात अनुकूलन के लिए समान उपकरण का उपयोग करते हैं।

सर्जिकल प्लेटफ़ॉर्म जो गेम इंजन पर बने हैं, प्रशिक्षुओं के प्रदर्शन में नाटकीय सुधार दिखा रहे हैं। शहरी योजनाकार शहर के पैमाने पर यातायात अनुकूलन के लिए समान उपकरण का उपयोग करते हैं। गेम इंजन एक सार्वभौमिक सिम्युलेशन परत बन गया है जहां भी एआई को अपने वातावरण के साथ परस्पर क्रिया के माध्यम से सीखने की आवश्यकता होती है।

कोई भी बात नहीं करने वाला बुनियादी ढांचा

जब लोग एआई इंफ्रास्ट्रक्चर पर चर्चा करते हैं, तो वे आमतौर पर डेटा सेंटर, जीपीयू क्लस्टर और कंप्यूट का मतलब रखते हैं। मैंने जितने वर्षों से गेम्स में काम किया है, मैं उन लोगों की संख्या को एक हाथ से गिन सकता हूं जिन्होंने एआई स्थान में गेम वातावरण का उल्लेख किया है। यह डिस्कनेक्ट जल्द ही बहुत तेजी से बंद हो जाएगा।

यह तब और भी स्पष्ट हो जाएगा जब पारंपरिक डेटासेट सूख जाएंगे। जो उद्योग समृद्ध इंटरैक्टिव डेटा का उत्पादन करते हैं वे अनिवार्य रूप से एआई शोध के केंद्र में स्थानांतरित हो जाएंगे, और गेम, सिमुलेशन और वर्चुअल दुनिया किसी और चीज़ की तुलना में इस अंतर को भरने के लिए बेहतर स्थिति में हैं।

पैसा पहले से ही इस रुझान का पालन कर रहा है। गेमिंग क्षेत्र में एआई 2025 में 4.54 अरब डॉलर का मूल्य था और 2035 तक 81 अरब डॉलर तक पहुंचने का अनुमान है।

मैं जिन अधिकांश गेम स्टूडियो से बात करता हूं वे अभी भी खुद को मनोरंजन कंपनियों के रूप में मानते हैं। लेकिन जब आपके सिस्टम अगली पीढ़ी के एआई मॉडल को प्रशिक्षित करने के लिए आवश्यक डेटा का सटीक उत्पादन करते हैं, तो आप बुनियादी ढांचे के व्यवसाय में हैं चाहे आप ऐसा करने की योजना बनाएं या नहीं।

рдЗрд▓рдорд╛рди рд╢рд╛рдЬрд╝рд╛рдПрд╡ рдбрд┐рдЬрд╝реНрдЬрд╝рд╛рд░реИрдХреНрдЯ рдХреЗ рд╕рдВрд╕реНрдерд╛рдкрдХ рдФрд░ рд╕реАрдИрдУ рд╣реИрдВ, Dizzaract рдореЗрдВ рдореЗрдирд╛ рдХреНрд╖реЗрддреНрд░ рдХрд╛ рд╕рдмрд╕реЗ рдмрдбрд╝рд╛ рдЧреЗрдорд┐рдВрдЧ рд╕реНрдЯреВрдбрд┐рдпреЛ рд╣реИред рд╡рд╣ рдПрдХ рдПрдЖрдИ рд╢реЛрдзрдХрд░реНрддрд╛ рдФрд░ рд╕рдВрдпреБрдХреНрдд рд░рд╛рд╖реНрдЯреНрд░ рд╡рд┐рд╢реЗрд╖рдЬреНрдЮ рд╣реИрдВ рдЬреЛ рдпреВрдПрдирдУрдбреАрд╕реА рдХрд╛рд░реНрдпрдХреНрд░рдо рдХреЗ рддрд╣рдд рдХреГрддреНрд░рд┐рдо рдмреБрджреНрдзрд┐рдорддреНрддрд╛ рдФрд░ рд╡рд╛рд╕реНрддрд╡рд┐рдХ рджреБрдирд┐рдпрд╛ рдХреЗ рдкреНрд░рднрд╛рд╡ рдХреЗ рдмреАрдЪ рдХрд╛рдо рдХрд░рддреЗ рд╣реИрдВред

рд╡рд┐рдЬреНрдЮрд╛рдкрди рдкреНрд░рдХрдЯреАрдХрд░рдг: Unite.AI рд╕рдЯреАрдХ рдЬрд╛рдирдХрд╛рд░реА рдФрд░ рд╕рдорд╛рдЪрд╛рд░ рдкреНрд░рджрд╛рди рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдХрдареЛрд░ рд╕рдВрдкрд╛рджрдХреАрдп рдорд╛рдирдХреЛрдВ рдХреЗ рдкреНрд░рддрд┐ рдкреНрд░рддрд┐рдмрджреНрдз рд╣реИред рдЬрдм рдЖрдк рдЙрди рдЙрддреНрдкрд╛рджреЛрдВ рдХреЗ рд▓рд┐рдВрдХ рдкрд░ рдХреНрд▓рд┐рдХ рдХрд░рддреЗ рд╣реИрдВ рдЬрд┐рдирдХреА рд╣рдордиреЗ рд╕рдореАрдХреНрд╖рд╛ рдХреА рд╣реИ, рддреЛ рд╣рдореЗрдВ рдореБрдЖрд╡рдЬрд╛ рдорд┐рд▓ рд╕рдХрддрд╛ рд╣реИред