рдХреГрддреНрд░рд┐рдо рдмреБрджреНрдзрд┐рдорддреНрддрд╛
рдпреВрдмреАрд╕реЙрдлреНрдЯ рдЯреНрд░реЗрдиреНрд╕ рдПрдЖрдИ рдПрдЬреЗрдВрдЯ рдХреЛ рдПрдХ рд░реЗрд╕рд┐рдВрдЧ рдЧреЗрдо рдореЗрдВ рдХрд╛рд░ рдЪрд▓рд╛рдиреЗ рдХреЗ рд▓рд┐рдП

“एआई” शब्द का उपयोग वीडियो गेम्स की चर्चा में बहुत किया जाता है, लेकिन यह आमतौर पर वीडियो गेम्स में नॉन-प्लेयर चरेटर्स को नियंत्रित करने वाले तर्क को संदर्भित करने के लिए उपयोग किया जाता है, न कि किसी ऐसे सिस्टम को संदर्भित करने के लिए जो कंप्यूटर वैज्ञानिकों द्वारा मान्यता प्राप्त एआई द्वारा संचालित हो। कृत्रिम न्यूरल नेटवर्क का उपयोग करके एआई के वास्तविक अनुप्रयोग वीडियो गेम उद्योग के भीतर दुर्लभ हैं, लेकिन वेंचरबीट की रिपोर्ट के अनुसार गेमिंग कंपनी यूबीसॉफ्ट ने हाल ही में एक पेपर प्रकाशित किया है जो एक एआई एजेंट के लिए संभावित उपयोगों की जांच करता है जिसे रिन्फोर्समेंट लर्निंग के साथ प्रशिक्षित किया गया है।
जबकि डीपमाइंड और ओपनएआई जैसे संस्थानों ने विभिन्न वीडियो गेम्स में एआई के प्रदर्शन की जांच की है, जैसे कि स्टारक्राफ्ट 2, डोटा 2, और माइनक्राफ्ट, गेम डेवलपर्स द्वारा सामना की जाने वाली विशिष्ट प्रतिबंधों के तहत एआई के उपयोग पर बहुत कम शोध किया गया है। यूबीसॉफ्ट ला फोर्ज, यूबीसॉफ्ट की प्रोटोटाइपिंग शाखा, ने हाल ही में एक पेपर प्रकाशित किया है जो एक अल्गोरिदम का विवरण करता है जो एक व्यावसायिक वीडियो गेम में पूर्वानुमानित क्रियाएं कर सकता है। रिपोर्ट के अनुसार, एआई अल्गोरिदम वर्तमान बेंचमार्क को मारने और जटिल कार्यों को विश्वसनीय रूप से करने में सक्षम थे।
पेपर के लेखकों का उल्लेख है कि जबकि रिन्फोर्समेंट लर्निंग का उपयोग विशिष्ट वीडियो गेम्स के संदर्भ में बहुत प्रभावी ढंग से किया गया है, अक्सर मानव खिलाड़ियों के साथ समानता प्राप्त करते हुए, ओपनएआई और डीपमाइंड द्वारा बनाए गए सिस्टम शायद ही कभी गेम डेवलपर्स के लिए उपयोगी होते हैं। लेखकों का उल्लेख है कि पहुंच की कमी एक बड़ा मुद्दा है और सबसे प्रभावशाली परिणाम उन शोध समूहों द्वारा प्राप्त किए जाते हैं जिनके पास बड़े पैमाने पर गणना संसाधन हैं, संसाधन जो आमतौर पर गेम डेवलपर्स के पास उपलब्ध नहीं होते हैं। शोधकर्ताओं ने लिखा है:
“इन सिस्टमों का वीडियो गेम उद्योग के भीतर बहुत कम उपयोग किया गया है, और हम मानते हैं कि पहुंच की कमी एक प्रमुख कारण है। वास्तव में, वास्तव में प्रभावशाली परिणाम … बड़े शोध समूहों द्वारा उत्पादित किए जाते हैं जिनके पास गणना संसाधन हैं जो वीडियो गेम स्टूडियो में उपलब्ध संसाधनों से परे हैं।”
यूबीसॉफ्ट की शोध टीम ने इन समस्याओं को दूर करने के लिए एक रिन्फोर्समेंट लर्निंग दृष्टिकोण बनाने का लक्ष्य रखा जो डेटा नमूना संग्रह और रनटाइम बजट प्रतिबंधों जैसे मुद्दों के लिए अनुकूलित हो। यूबीसॉफ्ट का समाधान कैलिफोर्निया विश्वविद्यालय, बर्कले में किए गए शोध से अनुकूलित किया गया था। यूसी बर्कले शोधकर्ताओं द्वारा विकसित सॉफ्ट एक्टर-क्रिटिक मॉडल एक मॉडल बनाने में सक्षम है जो नए परिस्थितियों में प्रभावी ढंग से सामान्य कर सकता है और अधिकांश मॉडलों की तुलना में बहुत अधिक नमूना-कुशल है। यूबीसॉफ्ट टीम ने इस दृष्टिकोण को विकसित किया और दोनों डिस्क्रीट और निरंतर क्रियाओं के लिए अनुकूलित किया।
यूबीसॉफ्ट शोध टीम ने तीन अलग-अलग गेम्स पर अपने अल्गोरिदम के प्रदर्शन का मूल्यांकन किया। दो फुटबॉल गेम्स का उपयोग अल्गोरिदम का परीक्षण करने के लिए किया गया था, साथ ही एक सरल प्लेटफ़ॉर्मर-शैली का गेम भी था। जबकि इन गेम्स के लिए परिणाम थोड़े खराब थे राज्य-ऑफ-द-आर्ट उद्योग के परिणामों की तुलना में, एक और परीक्षण किया गया था जिसमें अल्गोरिदम ने बहुत बेहतर प्रदर्शन किया। शोधकर्ताओं ने एक ड्राइविंग वीडियो गेम का उपयोग अपने परीक्षण मामले के रूप में किया, जिसमें एआई एजेंट को एक दिए गए पथ का पालन करने और एक ऐसे वातावरण में बाधाओं का निपटान करने के लिए प्रशिक्षित किया गया था जिसे एजेंट ने प्रशिक्षण के दौरान नहीं देखा था। दो निरंतर क्रियाएं थीं, स्टीयरिंग और एक्सेलेरेशन, साथ ही एक बाइनरी क्रिया (ब्रेकिंग) भी थी।
शोधकर्ताओं ने अपने परिणामों को पेपर में सारांशित किया, घोषणा की कि हाइब्रिड सॉफ्ट एक्टर-क्रिटिक दृष्टिकोण एक व्यावसायिक रूप से उपलब्ध वीडियो गेम में एक एआई एजेंट को उच्च गति से प्रशिक्षित करने में सफल रहा। शोधकर्ताओं के अनुसार, उनके प्रशिक्षण दृष्टिकोण का उपयोग विभिन्न संभावित इंटरैक्शन दृष्टिकोणों के लिए किया जा सकता है। इनमें ऐसे मामले शामिल हैं जहां एआई एजेंट के पास वही इनपुट विकल्प हैं जो खिलाड़ी के पास हैं, जो “ऐसे अल्गोरिदम की व्यावहारिक उपयोगिता को प्रदर्शित करता है वीडियो गेम उद्योग के लिए।”












