Connect with us

рдпреВрдмреАрд╕реЙрдлреНрдЯ рдЯреНрд░реЗрдиреНрд╕ рдПрдЖрдИ рдПрдЬреЗрдВрдЯ рдХреЛ рдПрдХ рд░реЗрд╕рд┐рдВрдЧ рдЧреЗрдо рдореЗрдВ рдХрд╛рд░ рдЪрд▓рд╛рдиреЗ рдХреЗ рд▓рд┐рдП

рдХреГрддреНрд░рд┐рдо рдмреБрджреНрдзрд┐рдорддреНрддрд╛

рдпреВрдмреАрд╕реЙрдлреНрдЯ рдЯреНрд░реЗрдиреНрд╕ рдПрдЖрдИ рдПрдЬреЗрдВрдЯ рдХреЛ рдПрдХ рд░реЗрд╕рд┐рдВрдЧ рдЧреЗрдо рдореЗрдВ рдХрд╛рд░ рдЪрд▓рд╛рдиреЗ рдХреЗ рд▓рд┐рдП

mm

“एआई” शब्द का उपयोग वीडियो गेम्स की चर्चा में बहुत किया जाता है, लेकिन यह आमतौर पर वीडियो गेम्स में नॉन-प्लेयर चरेटर्स को नियंत्रित करने वाले तर्क को संदर्भित करने के लिए उपयोग किया जाता है, न कि किसी ऐसे सिस्टम को संदर्भित करने के लिए जो कंप्यूटर वैज्ञानिकों द्वारा मान्यता प्राप्त एआई द्वारा संचालित हो। कृत्रिम न्यूरल नेटवर्क का उपयोग करके एआई के वास्तविक अनुप्रयोग वीडियो गेम उद्योग के भीतर दुर्लभ हैं, लेकिन वेंचरबीट की रिपोर्ट के अनुसार गेमिंग कंपनी यूबीसॉफ्ट ने हाल ही में एक पेपर प्रकाशित किया है जो एक एआई एजेंट के लिए संभावित उपयोगों की जांच करता है जिसे रिन्फोर्समेंट लर्निंग के साथ प्रशिक्षित किया गया है।

जबकि डीपमाइंड और ओपनएआई जैसे संस्थानों ने विभिन्न वीडियो गेम्स में एआई के प्रदर्शन की जांच की है, जैसे कि स्टारक्राफ्ट 2, डोटा 2, और माइनक्राफ्ट, गेम डेवलपर्स द्वारा सामना की जाने वाली विशिष्ट प्रतिबंधों के तहत एआई के उपयोग पर बहुत कम शोध किया गया है। यूबीसॉफ्ट ला फोर्ज, यूबीसॉफ्ट की प्रोटोटाइपिंग शाखा, ने हाल ही में एक पेपर प्रकाशित किया है जो एक अल्गोरिदम का विवरण करता है जो एक व्यावसायिक वीडियो गेम में पूर्वानुमानित क्रियाएं कर सकता है। रिपोर्ट के अनुसार, एआई अल्गोरिदम वर्तमान बेंचमार्क को मारने और जटिल कार्यों को विश्वसनीय रूप से करने में सक्षम थे।

पेपर के लेखकों का उल्लेख है कि जबकि रिन्फोर्समेंट लर्निंग का उपयोग विशिष्ट वीडियो गेम्स के संदर्भ में बहुत प्रभावी ढंग से किया गया है, अक्सर मानव खिलाड़ियों के साथ समानता प्राप्त करते हुए, ओपनएआई और डीपमाइंड द्वारा बनाए गए सिस्टम शायद ही कभी गेम डेवलपर्स के लिए उपयोगी होते हैं। लेखकों का उल्लेख है कि पहुंच की कमी एक बड़ा मुद्दा है और सबसे प्रभावशाली परिणाम उन शोध समूहों द्वारा प्राप्त किए जाते हैं जिनके पास बड़े पैमाने पर गणना संसाधन हैं, संसाधन जो आमतौर पर गेम डेवलपर्स के पास उपलब्ध नहीं होते हैं। शोधकर्ताओं ने लिखा है:

“इन सिस्टमों का वीडियो गेम उद्योग के भीतर बहुत कम उपयोग किया गया है, और हम मानते हैं कि पहुंच की कमी एक प्रमुख कारण है। वास्तव में, वास्तव में प्रभावशाली परिणाम … बड़े शोध समूहों द्वारा उत्पादित किए जाते हैं जिनके पास गणना संसाधन हैं जो वीडियो गेम स्टूडियो में उपलब्ध संसाधनों से परे हैं।”

यूबीसॉफ्ट की शोध टीम ने इन समस्याओं को दूर करने के लिए एक रिन्फोर्समेंट लर्निंग दृष्टिकोण बनाने का लक्ष्य रखा जो डेटा नमूना संग्रह और रनटाइम बजट प्रतिबंधों जैसे मुद्दों के लिए अनुकूलित हो। यूबीसॉफ्ट का समाधान कैलिफोर्निया विश्वविद्यालय, बर्कले में किए गए शोध से अनुकूलित किया गया था। यूसी बर्कले शोधकर्ताओं द्वारा विकसित सॉफ्ट एक्टर-क्रिटिक मॉडल एक मॉडल बनाने में सक्षम है जो नए परिस्थितियों में प्रभावी ढंग से सामान्य कर सकता है और अधिकांश मॉडलों की तुलना में बहुत अधिक नमूना-कुशल है। यूबीसॉफ्ट टीम ने इस दृष्टिकोण को विकसित किया और दोनों डिस्क्रीट और निरंतर क्रियाओं के लिए अनुकूलित किया।

यूबीसॉफ्ट शोध टीम ने तीन अलग-अलग गेम्स पर अपने अल्गोरिदम के प्रदर्शन का मूल्यांकन किया। दो फुटबॉल गेम्स का उपयोग अल्गोरिदम का परीक्षण करने के लिए किया गया था, साथ ही एक सरल प्लेटफ़ॉर्मर-शैली का गेम भी था। जबकि इन गेम्स के लिए परिणाम थोड़े खराब थे राज्य-ऑफ-द-आर्ट उद्योग के परिणामों की तुलना में, एक और परीक्षण किया गया था जिसमें अल्गोरिदम ने बहुत बेहतर प्रदर्शन किया। शोधकर्ताओं ने एक ड्राइविंग वीडियो गेम का उपयोग अपने परीक्षण मामले के रूप में किया, जिसमें एआई एजेंट को एक दिए गए पथ का पालन करने और एक ऐसे वातावरण में बाधाओं का निपटान करने के लिए प्रशिक्षित किया गया था जिसे एजेंट ने प्रशिक्षण के दौरान नहीं देखा था। दो निरंतर क्रियाएं थीं, स्टीयरिंग और एक्सेलेरेशन, साथ ही एक बाइनरी क्रिया (ब्रेकिंग) भी थी।

शोधकर्ताओं ने अपने परिणामों को पेपर में सारांशित किया, घोषणा की कि हाइब्रिड सॉफ्ट एक्टर-क्रिटिक दृष्टिकोण एक व्यावसायिक रूप से उपलब्ध वीडियो गेम में एक एआई एजेंट को उच्च गति से प्रशिक्षित करने में सफल रहा। शोधकर्ताओं के अनुसार, उनके प्रशिक्षण दृष्टिकोण का उपयोग विभिन्न संभावित इंटरैक्शन दृष्टिकोणों के लिए किया जा सकता है। इनमें ऐसे मामले शामिल हैं जहां एआई एजेंट के पास वही इनपुट विकल्प हैं जो खिलाड़ी के पास हैं, जो “ऐसे अल्गोरिदम की व्यावहारिक उपयोगिता को प्रदर्शित करता है वीडियो गेम उद्योग के लिए।”

рдмреНрд▓реЙрдЧрд░ рдФрд░ рдкреНрд░реЛрдЧреНрд░рд╛рдорд░ рдЬрд┐рдирдХреА рд╡рд┐рд╢реЗрд╖рдЬреНрдЮрддрд╛ рдореИрд╢реАрди рд▓рд░реНрдирд┐рдВрдЧ рдФрд░ рдбреАрдк рд▓рд░реНрдирд┐рдВрдЧ рд╡рд┐рд╖рдпреЛрдВ рдореЗрдВ рд╣реИред рдбреИрдирд┐рдпрд▓ рджреВрд╕рд░реЛрдВ рдХреЛ рд╕рд╛рдорд╛рдЬрд┐рдХ рдХрд▓реНрдпрд╛рдг рдХреЗ рд▓рд┐рдП рдПрдЖрдИ рдХреА рд╢рдХреНрддрд┐ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдореЗрдВ рдорджрдж рдХрд░рдирд╛ рдЪрд╛рд╣рддрд╛ рд╣реИред