Connect with us

рдПрдЖрдИ рдорд╛рдЗрдирдХреНрд░рд╛рдлреНрдЯ рдорд╢реАрди рд▓рд░реНрдирд┐рдВрдЧ рдкреНрд░рддрд┐рдпреЛрдЧрд┐рддрд╛ рдореЗрдВ рдкреНрд░рддрд┐рд╕реНрдкрд░реНрдзрд╛ рдХрд░реЗрдВрдЧреЗ

рдХреГрддреНрд░рд┐рдо рдмреБрджреНрдзрд┐рдорддреНрддрд╛

рдПрдЖрдИ рдорд╛рдЗрдирдХреНрд░рд╛рдлреНрдЯ рдорд╢реАрди рд▓рд░реНрдирд┐рдВрдЧ рдкреНрд░рддрд┐рдпреЛрдЧрд┐рддрд╛ рдореЗрдВ рдкреНрд░рддрд┐рд╕реНрдкрд░реНрдзрд╛ рдХрд░реЗрдВрдЧреЗ

mm

जैसा कि नेचर द्वारा रिपोर्ट किया गया है, एक नई एआई प्रतियोगिता जल्द ही होने वाली है, माइनआरएल प्रतियोगिता, जो एआई इंजीनियरों और कोडर्स को ऐसे प्रोग्राम बनाने के लिए प्रोत्साहित करेगी जो अवलोकन और उदाहरण के माध्यम से सीखने में सक्षम हों। इन एआई सिस्टम के लिए परीक्षण मामला अत्यधिक लोकप्रिय क्राफ्टिंग और सर्वाइवल वीडियो गेम माइनक्राफ्ट होगा।

आर्टिफिशियल इंटेलिजेंस सिस्टम ने वीडियो गेम्स के संबंध में कुछ हाल की प्रभावशाली उपलब्धियां देखी हैं। हाल ही में, एक एआई ने दुनिया के सर्वश्रेष्ठ मानव खिलाड़ियों को रणनीति गेम स्टारक्राफ्ट II में हराया। हालांकि, स्टारक्राफ्ट II में परिभाषित लक्ष्य हैं जिन्हें एक एआई के लिए प्रशिक्षण के लिए सुसंगत चरणों में तोड़ना आसान है। एक एआई के लिए माइनक्राफ्ट जैसे बड़े, ओपन-वर्ल्ड सैंडबॉक्स गेम में नेविगेट करना सीखना एक बहुत अधिक कठिन कार्य है। शोधकर्ता अवलोकन और उदाहरण के माध्यम से एआई प्रोग्रामों को सीखने में मदद करने का लक्ष्य रख रहे हैं, और यदि वे सफल होते हैं तो वे एक कृत्रिम बुद्धिमत्ता प्रोग्राम को प्रशिक्षित करने के लिए आवश्यक प्रसंस्करण शक्ति को काफी कम कर सकते हैं।

प्रतियोगिता में भाग लेने वालों को माइनक्राफ्ट के साथ परीक्षण के लिए एक एआई बनाने के लिए चार दिन मिलेंगे, जिसमें अपने एआई को प्रशिक्षित करने के लिए आठ मिलियन चरण लेना होगा। एआई का लक्ष्य गेम में खुदाई करके एक हीरा ढूंढना है। आठ मिलियन चरणों का प्रशिक्षण वर्तमान में शक्तिशाली एआई मॉडलों को प्रशिक्षित करने के लिए आवश्यक समय से बहुत कम समय है, इसलिए प्रतियोगिता में भाग लेने वालों को वर्तमान प्रशिक्षण विधियों में काफी सुधार करने वाले तरीकों को इंजीनियर करने की आवश्यकता है।

भाग लेने वालों द्वारा उपयोग की जाने वाली दृष्टिकोण एक प्रकार की सीखने की प्रक्रिया पर आधारित है जिसे अनुकरण सीखने कहा जाता है। अनुकरण सीखना पुनर्बलन सीखने के विपरीत है, जो जटिल प्रणालियों जैसे कि फैक्ट्रियों में रोबोटिक आर्म या स्टारक्राफ्ट II में मानव खिलाड़ियों को हराने में सक्षम एआई को प्रशिक्षित करने के लिए एक लोकप्रिय विधि है। पुनर्बलन सीखने के अल्गोरिदम का मुख्य नुकसान यह है कि उन्हें प्रशिक्षित करने के लिए भारी कंप्यूटर प्रसंस्करण शक्ति की आवश्यकता होती है, जिसमें सीखने के लिए सैकड़ों या यहां तक कि हजारों कंप्यूटरों को जोड़ने की आवश्यकता होती है। इसके विपरीत, अनुकरण सीखना एक अधिक कुशल और कम गणनात्मक रूप से महंगी प्रशिक्षण विधि है। अनुकरण सीखने के अल्गोरिदम मानवों की तरह अवलोकन द्वारा सीखने की कोशिश करते हैं।

कार्नेगी मेलन विश्वविद्यालय में गहरे सीखने के सिद्धांत में पीएचडी उम्मीदवार विलियम गस ने नेचर को बताया कि एक एआई को एक पर्यावरण में अन्वेषण करने और पैटर्न सीखने में मदद करना एक बहुत ही कठिन कार्य है, लेकिन अनुकरण सीखने से एआई को पर्यावरण के बारे में ज्ञान का एक आधार या अच्छी प्राथमिक धारणाएं मिलती हैं। यह एआई को पुनर्बलन सीखने की तुलना में बहुत तेजी से प्रशिक्षित करने में मदद कर सकता है।

माइनक्राफ्ट एक विशेष रूप से उपयोगी प्रशिक्षण वातावरण है क्योंकि यह खिलाड़ियों को सरल निर्माण ब्लॉकों का उपयोग करके जटिल संरचनाएं और वस्तुएं बनाने की अनुमति देता है, और इन संरचनाओं को बनाने के लिए आवश्यक कई चरण शोधकर्ताओं द्वारा उपयोग किए जा सकने वाले प्रगति के मूर्त मार्कर हैं। माइनक्राफ्ट बहुत लोकप्रिय है, और इसके कारण, प्रशिक्षण डेटा एकत्र करना तुलनात्मक रूप से आसान है। माइनआरएल प्रतियोगिता के आयोजकों ने कई माइनक्राफ्ट खिलाड़ियों को उपकरण बनाने और ब्लॉक तोड़ने जैसे विभिन्न कार्यों को प्रदर्शित करने के लिए भर्ती किया। डेटा के जनरेशन को भीड़ द्वारा सोर्सिंग करके, शोधकर्ताओं ने गेम में लिए जा सकने वाले 60 मिलियन उदाहरणों को कैप्चर किया। शोधकर्ताओं ने प्रतियोगिता टीमों को लगभग 1000 घंटे का वीडियो दिया।

मानवों द्वारा निर्मित ज्ञान का उपयोग करें, कैलिफोर्निया विश्वविद्यालय, बर्कले में कंप्यूटर विज्ञान में पीएचडी उम्मीदवार रोहिन शाह ने नेचर को बताया कि यह प्रतियोगिता संभवतः पहली है जो एआई के प्रशिक्षण को तेज करने के लिए मानवों द्वारा पहले से ही उत्पन्न किए गए ज्ञान का उपयोग करने पर केंद्रित है।

गस और अन्य शोधकर्ता आशावादी हैं कि प्रतियोगिता के परिणाम माइनक्राफ्ट से परे परिणाम हो सकते हैं, जो बेहतर अनुकरण सीखने के अल्गोरिदम को जन्म दे सकते हैं और अधिक लोगों को एआई को प्रशिक्षित करने के लिए अनुकरण सीखने को एक व्यवहार्य रूप में विचार करने के लिए प्रेरित कर सकते हैं। शोध संभावित रूप से जटिल, बदलते वातावरण में मानवों के साथ बातचीत करने में सक्षम एआई बनाने में मदद कर सकता है।

рдмреНрд▓реЙрдЧрд░ рдФрд░ рдкреНрд░реЛрдЧреНрд░рд╛рдорд░ рдЬрд┐рдирдХреА рд╡рд┐рд╢реЗрд╖рдЬреНрдЮрддрд╛ рдореИрд╢реАрди рд▓рд░реНрдирд┐рдВрдЧ рдФрд░ рдбреАрдк рд▓рд░реНрдирд┐рдВрдЧ рд╡рд┐рд╖рдпреЛрдВ рдореЗрдВ рд╣реИред рдбреИрдирд┐рдпрд▓ рджреВрд╕рд░реЛрдВ рдХреЛ рд╕рд╛рдорд╛рдЬрд┐рдХ рдХрд▓реНрдпрд╛рдг рдХреЗ рд▓рд┐рдП рдПрдЖрдИ рдХреА рд╢рдХреНрддрд┐ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдореЗрдВ рдорджрдж рдХрд░рдирд╛ рдЪрд╛рд╣рддрд╛ рд╣реИред