ठूंठ तकनीक एआई को भविष्य में दूर तक सोचने में सक्षम बनाती है - यूनाइट.एआई
हमसे जुडे

Artificial Intelligence

तकनीक एआई को भविष्य में दूर तक सोचने में सक्षम बनाती है

Updated on

एमआईटी, एमआईटी-आईबीएम वॉटसन एआई लैब और अन्य संस्थानों के शोधकर्ताओं की एक टीम ने एक नया दृष्टिकोण विकसित किया है जो कृत्रिम बुद्धिमत्ता (एआई) एजेंटों को दूरदर्शी दृष्टिकोण प्राप्त करने में सक्षम बनाता है। दूसरे शब्दों में, किसी कार्य को पूरा करते समय एआई भविष्य में दूर तक सोच सकता है कि उनके व्यवहार में अन्य एआई एजेंटों के व्यवहार कैसे शामिल हो सकते हैं। 

RSI अनुसंधान में प्रस्तुत करने के लिए तैयार है तंत्रिका सूचना प्रसंस्करण प्रणालियों पर सम्मेलन.

एआई अन्य एजेंटों की भविष्य की कार्रवाइयों पर विचार कर रहा है

टीम द्वारा बनाया गया मशीन-लर्निंग ढांचा सहकारी या प्रतिस्पर्धी एआई एजेंटों को यह विचार करने में सक्षम बनाता है कि अन्य एजेंट क्या करेंगे। यह केवल अगले चरणों पर नहीं है, बल्कि जैसे-जैसे समय अनंत के करीब पहुंचता है। एजेंट अन्य एजेंटों के भविष्य के व्यवहार को प्रभावित करने के लिए अपने व्यवहार को तदनुसार अनुकूलित करते हैं, जिससे उन्हें इष्टतम, दीर्घकालिक समाधान तक पहुंचने में मदद मिलती है। 

टीम के अनुसार, इस ढांचे का उपयोग, उदाहरण के लिए, खोए हुए यात्री को खोजने के लिए एक साथ काम करने वाले स्वायत्त ड्रोन के एक समूह द्वारा किया जा सकता है। यात्री सुरक्षा में सुधार के लिए अन्य वाहनों की भविष्य की गतिविधियों का अनुमान लगाने के लिए इसका उपयोग स्व-चालित वाहनों द्वारा भी किया जा सकता है।

डोंग-की किम सूचना और निर्णय प्रणाली (एलआईडीएस) के लिए एमआईटी प्रयोगशाला में स्नातक छात्र हैं और शोध पत्र के प्रमुख लेखक हैं। 

किम कहते हैं, "जब एआई एजेंट सहयोग कर रहे हैं या प्रतिस्पर्धा कर रहे हैं, तो सबसे महत्वपूर्ण बात यह है कि भविष्य में किसी बिंदु पर उनका व्यवहार एक जैसा होगा।" “रास्ते में बहुत सारे क्षणिक व्यवहार होते हैं जो लंबे समय में बहुत मायने नहीं रखते। इस अभिसरण व्यवहार तक पहुंचना वह चीज़ है जिसकी हम वास्तव में परवाह करते हैं, और अब हमारे पास इसे सक्षम करने का एक गणितीय तरीका है।

शोधकर्ताओं द्वारा निपटाई गई समस्या को मल्टी-एजेंट सुदृढीकरण शिक्षण कहा जाता है, सुदृढीकरण सीखना मशीन लर्निंग का एक रूप है जहां एआई एजेंट परीक्षण और त्रुटि से सीखते हैं। 

जब भी कई सहकारी या प्रतिस्पर्धी एजेंट एक साथ सीख रहे हों, तो प्रक्रिया कहीं अधिक जटिल हो सकती है। चूंकि एजेंट अन्य एजेंटों के भविष्य के कदमों के साथ-साथ अपने स्वयं के व्यवहार और यह दूसरों को कैसे प्रभावित करता है, इस पर विचार करते हैं, समस्या के लिए बहुत अधिक कम्प्यूटेशनल शक्ति की आवश्यकता होती है। 

रोबोसुमो: आगे बनाम लिली

एआई अनंत के बारे में सोच रहा है

किम कहते हैं, "एआई वास्तव में खेल के अंत के बारे में सोचना चाहता है, लेकिन वे नहीं जानते कि खेल कब खत्म होगा।" “उन्हें इस बारे में सोचने की ज़रूरत है कि वे अपने व्यवहार को अनंत काल तक कैसे अनुकूलित करते रहें ताकि वे भविष्य में किसी दूर तक जीत हासिल कर सकें। हमारा पेपर अनिवार्य रूप से एक नए उद्देश्य का प्रस्ताव करता है जो एआई को अनंत के बारे में सोचने में सक्षम बनाता है। 

अनंत को एक एल्गोरिदम में एकीकृत करना असंभव है, इसलिए टीम ने सिस्टम को इस तरह से डिज़ाइन किया है कि एजेंट भविष्य के बिंदु पर ध्यान केंद्रित करते हैं जहां उनका व्यवहार अन्य एजेंटों के साथ अभिसरण होगा। इसे संतुलन के रूप में जाना जाता है, और एक संतुलन बिंदु एजेंटों के दीर्घकालिक प्रदर्शन को निर्धारित करता है। 

बहु-एजेंट परिदृश्य में एकाधिक संतुलन का अस्तित्व संभव है, और जब एक प्रभावी एजेंट अन्य एजेंटों के भविष्य के व्यवहार को सक्रिय रूप से प्रभावित करता है, तो वे एजेंट के दृष्टिकोण से वांछनीय संतुलन तक पहुंच सकते हैं। जब सभी एजेंट एक-दूसरे को प्रभावित करते हैं, तो वे एक सामान्य अवधारणा में परिवर्तित हो जाते हैं जिसे "सक्रिय संतुलन" कहा जाता है। 

आगे की रूपरेखा

टीम के मशीन लर्निंग फ्रेमवर्क को आगे कहा जाता है, और यह एजेंटों को यह सीखने में सक्षम बनाता है कि सक्रिय संतुलन प्राप्त करने के लिए अन्य एजेंटों के साथ उनकी बातचीत के आधार पर उनके व्यवहार को कैसे समायोजित किया जाए। 

ढांचा दो मशीन-लर्निंग मॉड्यूल पर निर्भर करता है। पहला एक अनुमान मॉड्यूल है जो एक एजेंट को अन्य एजेंटों के भविष्य के व्यवहार और उनके द्वारा पूर्व कार्यों के आधार पर उपयोग किए जाने वाले सीखने के एल्गोरिदम का अनुमान लगाने में सक्षम बनाता है। फिर जानकारी को सुदृढीकरण शिक्षण मॉड्यूल में फीड किया जाता है, जिस पर एजेंट अपने व्यवहार को अनुकूलित करने और अन्य एजेंटों को प्रभावित करने के लिए भरोसा करता है। 

“चुनौती अनंत के बारे में सोचने की थी। किम कहते हैं, ''इसे सक्षम करने के लिए हमें कई अलग-अलग गणितीय उपकरणों का उपयोग करना पड़ा और इसे व्यवहार में लाने के लिए कुछ धारणाएं बनानी पड़ीं।'' 

टीम ने विभिन्न परिदृश्यों में अन्य मल्टीएजेंट सुदृढीकरण शिक्षण ढांचे के खिलाफ अपनी पद्धति का परीक्षण किया, जहां आगे का उपयोग करने वाले एआई एजेंट आगे आए। 

दृष्टिकोण विकेंद्रीकृत है, इसलिए एजेंट स्वतंत्र रूप से जीतना सीखते हैं। इसके अलावा, एजेंटों को नियंत्रित करने के लिए एक केंद्रीय कंप्यूटर की आवश्यकता वाले अन्य तरीकों की तुलना में इसे स्केल करने के लिए बेहतर डिज़ाइन किया गया है। 

टीम के अनुसार, आगे का उपयोग मल्टी-एजेंट समस्याओं की एक विस्तृत श्रृंखला में किया जा सकता है। किम विशेष रूप से अर्थशास्त्र में इसके अनुप्रयोगों के लिए आशान्वित है, जहां इसे समय के साथ बदलते व्यवहार और रुचियों के साथ बातचीत करने वाली कई संस्थाओं से जुड़ी स्थितियों में ठोस नीति विकसित करने के लिए लागू किया जा सकता है। 

एलेक्स मैकफ़ारलैंड एक एआई पत्रकार और लेखक हैं जो कृत्रिम बुद्धिमत्ता में नवीनतम विकास की खोज कर रहे हैं। उन्होंने दुनिया भर में कई एआई स्टार्टअप और प्रकाशनों के साथ सहयोग किया है।