हमसे जुडे

आर्टिफिशियल जनरल इंटेलिजेंस

अमेज़ॅन एलेक्सा के प्रमुख शोधकर्ता का तर्क है कि ट्यूरिंग टेस्ट अप्रचलित है

mm
Updated on

रोहित प्रसाद, अमेज़ॅन में एलेक्सा के उपाध्यक्ष और प्रमुख वैज्ञानिक, हाल ही में तर्क दिया कि ट्यूरिंग टेस्टएआई मॉडल की परिष्कार को मापने के लिए लंबे समय से उपयोग किए जाने वाले को एआई के लिए एक बेंचमार्क के रूप में हटा दिया जाना चाहिए।

कंप्यूटर वैज्ञानिक और गणितज्ञ एलन ट्यूरिंग ने मूल रूप से 70 साल से भी पहले ट्यूरिंग परीक्षण की अवधारणा पेश की थी। ट्यूरिंग परीक्षण का उद्देश्य मशीन इंटेलिजेंस के प्रश्न का उत्तर देने में सहायता करना था, यह निर्धारित करना कि क्या कोई मशीन मानवीय अर्थों में "सोचने" में सक्षम है। इस प्रश्न का उत्तर देने के लिए, ट्यूरिंग ने तर्क दिया कि यदि मशीनें बातचीत के व्यवहार को इतना परिष्कृत प्रदर्शित कर सकती हैं कि एक मानव पर्यवेक्षक कंप्यूटर के संवाद और मानव के संवाद के बीच अंतर नहीं कर सकता है, तो मशीन को विचार करने में सक्षम माना जाना चाहिए।

ट्यूरिंग परीक्षण की सीमाएँ

प्रसाद ने तर्क दिया कि ट्यूरिंग परीक्षण कई मायनों में सीमित है और ट्यूरिंग ने स्वयं भी इनमें से कुछ सीमाओं पर टिप्पणी की थी अपने शुरुआती पेपर में. प्रसाद का तर्क है कि जैसे-जैसे एआई हमारे जीवन के हर पहलू में अधिक से अधिक एकीकृत हो गया है, लोगों को इस बात की कम परवाह है कि यह मानव से अप्रभेद्य है और एआई के साथ उनकी बातचीत निर्बाध है। इस कारण से, ट्यूरिंग परीक्षण को अप्रचलित माना जाना चाहिए और इसे अधिक उपयोगी बेंचमार्क के साथ प्रतिस्थापित किया जाना चाहिए।

प्रसाद ने कहा कि कई शुरुआती चैटबॉट ट्यूरिंग टेस्ट को पास करने को ध्यान में रखते हुए डिजाइन किए गए थे, और हाल के वर्षों में कुछ चैटबॉट लगातार एक तिहाई से अधिक मानव न्यायाधीशों (ट्यूरिंग टेस्ट पास करने के लिए आवश्यक बार) को चकमा देने में कामयाब रहे हैं। हालाँकि, मनुष्यों के भाषण पैटर्न की सफलतापूर्वक नकल करने में सक्षम होना इसका मतलब यह नहीं है कि एक मशीन को वास्तव में "बुद्धिमान" माना जा सकता है। एआई मॉडल एक क्षेत्र में बेहद कुशल हो सकते हैं और अन्य में बेहद कमजोर हो सकते हैं, उनके पास सामान्य बुद्धि का कोई रूप नहीं होता है। इसके बावजूद, ट्यूरिंग टेस्ट चैटबॉट्स और डिजिटल असिस्टेंट के लिए आमतौर पर इस्तेमाल किया जाने वाला बेंचमार्क बना हुआ है, प्रसाद ने कहा कि बिजनेस लीडर और पत्रकार लगातार पूछते हैं कि एलेक्सा ट्यूरिंग टेस्ट पास करने में कब सक्षम होगी।

प्रसाद के अनुसार, मशीन इंटेलिजेंस का आकलन करने के लिए ट्यूरिंग टेस्ट का उपयोग करने में प्राथमिक मुद्दों में से एक यह है कि यह मशीनों की जानकारी देखने और बिजली की तेजी से गणना करने की क्षमता को लगभग पूरी तरह से कम कर देता है। एआई प्रोग्राम इंसानों को चकमा देने के लिए जटिल गणित और भूगोल के सवालों के जवाब में कृत्रिम रुकावट डालते हैं, लेकिन उनके पास ऐसे सवालों का जवाब लगभग तुरंत होता है। इसके अलावा, ट्यूरिंग परीक्षण बाहरी सेंसर द्वारा एकत्र किए गए डेटा का उपयोग करने की एआई की बढ़ती क्षमता को ध्यान में नहीं रखता है, इस बात की अनदेखी करता है कि एआई केवल पाठ संचार पर भरोसा करते हुए, दृष्टि और गति एल्गोरिदम के माध्यम से अपने आसपास की दुनिया के साथ कैसे बातचीत कर सकता है।

नए बेंचमार्क बनाना

प्रसाद ने तर्क दिया कि बुद्धि को मापने के नए रूप बनाए जाने चाहिए, ऐसे तरीके जो सामान्य प्रकार की बुद्धि का आकलन करने के लिए बेहतर अनुकूल हों। इन परीक्षणों को यह प्रतिबिंबित करना चाहिए कि आधुनिक समाज में एआई का वास्तव में कैसे उपयोग किया जाता है और इसका उपयोग करने के लिए लोगों के लक्ष्य क्या हैं। परीक्षण यह पता लगाने में सक्षम होने चाहिए कि एआई मानव बुद्धि को कितनी अच्छी तरह बढ़ाता है और एआई लोगों के दैनिक जीवन को कितनी अच्छी तरह बेहतर बनाता है। इसके अलावा, एक परीक्षण को यह समझना चाहिए कि एआई भाषा दक्षता, आत्म-पर्यवेक्षण और "सामान्य ज्ञान" सहित बुद्धि की मानव-जैसी विशेषताओं को कैसे प्रकट कर रहा है।

एआई अनुसंधान के वर्तमान और महत्वपूर्ण क्षेत्रों, जैसे तर्क, निष्पक्षता, बातचीत और संवेदी समझ का मूल्यांकन ट्यूरिंग परीक्षण द्वारा नहीं किया जाता है, लेकिन उन्हें विभिन्न तरीकों से मापा जा सकता है। प्रसाद ने बताया कि बुद्धिमत्ता की इन विशेषताओं को मापने का एक तरीका चुनौतियों को घटक कार्यों में विभाजित करना है। मूल्यांकन का एक अन्य तरीका मानव-कंप्यूटर संपर्क के लिए बड़े पैमाने पर वास्तविक दुनिया की चुनौती पैदा करना है।

जब अमेज़ॅन ने एलेक्सा पुरस्कार बनाया, तो उसने एक रूब्रिक बनाया जिसके लिए सोशल बॉट्स को किसी इंसान से 20 मिनट तक बात करने की आवश्यकता थी। बॉट्स का मूल्यांकन प्रौद्योगिकी, खेल, राजनीति और मनोरंजन जैसे विभिन्न विषयों पर सुसंगत रूप से बातचीत करने की उनकी क्षमता पर किया जाएगा। ग्राहक विकास चरण के दौरान बॉट को स्कोर करने के लिए जिम्मेदार थे, बॉट के साथ फिर से चैट करने की उनकी इच्छा के आधार पर उन्हें स्कोर प्रदान करते थे। अंतिम दौर के दौरान, स्वतंत्र न्यायाधीश 5-बिंदु पैमाने का उपयोग करके बॉट्स को ग्रेड करने के लिए जिम्मेदार थे। न्यायाधीशों द्वारा इस्तेमाल किया गया रूब्रिक उन तरीकों पर निर्भर करता है जो एआई को सहानुभूति जैसे महत्वपूर्ण मानवीय गुणों को प्रदर्शित करने देते हैं जहां उपयुक्त हो।

अंततः, प्रसाद ने तर्क दिया कि एलेक्सा जैसे एआई-संचालित उपकरणों का बढ़ता प्रसार एआई की प्रगति को मापने के लिए एक महत्वपूर्ण अवसर का प्रतिनिधित्व करता है, लेकिन इस नए अवसर का लाभ उठाने के लिए हमें विभिन्न मैट्रिक्स की आवश्यकता होगी।

प्रसाद ने बताया, "ऐसे एआई को बड़ी संख्या में कार्यों में विशेषज्ञ होने की आवश्यकता होती है, जो कार्य-विशिष्ट बुद्धिमत्ता के बजाय अधिक सामान्यीकृत सीखने की क्षमता के साथ ही संभव है।" "इसलिए, अगले दशक और उससे आगे के लिए, एआई सेवाओं की उपयोगिता, परिवेशीय उपकरणों पर उनकी संवादात्मक और सक्रिय सहायता क्षमताओं के साथ, एक योग्य परीक्षण है।"

 

विशेषज्ञता वाले ब्लॉगर और प्रोग्रामर मशीन लर्निंग और गहरी सीख विषय। डैनियल को उम्मीद है कि वह दूसरों को सामाजिक भलाई के लिए एआई की शक्ति का उपयोग करने में मदद करेगा।