कृत्रिम बुद्धिमत्ता

एआई तर्क का भ्रम: एप्पल का अध्ययन और एआई की सोच क्षमता पर बहस

Published June 28, 2025

Updated April 26, 2026

Dr. Assad Abbas

The Illusion of AI Reasoning: Apple’s Study and the Debate Over AI’s Thinking Abilities

आर्टिफ़िशियल इंटेलिजेंस (एआई) अब दैनिक जीवन का एक हिस्सा है। यह वॉयस असिस्टेंट को शक्ति प्रदान करता है, चैटबॉट चलाता है, और स्वास्थ्य सेवा, बैंकिंग, और व्यवसाय जैसे उद्योगों में महत्वपूर्ण निर्णय लेने में मदद करता है। उन्नत प्रणाली, जैसे कि ओपनएआई का जीपीटी-4 और गूगल का जेमिनी, अक्सर मानव-जैसी प्रतिक्रियाएं प्रदान करने में सक्षम माने जाते हैं। कई लोग मानते हैं कि ये मॉडल मानवों की तरह तर्क और सोच सकते हैं।

हालांकि, एप्पल के 2025 के अध्ययन ने इस विश्वास को चुनौती दी है। उनके शोध में यह सवाल उठाया गया है कि क्या ये लार्ज रीजनिंग मॉडल (एलआरएम) वास्तव में सोच सकते हैं। अध्ययन के निष्कर्ष यह है कि ये एआई वास्तविक तर्क का उपयोग नहीं कर सकते हैं, बल्कि पैटर्न मैचिंग पर निर्भर हो सकते हैं। मॉडल प्रशिक्षण डेटा से पैटर्न की पहचान और पुनरावृत्ति करते हैं, नए तर्क या समझ के बजाय।

एप्पल ने क्लासिक तर्क पहेलियों का उपयोग करके कई प्रमुख एआई मॉडल का परीक्षण किया। परिणाम अप्रत्याशित थे। सरल कार्यों पर, मानक मॉडल कभी-कभी अधिक उन्नत तर्क मॉडल की तुलना में बेहतर प्रदर्शन करते थे। मध्यम रूप से चुनौतीपूर्ण पहेलियों पर, एलआरएम ने कुछ फायदे दिखाए। लेकिन जब पहेलियां अधिक जटिल हो गईं, तो दोनों प्रकार के मॉडल विफल हो गए। यहां तक कि जब सही चरण-दर-चरण समाधान दिया गया, तो मॉडल उन्हें विश्वसनीय रूप से अनुसरण नहीं कर सके।

एप्पल के निष्कर्षों ने एआई समुदाय के भीतर एक बहस को जन्म दिया है। कुछ विशेषज्ञ एप्पल से सहमत हैं, कहते हैं कि ये मॉडल केवल सोच का भ्रम प्रदान करते हैं। अन्य तर्क देते हैं कि परीक्षण एआई की क्षमताओं को पूरी तरह से पकड़ नहीं सकते हैं और अधिक प्रभावी तरीकों की आवश्यकता है। मुख्य प्रश्न अब यह है: क्या एआई वास्तव में तर्क कर सकता है, या यह केवल उन्नत पैटर्न मैचिंग है?

यह प्रश्न सभी के लिए महत्वपूर्ण है। एआई अधिक सामान्य होते जा रहे हैं, यह समझना आवश्यक है कि ये प्रणाली क्या कर सकती हैं और क्या नहीं।

लार्ज रीजनिंग मॉडल (एलआरएम) क्या हैं?

एलआरएम एआई प्रणाली हैं जो चरण-दर-चरण तर्क दिखाकर समस्याओं का समाधान करने के लिए डिज़ाइन की गई हैं। मानक भाषा मॉडल के विपरीत, जो अगले शब्द की भविष्यवाणी पर आधारित उत्तर उत्पन्न करते हैं, एलआरएम तर्कसंगत व्याख्याएं प्रदान करने का लक्ष्य रखते हैं। यह उन्हें उन कार्यों के लिए उपयोगी बनाता है जिनमें कई चरणों के तर्क और अमूर्त सोच की आवश्यकता होती है।

एलआरएम को बड़े डेटासेट पर प्रशिक्षित किया जाता है जिसमें पुस्तकें, लेख, वेबसाइट और अन्य पाठ सामग्री शामिल है। यह प्रशिक्षण मॉडल को भाषा पैटर्न और मानव तर्क में सामान्य रूप से पाए जाने वाले तर्कसंगत संरचनाओं को समझने में सक्षम बनाता है। अपने निष्कर्षों तक पहुंचने के तरीके को दिखाकर, एलआरएम अधिक स्पष्ट और विश्वसनीय परिणाम प्रदान करने का लक्ष्य रखते हैं।

इन मॉडलों में बहुत सारे वादे हैं क्योंकि वे विभिन्न डोमेन में जटिल कार्यों को संभाल सकते हैं। लक्ष्य निर्णय लेने में पारदर्शिता बढ़ाना है, विशेष रूप से उन क्षेत्रों में जहां सटीक और तर्कसंगत निष्कर्ष पर निर्भर करते हैं।

हालांकि, एलआरएम वास्तव में तर्क कर सकते हैं या नहीं यह एक चिंता का विषय है। कुछ लोग मानते हैं कि वे मानव जैसी तरीके से सोचने के बजाय पैटर्न मैचिंग का उपयोग कर सकते हैं। यह एआई प्रणालियों की वास्तविक सीमाओं और क्या वे केवल तर्क की नकल कर रहे हैं या नहीं यह सवाल उठाता है।

एप्पल का अध्ययन: एआई तर्क और सोच का भ्रम का परीक्षण

एलआरएम तर्क या उन्नत पैटर्न मैचर हैं या नहीं, इस प्रश्न का उत्तर देने के लिए, एप्पल की अनुसंधान टीम ने क्लासिक तर्क पहेलियों के सेट का उपयोग करके प्रयोगों की एक श्रृंखला डिज़ाइन की। इनमें टॉवर ऑफ हनोई, रिवर क्रॉसिंग और ब्लॉक्स वर्ल्ड समस्याएं शामिल थीं, जो लंबे समय से मानव तर्क परीक्षण के लिए उपयोग की जाती रही हैं। टीम ने इन पहेलियों का चयन किया क्योंकि उनकी जटिलता को समायोजित किया जा सकता था। यह उन्हें मानक भाषा मॉडल और एलआरएम दोनों का मूल्यांकन करने में सक्षम बनाता है जो विभिन्न कठिनाई स्तरों पर हैं।

एप्पल का एआई तर्क परीक्षण का दृष्टिकोण पारंपरिक बेंचमार्क से अलग था, जो अक्सर गणितीय या कोडिंग कार्यों पर केंद्रित होते हैं। ये परीक्षण प्रशिक्षण के दौरान मॉडल के समान डेटा के संपर्क में आने से प्रभावित हो सकते हैं। इसके बजाय, एप्पल की टीम ने पहेलियों का उपयोग किया जो जटिलता को नियंत्रित करने की अनुमति देती है जबकि तर्कसंगत संरचनाएं संगत रहती हैं। इस डिज़ाइन ने उन्हें न केवल अंतिम उत्तरों का अवलोकन करने की अनुमति दी, बल्कि मॉडल द्वारा अपनाए गए तर्क चरणों का भी अवलोकन किया।

अध्ययन में तीन अलग-अलग प्रदर्शन स्तरों का खुलासा हुआ:

सरल कार्य

मूलभूत समस्याओं पर, मानक भाषा मॉडल कभी-कभी अधिक उन्नत तर्क मॉडल की तुलना में बेहतर प्रदर्शन करते थे। ये कार्य इतने सरल थे कि सरल मॉडल अधिक कुशलता से सही उत्तर उत्पन्न कर सकते थे।

मध्यम जटिल कार्य

जैसे ही पहेलियों की जटिलता बढ़ी, एलआरएम ने कुछ फायदे दिखाए। ये मॉडल तर्क प्रक्रिया का पालन करने और मानक मॉडल की तुलना में अधिक सटीक समाधान प्रदान करने में सक्षम थे।

अत्यधिक जटिल कार्य

जब पहेलियां अधिक जटिल हो गईं, तो दोनों प्रकार के मॉडल पूरी तरह से विफल हो गए। हालांकि मॉडलों के पास पर्याप्त गणना संसाधन थे, वे कार्यों को हल करने में सक्षम नहीं थे। उनकी सटीकता शून्य तक गिर गई, जो यह दर्शाती है कि वे आवश्यक जटिलता के स्तर को संभाल नहीं सकते थे।

पैटर्न मैचिंग या वास्तविक तर्क?

अधिक विश्लेषण पर, शोधकर्ताओं ने मॉडल के तर्क के साथ और भी चिंताएं पाईं। मॉडल द्वारा प्रदान किए गए उत्तर समस्याओं की प्रस्तुति पर बहुत अधिक निर्भर थे। संख्याओं या चर नामों में छोटे बदलाव पूरी तरह से अलग उत्तर दे सकते थे। यह असंगति यह सुझाव देती है कि मॉडल वास्तविक तर्क के बजाय सीखे गए पैटर्न पर निर्भर करते हैं।

अध्ययन से पता चला है कि जब भी स्पष्ट अल्गोरिदम या चरण-दर-चरण निर्देश दिए गए, तो मॉडल अक्सर पहेलियों की जटिलता बढ़ने पर उनका सही ढंग से उपयोग करने में विफल रहे। उनके तर्क ट्रेस ने दिखाया कि मॉडल नियमित रूप से नियमों या तर्क का पालन नहीं करते थे। इसके बजाय, उनके समाधान इनपुट में सतही परिवर्तनों के आधार पर भिन्न होते थे, समस्या की वास्तविक संरचना के बजाय।

एप्पल की टीम ने निष्कर्ष निकाला कि जो तर्क की तरह दिखता है वह अक्सर केवल उन्नत पैटर्न मैचिंग होता है। जबकि ये मॉडल परिचित पैटर्न को पहचानने के द्वारा तर्क की नकल कर सकते हैं, वे वास्तव में कार्यों को नहीं समझते हैं या मानव जैसी तरीके से तर्क नहीं लगाते हैं।

जारी बहस: क्या एआई वास्तव में तर्क कर सकता है या सोच की नकल कर सकता है?

एप्पल के अध्ययन ने एआई समुदाय में एलआरएम की वास्तविक तर्क क्षमता के बारे में बहस को जन्म दिया है। कई विशेषज्ञ अब एप्पल के निष्कर्षों का समर्थन करते हैं, तर्क देते हुए कि ये मॉडल तर्क का भ्रम पैदा करते हैं। वे इस बात से सहमत हैं कि जब जटिल या नए कार्यों का सामना करना पड़ता है, तो मानक भाषा मॉडल और एलआरएम दोनों ही संघर्ष करते हैं, यहां तक कि जब सही निर्देश या अल्गोरिदम दिए जाते हैं। यह सुझाव देता है कि तर्क अक्सर वास्तविक समझ के बजाय प्रशिक्षण डेटा से पैटर्न को पहचानने और दोहराने की क्षमता होती है।

दूसरी ओर, ओपनएआई और कुछ शोधकर्ता मानते हैं कि उनके मॉडल तर्क कर सकते हैं। वे मानकीकृत परीक्षणों पर उच्च प्रदर्शन की ओर इशारा करते हैं, जैसे कि एलएसएटी और चुनौतीपूर्ण गणित परीक्षाएं। उदाहरण के लिए, ओपनएआई का जीपीटी-4 एलएसएटी परीक्षा में 88वें प्रतिशताइल में स्कोर किया। कुछ लोग इसे तर्क क्षमता के प्रमाण के रूप में व्याख्या करते हैं। इस दृष्टिकोण के समर्थक तर्क देते हैं कि ऐसे परिणाम यह दिखाते हैं कि एआई मॉडल तर्क कर सकते हैं, कम से कम कुछ स्थितियों में।

हालांकि, एप्पल के अध्ययन ने इस दृष्टिकोण को चुनौती दी है। शोधकर्ताओं का तर्क है कि मानकीकृत परीक्षणों पर उच्च स्कोर तर्क क्षमता या वास्तविक समझ को इंगित नहीं करते हैं। वर्तमान बेंचमार्क तर्क कौशल को पूरी तरह से पकड़ नहीं सकते हैं और प्रशिक्षण डेटा से प्रभावित हो सकते हैं। कई मामलों में, मॉडल वास्तव में तर्क करने के बजाय प्रशिक्षण डेटा से पैटर्न दोहरा सकते हैं।

यह बहस व्यावहारिक परिणामों के साथ आती है। यदि एआई मॉडल वास्तव में तर्क नहीं कर सकते हैं, तो वे तार्किक निर्णय लेने वाले कार्यों के लिए विश्वसनीय नहीं हो सकते हैं। यह स्वास्थ्य सेवा, वित्त और कानून जैसे क्षेत्रों में विशेष रूप से महत्वपूर्ण है, जहां त्रुटियों के गंभीर परिणाम हो सकते हैं। उदाहरण के लिए, यदि एक एआई मॉडल नए या जटिल चिकित्सा मामलों पर तर्क नहीं लगा सकता है, तो त्रुटियां अधिक संभावना है। इसी तरह, वित्त में एआई प्रणाली जो तर्क की कमी है, वे खराब निवेश निर्णय ले सकती हैं या जोखिमों को गलत तरीके से आंक सकती हैं।

एप्पल के निष्कर्ष यह भी चेतावनी देते हैं कि जबकि एआई मॉडल सामग्री जनरेशन और डेटा विश्लेषण जैसे कार्यों के लिए उपयोगी हैं, उन्हें गहरी समझ या महत्वपूर्ण सोच के क्षेत्रों में सावधानी से उपयोग किया जाना चाहिए। कुछ विशेषज्ञ तर्क की कमी को एक महत्वपूर्ण सीमा के रूप में देखते हैं, जबकि अन्य मानते हैं कि पैटर्न मान्यता अकेले व्यावहारिक अनुप्रयोगों के लिए मूल्यवान हो सकती है।

एआई तर्क का भविष्य क्या है?

एआई तर्क का भविष्य अभी भी अनिश्चित है। कुछ शोधकर्ता मानते हैं कि अधिक प्रशिक्षण, बेहतर डेटा और सुधारित मॉडल वास्तुकला के साथ, एआई वास्तविक तर्क क्षमता विकसित करना जारी रखेगा। दूसरे अधिक सkeptical हैं और सोचते हैं कि वर्तमान एआई मॉडल हमेशा पैटर्न मैचिंग तक सीमित रहेंगे, मानव जैसी तर्क में शामिल नहीं होंगे।

शोधकर्ता वर्तमान में एआई मॉडल की समस्याओं से निपटने की क्षमता का मूल्यांकन करने के लिए नए मूल्यांकन तरीकों का विकास कर रहे हैं जिन्हें वे पहले कभी नहीं देखा है। ये परीक्षण यह आकलन करने का लक्ष्य रखते हैं कि क्या एआई महत्वपूर्ण रूप से सोच सकता है और मानवों के लिए समझ में आने वाले तरीके से अपने तर्क की व्याख्या कर सकता है। यदि सफल होता है, तो ये परीक्षण एआई की तर्क क्षमता की बेहतर समझ प्रदान कर सकते हैं और शोधकर्ताओं को बेहतर मॉडल विकसित करने में मदद कर सकते हैं।

हाइब्रिड मॉडल विकसित करने में भी बढ़ती रुचि है जो पैटर्न मान्यता और तर्क की ताकत को जोड़ती है। ये मॉडल पैटर्न मान्यता के लिए न्यूरल नेटवर्क और जटिल कार्यों के लिए प्रतीकात्मक तर्क प्रणाली का उपयोग करेंगे। एप्पल और एनवीडिया दोनों कथित तौर पर इन हाइब्रिड दृष्टिकोणों की खोज कर रहे हैं, जो वास्तविक तर्क करने में सक्षम एआई प्रणाली का नेतृत्व कर सकते हैं।

नीचे की पंक्ति

एप्पल के 2025 के अध्ययन ने एआई की तर्क क्षमता के बारे में महत्वपूर्ण प्रश्न उठाए हैं। जबकि एआई मॉडल जैसे एलआरएम विभिन्न क्षेत्रों में बहुत आशाजनक हैं, अध्ययन यह चेतावनी देता है कि वे वास्तविक समझ या मानव जैसी तर्क की कमी हो सकती है। इसके बजाय, वे पैटर्न मान्यता पर निर्भर हो सकते हैं, जो जटिल संज्ञानात्मक प्रक्रियाओं की आवश्यकता वाले कार्यों में उनकी प्रभावशीलता को सीमित करता है।

एआई भविष्य को आकार देना जारी रखता है, यह स्वीकार करना आवश्यक है कि इसकी ताकत और सीमाएं दोनों हैं। परीक्षण विधियों को परिष्कृत करने और अपनी अपेक्षाओं को प्रबंधित करने से, हम एआई का जिम्मेदारी से उपयोग कर सकते हैं। यह सुनिश्चित करेगा कि यह मानव निर्णय लेने की पूरक है, इसके बजाय इसका प्रतिस्थापन नहीं।

Dr. Assad Abbas

डॉ असद अब्बास, पाकिस्तान में कॉमसैट्स यूनिवर्सिटी इस्लामाबाद में एक टेन्योर्ड एसोसिएट प्रोफेसर, ने उत्तर डकोटा स्टेट यूनिवर्सिटी, यूएसए से अपनी पीएचडी प्राप्त की। उनका शोध उन्नत प्रौद्योगिकियों पर केंद्रित है, जिनमें क्लाउड, फॉग और एज कंप्यूटिंग, बिग डेटा विश्लेषण और एआई शामिल हैं। डॉ अब्बास ने प्रतिष्ठित वैज्ञानिक पत्रिकाओं और सम्मेलनों में प्रकाशनों के साथ महत्वपूर्ण योगदान दिया है। वह MyFastingBuddy के संस्थापक भी हैं।