कृत्रिम बुद्धिमत्ता

चेन-ऑफ-थॉट का अंत? कोरथिंक और कैलिफोर्निया विश्वविद्यालय के शोधकर्ता एआई तर्क में एक परिदृश्य परिवर्तन का प्रस्ताव करते हैं

Published September 5, 2025

Updated May 18, 2026

Antoine Tardif, CEO & Founder of Unite.AI

वर्षों से, कृत्रिम बुद्धिमत्ता में दौड़ पैमाने के बारे में रही है। बड़े मॉडल, अधिक जीपीयू, लंबे प्रॉम्प्ट। ओपनएआई, एंथ्रोपिक और गूगल ने बड़े बड़े भाषा मॉडल (एलएलएम), पुनरावृत्ति शिक्षण फ़ाइन-ट्यूनिंग और चेन-ऑफ-थॉट प्रॉम्प्टिंग—तकनीकों के साथ अगुवाई की है, जो कारण बताने के लिए डिज़ाइन किए गए हैं कि वे कदम-दर-कदम उत्तर देने का प्रयास करते हैं।

लेकिन कोरथिंक एआई और कैलिफोर्निया विश्वविद्यालय के शोधकर्ताओं द्वारा कोरथिंक: एलएलएम के साथ लंबी दूरी की कार्यों पर तर्क करने के लिए एक प्रतीकात्मक तर्क लेयर शीर्षक वाला एक नई तकनीकी श्वेत पत्र तर्क देता है कि यह परिदृश्य अपनी सीमा तक पहुंच सकता है। लेखक एक उत्तेजक दावा करते हैं: एलएलएम शक्तिशाली सांख्यिकीय पाठ जनरेटर हैं, लेकिन वे तर्क इंजन नहीं हैं। और चेन-ऑफ-थॉट, जिस तरीके से अक्सर इसका सुझाव दिया जाता है, वह वास्तविक तर्क से ज्यादा प्रदर्शन थिएटर है।

इसके जवाब में, टीम जनरल सिम्बोलिक्स पेश करती है, एक न्यूरो-प्रतीकात्मक तर्क लेयर जो मौजूदा मॉडल में प्लग की जा सकती है। उनके मूल्यांकन में तर्क बेंचमार्क की एक विस्तृत श्रृंखला में नाटकीय सुधार दिखाई देते हैं—जो पुनः प्रशिक्षण या अतिरिक्त जीपीयू लागत के बिना प्राप्त किए जाते हैं। यदि यह दृष्टिकोण मान्य है, तो यह तर्क के लिए एआई प्रणालियों के डिजाइन में एक मोड़ का प्रतिनिधित्व कर सकता है।

चेन-ऑफ-थॉट क्या है — और यह क्यों महत्वपूर्ण है

चेन-ऑफ-थॉट (सीओटी) प्रॉम्प्टिंग आधुनिक एआई में सबसे व्यापक रूप से अपनाई जाने वाली तकनीकों में से एक बन गई है। मॉडल से अपने तर्क कदमों को लिखने के लिए कहने के बाद, शोधकर्ताओं ने पाया कि वे अक्सर गणित, कोडिंग और योजना जैसे क्षेत्रों में बेंचमार्क स्कोर में सुधार कर सकते हैं। सतह पर, यह एक सफलता की तरह लगा।

हालांकि, रिपोर्ट इस दृष्टिकोण की सीमाओं को रेखांकित करती है। सीओटी व्याख्याएं आकर्षक लग सकती हैं, लेकिन अध्ययनों से पता चलता है कि वे अक्सर मॉडल द्वारा वास्तव में गणना की गई चीजों के लिए वफादार नहीं हैं, बल्कि तथ्य के बाद तर्कसंगत बनाने के बजाय उत्पादन को तर्कसंगत बनाने के लिए। यह वास्तविक दुनिया के जोखिम पैदा करता है। चिकित्सा में, एक संभावित कथा स्पurious संबंधों पर निर्भरता को छुपा सकती है, जिससे खतरनाक गलत निदान हो सकते हैं। कानून में, बनावटी तर्क वास्तविक न्यायिक आधार के लिए गलत समझा जा सकता है, जो कानूनी प्रक्रिया और जवाबदेही को खतरे में डाल सकता है।

लेख आगे अक्षमता पर प्रकाश डालता है: सीओटी श्रृंखलाएं अक्सर सरल समस्याओं पर अत्यधिक लंबी हो जाती हैं, जबकि जटिल लोगों पर तर्क में गिर जाती हैं। परिणाम अपशिष्ट गणना है, और कई मामलों में, कमी हुई सटीकता। लेखक निष्कर्ष निकालते हैं कि चेन-ऑफ-थॉट “प्रदर्शनी है, न कि यांत्रिक”—एक सतह-स्तर का प्रदर्शन जो व्याख्या करने का भ्रम पैदा करता है बिना इसके साथ।

प्रतीकात्मक एआई: प्रारंभिक सपनों से नए पुनरुत्थान तक

सीओटी की आलोचना प्रतीकात्मक एआई के इतिहास पर एक नज़र डालती है। अपने शुरुआती दशकों में, एआई शोध नियम-आधारित प्रणालियों के इर्द-गिर्द घूमता था जो ज्ञान को स्पष्ट तार्किक रूप में एन्कोड करते थे। विशेषज्ञ प्रणाली जैसे एमआईसीआईएन ने हाथ से तैयार नियमों को लागू करके बीमारियों का निदान करने का प्रयास किया, और धोखाधड़ी का पता लगाने वाली प्रणाली विसंगतियों को पकड़ने के लिए विशाल तर्क सेट पर निर्भर करती थी।

प्रतीकात्मक एआई की निर्विवाद ताकत थी: इसके तर्क का हर कदम पारदर्शी और अनुसरण योग्य था। लेकिन ये प्रणालियां कठोर थीं। दसियों हज़ार नियमों को एन्कोड करने के लिए भारी श्रम की आवश्यकता थी, और वे नए स्थितियों का सामना करने में संघर्ष करते थे। आलोचकों जैसे ह्यूबर्ट ड्रेफस ने तर्क दिया कि मानव बुद्धिमत्ता पर निर्भर करती है जो कोई नियम सेट पकड़ नहीं सकता। 1990 के दशक में, प्रतीकात्मक दृष्टिकोण डेटा-चालित न्यूरल नेटवर्क के लिए रास्ता दिया।

हाल के वर्षों में, दोनों दुनिया की ताकत को मिलाने के लिए न्यूरो-प्रतीकात्मक एआई के माध्यम से प्रतीकात्मक तर्क और न्यूरल सीखने को एक साथ लाने का प्रयास किया गया है। विचार सीधा है: न्यूरल नेटवर्क को दृष्टिगत इनपुट जैसे छवियों या पाठ को संभालने दें, जबकि प्रतीकात्मक मॉड्यूल संरचित तर्क और तार्किक गारंटी प्रदान करते हैं। लेकिन अधिकांश हाइब्रिड एकीकरण के साथ संघर्ष करते हैं। प्रतीकात्मक रीढ़ बहुत कठोर थी, जबकि न्यूरल मॉड्यूल अक्सर संगति को कमजोर करते थे। परिणाम जटिल, भारी प्रणाली थीं जो वादा किए गए व्याख्या करने में विफल रहीं।

जनरल सिम्बोलिक्स: एक नई तर्क लेयर

कोरथिंक का जनरल सिम्बोलिक्स रीज़नर (जीएसआर) इन सीमाओं को पार करने के लिए एक अलग दृष्टिकोण का लक्ष्य रखता है। कठोर औपचारिक संरचनाओं या उच्च-आयामी एम्बेडिंग में भाषा का अनुवाद करने के बजाय, जीएसआर पूरी तरह से प्राकृतिक भाषा में संचालित होता है। तर्क का हर कदम शब्दों में व्यक्त किया जाता है, जिससे संदर्भ, सूक्ष्मता और मोडलिटी संरक्षित रहती है। इसका मतलब है कि “चाहिए” और “चाहिए” जैसे अंतर को तर्क प्रक्रिया में ले जाया जाता है, न कि संक्षिप्त किया जाता है।

फ्रेमवर्क स्वाभाविक रूप से प्राकृतिक भाषा में इनपुट को पार्स करके काम करता है, भाषाई परिवर्तनों के माध्यम से तार्किक प्रतिबंध लागू करके, और मानव-पठनीय तर्क ट्रेस का उत्पादन करके जो पूरी तरह से मानव-पठनीय रहता है। जब विरोधाभास या त्रुटियां दिखाई देती हैं, तो वे सीधे तर्क पथ में सतह पर आते हैं, पारदर्शिता और डीबगिंग की अनुमति देते हैं। कुशल रहने के लिए, प्रणाली अनावश्यक चरणों को काट देती है, जिससे स्थिर लंबी दूरी की तर्क संभव हो जाता है बिना जीपीयू स्केलिंग के।

चूंकि यह एक परत के रूप में कार्य करता है, न कि पुनः प्रशिक्षण की आवश्यकता है, जीएसआर को मौजूदा आधार मॉडल में लागू किया जा सकता है। मूल्यांकन में, यह लगातार तर्क कार्यों में 30 से 60 प्रतिशत के बीच सटीकता में सुधार दिखाता है, सभी बिना प्रशिक्षण लागत बढ़ाए।

बेंचमार्क परिणाम

सुधार बेंचमार्क के माध्यम से सबसे अच्छी तरह से चित्रित किए जाते हैं। लाइवकोडबेंच वी6 पर, जो प्रतियोगिता ग्रेड कोडिंग समस्याओं का मूल्यांकन करता है, कोरथिंक ने 66.6 प्रतिशत पास दर हासिल की—जो अपनी श्रेणी में अग्रणी मॉडल से काफी अधिक है। एसडब्ल्यूई-बेंच लाइट में, जो गिटहब रिपॉजिटरी से वास्तविक दुनिया के बग फिक्सिंग के लिए एक बेंचमार्क है, प्रणाली ने 62.3 प्रतिशत सटीकता हासिल की, जो अब तक की सबसे उच्च रिपोर्ट की गई है। और एआरसी-एजीआई-2 पर, जो अमूर्त तर्क के लिए सबसे मांग वाले परीक्षणों में से एक है, इसने 24.4 प्रतिशत स्कोर किया, जो क्लाउड और जेमिनी जैसे फ्रंटियर मॉडल से काफी आगे है, जो 6 प्रतिशत से नीचे रहते हैं।

इन संख्याओं में केवल сыी सटीकता से ज्यादा है। विस्तृत मामले के अध्ययन में, प्रतीकात्मक परत ने मॉडल को अलग तरह से कार्य करने में सक्षम बनाया। स्किट-लर्न के कॉलमट्रांसफॉर्मर में, उदाहरण के लिए, एक बेसलाइन मॉडल ने एक सतही पैच का प्रस्ताव दिया जो त्रुटि को छुपाता था। कोरथिंक-आगमेंटेड सिस्टम ने इसके बजाय जड़ में सिंक्रोनाइजेशन समस्या की पहचान की और इसे व्यापक रूप से ठीक किया। एक कठिन लीकोड चुनौती पर, बेस मॉडल ने गतिशील प्रोग्रामिंग का गलत तरीके से आवेदन किया और पूरी तरह से विफल रहा, जबकि प्रतीकात्मक तर्क लेयर ने दोषपूर्ण राज्य प्रतिनिधित्व को सुधारा और एक कार्यशील समाधान का उत्पादन किया।

यह प्रतीकात्मक पुनरुत्थान में कैसे फिट बैठता है

जनरल सिम्बोलिक्स एक बढ़ते आंदोलन में शामिल हो जाता है जो एआई तर्क में संरचना वापस लाने का प्रयास करता है। क्लासिक प्रतीकात्मक एआई ने पारदर्शिता के मूल्य को दिखाया, लेकिन नए स्थितियों के अनुकूल नहीं हो सका। पारंपरिक न्यूरो-प्रतीकात्मक हाइब्रिड ने संतुलन का वादा किया, लेकिन अक्सर भारी हो गए। प्लानर स्टैक जो खोज को एलएलएम पर बोल्ट करते थे, उन्होंने शुरुआती आशा दिखाई, लेकिन जैसे ही कार्यों का दायरा बढ़ा, वे जटिलता के तहत ढह गए।

हाल के आग्रह इंगित करते हैं कि नए हाइब्रिड की संभावना है। डीपमाइंड का अल्फाज्यामिति, उदाहरण के लिए, यह प्रदर्शित किया है कि प्रतीकात्मक संरचनाएं ज्यामिति समस्याओं पर शुद्ध न्यूरल मॉडल से बेहतर प्रदर्शन कर सकती हैं। कोरथिंक का दृष्टिकोण इस प्रवृत्ति को आगे बढ़ाता है। अपने एआरसी-एजीआई पाइपलाइन में, निर्धारित वस्तु का पता लगाना और प्रतीकात्मक पैटर्न स抽CTION न्यूरल निष्पादन के साथ जोड़ा जाता है, जो एलएलएम-ओनली सिस्टम से परे परिणाम उत्पन्न करता है। टूल के उपयोग में, प्रतीकात्मक परत संदर्भ को बनाए रखने और प्रतिबंधों को लागू करने में मदद करती है, जिससे अधिक विश्वसनीय बहु-मोड़ योजना बनाने में सक्षम होती है।

मुख्य अंतर यह है कि जनरल सिम्बोलिक्स कठोर तर्क या विशाल पुनः प्रशिक्षण पर निर्भर नहीं करता है। प्राकृतिक भाषा में सीधे तर्क करके, यह लचीला रहता है जबकि व्याख्या करने की क्षमता को संरक्षित करता है। यह इसे पहले के हाइब्रिड से हल्का बनाता है, और महत्वपूर्ण रूप से, उद्यम अनुप्रयोगों में एकीकरण के लिए व्यावहारिक बनाता है।

यह क्यों महत्वपूर्ण है

यदि चेन-ऑफ-थॉट एक भ्रम है, तो एआई उद्योग को एक दबाव वाली चुनौती का सामना करना पड़ता है। उद्यमों पर निर्भर नहीं किया जा सकता है जो केवल तर्क दिखाते हैं, खासकर उच्च जोखिम वाले वातावरण जैसे चिकित्सा, कानून और वित्त में। कागज़ सुझाव देता है कि वास्तविक प्रगति मॉडल को आगे स्केल करने से नहीं आएगी, बल्कि तर्क के स्वयं के आधारों को पुनः सोचकर।

जनरल सिम्बोलिक्स एक ऐसा आधार है। यह एक हल्की, व्याख्या योग्य परत प्रदान करता है जो मौजूदा मॉडल को बिना पुनः प्रशिक्षण के सुधारित कर सकती है, जिससे वास्तविक तर्क सुधार होता है, न कि सतह-स्तर की कथाएं। एआई समुदाय के लिए, यह एक संभावित परिदृश्य परिवर्तन का प्रतिनिधित्व करता है: प्रतीकात्मक तर्क की वापसी, न कि कठोर नियम सेट के रूप में, बल्कि तार्किक सीखने के लिए एक लचीला साथी।

जैसा कि लेखक कहते हैं: “हमें बेहतर तर्क के लिए अधिक पैरामीटर जोड़ने की आवश्यकता नहीं है—हमें आधारों को पुनः सोचने की आवश्यकता है।”

Antoine Tardif, CEO & Founder of Unite.AI

एंटोनी एक दूरदर्शी नेता और Unite.AI के संस्थापक भागीदार हैं, जो कि एआई और रोबोटिक्स के भविष्य को आकार देने और बढ़ावा देने के लिए एक अटूट जुनून से प्रेरित हैं। एक श्रृंखला उद्यमी, वह मानता है कि एआई समाज के लिए उतना ही विघटनकारी होगा जितना कि बिजली, और अक्सर विघटनकारी प्रौद्योगिकियों और एजीआई की संभावना के बारे में उत्साहित होता है।

एक फ्यूचरिस्ट के रूप में, वह इन नवाचारों के माध्यम से हमारी दुनिया को आकार देने की खोज में समर्पित है। इसके अलावा, वह सिक्योरिटीज़.io के संस्थापक हैं, एक मंच जो भविष्य को फिर से परिभाषित करने और पूरे क्षेत्रों को फिर से आकार देने वाली अत्याधुनिक प्रौद्योगिकियों में निवेश पर केंद्रित है।

Unite.AI