Artificial Intelligence
मेटा का कोकोनट: एआई पद्धति जो बिना भाषा के सोचती है

जब शोधकर्ताओं ने पहली बार पाया कि बड़े भाषा मॉडल (एलएलएम) चरण दर चरण "सोच" सकते हैं चेन-ऑफ़-विचार प्रोत्साहक, यह एक महत्वपूर्ण क्षण था - आखिरकार, हम इन ब्लैक बॉक्स की तर्क प्रक्रिया में झांक सकते थे। लेकिन क्या होगा अगर मैं आपको बताऊं कि AI मॉडल को प्राकृतिक भाषा में सोचने पर मजबूर करना उन्हें पीछे खींच सकता है?
मेटा और यूसी सैन डिएगो के शोधकर्ताओं ने अपने अध्ययन से यही खुलासा किया है। नई नारियल (निरंतर विचार की श्रृंखला) विधि.
कल्पना कीजिए कि आप एक जटिल गणित समस्या को हल करने की कोशिश कर रहे हैं और आपको हर एक चरण को ज़ोर से बताने के लिए मजबूर किया जा रहा है। परेशान करने वाला है, है न? अब आप भाषा मॉडल के सामने आने वाली मुख्य चुनौती को समझने के करीब पहुँच रहे हैं।
जब हम AI मॉडल को प्राकृतिक भाषा के माध्यम से तर्क करने योग्य बनाते हैं:
- वे जो अधिकांश टोकन बनाते हैं, वे केवल भाषाई गोंद हैं - "इसलिए", "अगला" और "परिणामस्वरूप" जैसे शब्द जो शून्य तर्क मूल्य जोड़ते हैं
- महत्वपूर्ण निर्णय बिंदु विशिष्ट शब्दों के प्रति प्रतिबद्धता की आवश्यकता के कारण बाधित हो जाते हैं
- मॉडल वास्तविक समस्या-समाधान के बजाय व्याकरणिक सुसंगतता बनाए रखने पर महत्वपूर्ण कम्प्यूटेशनल प्रयास खर्च करता है
शोधकर्ताओं ने अपने न्यूरोइमेजिंग अध्ययनों में एक दिलचस्प बात पाई: जब मनुष्य जटिल तर्क कार्यों से निपटते हैं, तो हमारे मस्तिष्क के भाषा केंद्र अक्सर आश्चर्यजनक रूप से शांत रहते हैं। फिर भी हम ऐसे AI सिस्टम बना रहे हैं जो इसके विपरीत काम करते हैं - उन्हें हर तर्क चरण को शब्दों में अनुवाद करने के लिए मजबूर करते हैं।
इस बारे में सोचें कि आप पहेली को कैसे हल करते हैं। आपका दिमाग संभवतः एक साथ कई संभावनाओं की खोज करता है, अस्पष्ट परिकल्पनाओं को बनाए रखता है, और समाधान साझा करते समय ही अपने विचारों को भाषा में ढालता है। लेकिन पारंपरिक चेन-ऑफ-थॉट दृष्टिकोण एआई मॉडल को हर मध्यवर्ती चरण को मौखिक रूप देने के लिए मजबूर करते हैं, जिससे "भाषाई अड़चन" पैदा होती है।
इस अंतर्दृष्टि ने एक सम्मोहक प्रश्न को जन्म दिया: क्या होगा यदि हम एआई मॉडल को उनकी मूल "भाषा" में तर्क करने दें - उनके छिपे हुए राज्यों का निरंतर, उच्च-आयामी स्थान - बजाय इसके कि उन्हें सब कुछ टोकन में अनुवाद करने के लिए मजबूर किया जाए?
कोकोनट के नवाचार को समझना
अपने विचारों को ज़ोर से बोलने और अपने मस्तिष्क में होने वाली वास्तविक मानसिक प्रक्रिया के बीच के अंतर की कल्पना करें। मौखिक विचारों और तंत्रिका गतिविधि के बीच का वह अंतर - ठीक वही है जिसे मेटा के शोधकर्ताओं ने COCONUT के साथ खोजा है।
COCONUT की असली सफलता इस बात में निहित है कि यह AI मॉडल को दो अलग-अलग तरीकों से सोचने की अनुमति देता है, बिल्कुल वैसे ही जैसे मनुष्य सोचते हैं। जब आप कोई जटिल पहेली सुलझा रहे हों, तो सोचें - आप अपने दिमाग में हर संभावित चाल का वर्णन नहीं करते, है न? इसके बजाय, आप:
- समस्या को आत्मसात करें: आप जानकारी ग्रहण करते हैं (जैसे पहेली के नियमों को पढ़ना)
- चुपचाप सोचोआपका मस्तिष्क बिना शब्दों में व्यक्त किए अनेक संभावनाओं की खोज करता है
- समाधान साझा करें: तभी आप अपनी सोच दूसरों को समझा पाते हैं
COCONUT AI मॉडल को यही प्राकृतिक लचीलापन देता है। उन्हें हर विचार को ज़ोर से "बोलने" के लिए मजबूर करने के बजाय (जैसा कि पारंपरिक तरीके करते हैं), यह उन्हें अपने प्राकृतिक तंत्रिका स्थान में सोचने देता है - जिसे शोधकर्ता "अव्यक्त स्थान" कहते हैं।
मॉडल आसानी से दो मोड के बीच स्विच करता है:
- जब उसे प्रश्नों को समझने या उत्तर देने की आवश्यकता होती है, तो वह सामान्य भाषा का उपयोग करता है
- लेकिन वास्तविक चिंतन प्रक्रिया के लिए? यह शुद्ध तंत्रिका पैटर्न का उपयोग करता है, शब्दों की बाध्यताओं से मुक्त

छवि: मेटा
प्रशिक्षण यात्रा
COCONUT का सबसे आकर्षक पहलू इसका प्रशिक्षण पाठ्यक्रम है। जो बात इसे खास बनाती है वह यह है कि यह प्राकृतिक सीखने की प्रगति को कैसे दर्शाता है। इस बारे में सोचें कि हम जटिल कौशल कैसे सिखाते हैं - आप किसी को तुरंत गहरे अंत में नहीं फेंक देते। आप धीरे-धीरे निर्माण करते हैं, प्रत्येक स्तर पर महारत हासिल करने के साथ जटिलता जोड़ते हैं।
शोधकर्ताओं ने नारियल के साथ भी यही दृष्टिकोण अपनाया:
चरण 1: नींव
सबसे पहले, मॉडल किसी भी अन्य AI की तरह सीखता है - पारंपरिक विचार-श्रृंखला तर्क के माध्यम से। इससे इसे एक ठोस आधारभूत समझ मिलती है।
चरण 2: परिवर्तन
यहाँ यह दिलचस्प हो जाता है। धीरे-धीरे, उन लिखित तर्क चरणों को निरंतर विचारों से बदल दिया जाता है। कल्पना करें कि धीरे-धीरे प्रशिक्षण पहियों को हटा दिया जाए, जिससे मॉडल को अपने स्वयं के आंतरिक सोच पैटर्न विकसित करने दिया जा सके।
चरण 3: संतुलन
अंततः, मॉडल अव्यक्त स्थान में गहन चिंतन और स्पष्ट भाषा में अपनी अंतर्दृष्टि को संप्रेषित करने के बीच सहजता से स्विच करना सीखता है।
प्रशिक्षण के दौरान, मॉडल ने ऐसी क्षमताएँ विकसित कीं जिन्हें किसी ने स्पष्ट रूप से प्रोग्राम नहीं किया था - जैसे एक साथ कई तर्क पथों पर विचार करना। यह उभरता हुआ व्यवहार विशेष रूप से रोमांचक है क्योंकि यह सुझाव देता है कि हम AI तर्क के अधिक प्राकृतिक रूपों के करीब पहुँच रहे हैं। ये अप्रत्याशित विकास ही अक्सर सबसे बड़ी सफलताओं की ओर ले जाते हैं।
क्या आपको वो न्यूरोइमेजिंग अध्ययन याद हैं जिनका मैंने पहले ज़िक्र किया था? उन्होंने दिखाया कि मानव मस्तिष्क अक्सर भाषा केंद्रों को ज़्यादा शामिल किए बिना जटिल तर्क कार्यों को संसाधित करता है। ऐसा लगता है कि COCONUT भी इसी तरह के पैटर्न विकसित कर रहा है - अपने मूल तंत्रिका स्थान में गहराई से सोचना और संचार के लिए ज़रूरत पड़ने पर ही भाषा में बदलना।
संख्याएं एक कहानी कहती हैं
शोध से कुछ और प्रमुख निष्कर्ष सामने आए:
- गणित शब्द समस्याएं (GSM8k): यहाँ, COCONUT ने 34.1% सटीकता हासिल की। हालाँकि यह पारंपरिक चेन-ऑफ-थॉट (42.9%) से कम है, लेकिन यह बेसलाइन दृष्टिकोणों से काफी बेहतर है।
- तार्किक निष्कर्ष (प्रोंटोक्यूए): COCONUT ने 99.8% सटीकता हासिल की, जो पारंपरिक चेन-ऑफ-थॉट के 98.8% से कहीं आगे निकल गई। लेकिन यहाँ एक बात है - इसने CoT के 9 टोकन की तुलना में सिर्फ़ 92.5 टोकन का उपयोग करके ऐसा किया।
- जटिल योजना (ProsQA): सबसे प्रभावशाली परिणाम इस उन्नत तर्क परीक्षण से आए। COCONUT ने 97% सटीकता हासिल की, जबकि पारंपरिक तरीके केवल 77.5% तक ही पहुँच पाए। और फिर, इसने यह उल्लेखनीय दक्षता के साथ किया - 14.2 टोकन बनाम 49.4।
इन परिणामों को आशाजनक बनाने वाली बात सिर्फ़ कच्ची संख्याएँ नहीं हैं - बल्कि यह है कि वे विभिन्न प्रकार की सोच के बारे में क्या बताते हैं। हालाँकि COCONUT अभी भी गणितीय तर्क के साथ अपनी स्थिति तलाश रहा है, लेकिन यह जटिल तार्किक योजना और निष्कर्ष की आवश्यकता वाले कार्यों में उत्कृष्ट है।
COCONUT इस बात पर मौलिक पुनर्विचार का प्रतिनिधित्व करता है कि AI सिस्टम किस तरह से तर्क कर सकते हैं, और यह हमें कृत्रिम बुद्धिमत्ता के अधिक प्राकृतिक, कुशल और शक्तिशाली रूपों के करीब ले जाता है। भाषा-आधारित तर्क से लेकर निरंतर विचार तक की यात्रा अधिक सक्षम और कुशल AI सिस्टम की ओर एक कदम है।