कृत्रिम बुद्धिमत्ता

डीपमाइंड का माइंड इवोल्यूशन: वास्तविक दुनिया की समस्याओं का समाधान करने के लिए बड़े भाषा मॉडल को सशक्त बनाना

Published February 6, 2025

Updated April 26, 2026

Dr. Tehseen Zia

हाल के वर्षों में, कृत्रिम बुद्धिमत्ता (एआई) विभिन्न उद्योगों में नवाचार को बढ़ावा देने के लिए एक व्यावहारिक उपकरण के रूप में उभरी है। इस प्रगति के अग्रिम पंक्ति में बड़े भाषा मॉडल (एलएलएम) हैं, जो मानव भाषा को समझने और उत्पन्न करने की उनकी क्षमता के लिए जाने जाते हैं। जबकि एलएलएम कॉन्वर्सेशनल एआई और सामग्री निर्माण जैसे कार्यों में अच्छा प्रदर्शन करते हैं, वे अक्सर संरचित तर्क और योजना की आवश्यकता वाली जटिल वास्तविक दुनिया की चुनौतियों का सामना करते हैं।

उदाहरण के लिए, यदि आप एलएलएम से एक मल्टी-सिटी व्यवसाय यात्रा की योजना बनाने के लिए कहते हैं जिसमें उड़ान के समय, बैठक के समय, बजट प्रतिबंधों और पर्याप्त आराम का समन्वय शामिल है, तो वे व्यक्तिगत पहलुओं के लिए सुझाव प्रदान कर सकते हैं। हालांकि, वे इन पहलुओं को प्रभावी ढंग से संतुलित करने के लिए एक दूसरे के साथ एकीकृत करने में चुनौतियों का सामना करते हैं। यह सीमा तब और भी स्पष्ट हो जाती है जब एलएलएम का उपयोग स्वायत्त रूप से वास्तविक दुनिया की समस्याओं का समाधान करने में सक्षम एआई एजेंटों का निर्माण करने के लिए किया जाता है।

गूगल डीपमाइंड ने हाल ही में इस समस्या का समाधान विकसित किया है। प्राकृतिक चयन से प्रेरित, इस दृष्टिकोण को माइंड इवोल्यूशन के रूप में जाना जाता है, जो समस्या-समाधान रणनीतियों को पुनरावृत्ति अनुकूलन के माध्यम से परिष्कृत करता है। एलएलएम को वास्तविक समय में मार्गदर्शन करके, यह उन्हें जटिल वास्तविक दुनिया के कार्यों का प्रभावी ढंग से सामना करने और गतिशील परिदृश्यों के अनुकूल होने की अनुमति देता है। इस लेख में, हम यह देखेंगे कि यह नवाचार विधि कैसे काम करती है, इसके संभावित अनुप्रयोग, और इसका एआई-संचालित समस्या-समाधान के भविष्य के लिए क्या अर्थ है।

एलएलएम जटिल तर्क और योजना के साथ क्यों संघर्ष करते हैं

एलएलएम को बड़े पाठ डेटासेट, जैसे कि पुस्तकें, लेख, और ऑनलाइन सामग्री में पैटर्न का विश्लेषण करके एक वाक्य में अगले शब्द की भविष्यवाणी करने के लिए प्रशिक्षित किया जाता है। यह उन्हें तर्कसंगत और संदर्भ-संबंधी प्रतिक्रियाएं उत्पन्न करने की अनुमति देता है। हालांकि, यह प्रशिक्षण पैटर्न को पहचानने पर आधारित है, न कि अर्थ को समझने पर। इसके परिणामस्वरूप, एलएलएम ऐसा पाठ उत्पन्न कर सकते हैं जो तर्कसंगत लगता है लेकिन गहरे तर्क या संरचित योजना की आवश्यकता वाले कार्यों के साथ संघर्ष करते हैं।

एलएलएम द्वारा जानकारी को संसाधित करने का मूल सीमा है। वे तर्क के बजाय संभावनाओं या पैटर्न पर ध्यान केंद्रित करते हैं, जिसका अर्थ है कि वे अलग-अलग कार्यों को संभाल सकते हैं – जैसे कि उड़ान विकल्प या होटल सिफारिशें – लेकिन उन्हें एक साथ एकीकृत करने में विफल रहते हैं जब इन कार्यों को एक साथ एकीकृत करने की आवश्यकता होती है। यह उन्हें समय के साथ संदर्भ बनाए रखने में भी मुश्किल बना देता है। जटिल कार्य अक्सर पिछले निर्णयों को ट्रैक करने और नई जानकारी के उदय के रूप में अनुकूलन की आवश्यकता होती है। एलएलएम, हालांकि, विस्तारित बातचीत में ध्यान केंद्रित करने में असमर्थ होते हैं, जिसके परिणामस्वरूप टुकड़े-टुकड़े या असंगत आउटपुट होते हैं।

माइंड इवोल्यूशन कैसे काम करता है

डीपमाइंड का माइंड इवोल्यूशन इन कमियों को प्राकृतिक विकास के सिद्धांतों को अपनाकर संबोधित करता है। एक जटिल प्रश्न के लिए एकल प्रतिक्रिया उत्पन्न करने के बजाय, यह दृष्टिकोण कई संभावित समाधान उत्पन्न करता है, उन्हें पुनरावृत्ति रूप से परिष्कृत करता है, और एक संरचित मूल्यांकन प्रक्रिया के माध्यम से सर्वोत्तम परिणाम का चयन करता है। उदाहरण के लिए, एक परियोजना के लिए विचारों पर टीम ब्रेनस्टॉर्मिंग पर विचार करें। कुछ विचार उत्कृष्ट हैं, अन्य कम। टीम सभी विचारों का मूल्यांकन करती है, सर्वोत्तम को बनाए रखती है और शेष को त्याग देती है। वे तब सर्वोत्तम विचारों में सुधार करते हैं, नए भिन्नताओं को पेश करते हैं, और सर्वोत्तम समाधान तक पहुंचने तक प्रक्रिया को दोहराते हैं। माइंड इवोल्यूशन एलएलएम पर इस सिद्धांत को लागू करता है।

यहाँ यह कैसे काम करता है इसका एक विवरण है:

उत्पन्न: प्रक्रिया एलएलएम द्वारा एक दिए गए समस्या के लिए कई प्रतिक्रियाएं बनाने से शुरू होती है। उदाहरण के लिए, एक यात्रा योजना कार्य में, मॉडल विभिन्न यात्रा कार्यक्रम तैयार कर सकता है जो बजट, समय, और उपयोगकर्ता प्राथमिकताओं पर आधारित होते हैं।
मूल्यांकन: प्रत्येक समाधान का मूल्यांकन एक फिटनेस फंक्शन के खिलाफ किया जाता है, जो यह मापता है कि यह कितनी अच्छी तरह से कार्यों की आवश्यकताओं को संतुष्ट करता है। कम गुणवत्ता वाली प्रतिक्रियाएं त्याग दी जाती हैं, जबकि सबसे आशाजनक उम्मीदवार अगले चरण में आगे बढ़ते हैं।
परिष्करण: माइंड इवोल्यूशन की एक अनोखी नवाचार यह है कि एलएलएम के भीतर दो व्यक्तित्वों के बीच संवाद होता है: लेखक और आलोचक। लेखक समाधान प्रस्तुत करता है, जबकि आलोचक खामियों की पहचान करता है और प्रतिक्रिया प्रदान करता है। यह संरचित संवाद मानवों द्वारा विचारों को परिष्कृत करने के तरीके को दर्शाता है – आलोचना और संशोधन के माध्यम से। उदाहरण के लिए, यदि लेखक एक यात्रा योजना प्रस्तुत करता है जिसमें एक रेस्तरां का दौरा शामिल है जो बजट से अधिक है, तो आलोचक इस बात पर ध्यान दिलाता है। लेखक तब आलोचक की चिंताओं को दूर करने के लिए योजना को संशोधित करता है। यह प्रक्रिया एलएलएम को गहरे विश्लेषण करने में सक्षम बनाती है जो पहले अन्य प्रॉम्प्टिंग तकनीकों का उपयोग करके संभव नहीं था।
पुनरावृत्ति अनुकूलन: परिष्कृत समाधानों का आगे मूल्यांकन और पुनर्संयोजन किया जाता है ताकि परिष्कृत समाधान उत्पन्न किए जा सकें।

इस चक्र को दोहराकर, माइंड इवोल्यूशन समाधानों की गुणवत्ता में पुनरावृत्ति रूप से सुधार करता है, जिससे एलएलएम जटिल चुनौतियों का अधिक प्रभावी ढंग से सामना कर सकते हैं।

माइंड इवोल्यूशन एक्शन में

डीपमाइंड ने इस दृष्टिकोण का परीक्षण बेंचमार्क जैसे ट्रैवलप्लानर और नेचरल प्लान पर किया। इस दृष्टिकोण का उपयोग करके, गूगल के जेमिनी ने ट्रैवलप्लानर पर 95.2% की सफलता दर हासिल की, जो 5.6% के बेसलाइन से एक उत्कृष्ट सुधार है। जेमिनी प्रो के साथ, सफलता दर लगभग 99.9% तक बढ़ गई। यह परिवर्तनकारी प्रदर्शन माइंड इवोल्यूशन की व्यावहारिक चुनौतियों का समाधान करने की प्रभावशीलता को दर्शाता है।

रोचक बात यह है कि मॉडल की प्रभावशीलता कार्य की जटिलता के साथ बढ़ती है। उदाहरण के लिए, जबकि एकल-पास विधियां कई शहरों में कई दिनों के यात्रा कार्यक्रमों के साथ संघर्ष करती हैं, माइंड इवोल्यूशन निरंतर रूप से बेहतर प्रदर्शन करता है, जटिलता में वृद्धि के साथ भी उच्च सफलता दर बनाए रखता है।

चुनौतियां और भविष्य के दिशानिर्देश

माइंड इवोल्यूशन के बावजूद, इसकी अपनी सीमाएं हैं। इस दृष्टिकोण को महत्वपूर्ण कम्प्यूटेशनल संसाधनों की आवश्यकता होती है क्योंकि पुनरावृत्ति मूल्यांकन और परिष्करण प्रक्रियाएं शामिल हैं। उदाहरण के लिए, माइंड इवोल्यूशन के साथ एक ट्रैवलप्लानर कार्य का समाधान करने में तीन मिलियन टोकन और 167 एपीआई कॉल की खपत हुई – जो परंपरागत तरीकों की तुलना में काफी अधिक है। हालांकि, यह दृष्टिकोण अभी भी ब्रूट-फोर्स रणनीतियों जैसे थकाऊ खोज से अधिक कुशल बना हुआ है।

इसके अलावा, कुछ कार्यों के लिए प्रभावी फिटनेस फंक्शन का डिज़ाइन करना एक चुनौतीपूर्ण कार्य हो सकता है। भविष्य के शोध में कम्प्यूटेशनल दक्षता को अनुकूलित करने और तकनीक की पहुंच को व्यापक समस्याओं की श्रृंखला में विस्तारित करने पर ध्यान केंद्रित किया जा सकता है, जैसे कि रचनात्मक लेखन या जटिल निर्णय लेना।

एक और दिलचस्प अनुसंधान क्षेत्र डोमेन-विशिष्ट मूल्यांकनकर्ताओं का एकीकरण हो सकता है। उदाहरण के लिए, चिकित्सा निदान में, फिटनेस फंक्शन में विशेषज्ञ ज्ञान को शामिल करना मॉडल की सटीकता और विश्वसनीयता को और बढ़ा सकता है।

योजना से परे अनुप्रयोग

हालांकि माइंड इवोल्यूशन मुख्य रूप से योजना कार्यों पर मूल्यांकन किया जाता है, इसका विभिन्न डोमेन में अनुप्रयोग हो सकता है, जैसे कि रचनात्मक लेखन, वैज्ञानिक खोज, और यहां तक कि कोड जेनरेशन। उदाहरण के लिए, शोधकर्ताओं ने स्टेगपोएट नामक एक बेंचमार्क पेश किया है, जो मॉडल को कविताओं के भीतर छिपे संदेशों को एनकोड करने की चुनौती देता है। हालांकि यह कार्य अभी भी कठिन है, माइंड इवोल्यूशन पारंपरिक तरीकों से आगे निकलकर 79.2% तक की सफलता दर प्राप्त करता है।

प्राकृतिक भाषा में समाधानों को अनुकूलित और विकसित करने की क्षमता उन समस्याओं का समाधान करने के लिए नए अवसर खोलती है जो औपचारिक रूप से परिभाषित करना मुश्किल है, जैसे कि कार्य प्रवाह में सुधार या नवाचार उत्पाद डिज़ाइन उत्पन्न करना। विकासवादी एल्गोरिदम की शक्ति का उपयोग करके, माइंड इवोल्यूशन एलएलएम की समस्या-समाधान क्षमताओं को बढ़ाने के लिए एक लचीला और स्केलेबल फ्रेमवर्क प्रदान करता है।

नीचे की रेखा

डीपमाइंड का माइंड इवोल्यूशन एलएलएम में मुख्य सीमाओं को पार करने का एक व्यावहारिक और प्रभावी तरीका पेश करता है। प्राकृतिक चयन से प्रेरित पुनरावृत्ति परिष्करण का उपयोग करके, यह जटिल, बहु-चरण वाले कार्यों को संभालने की उनकी क्षमता में सुधार करता है जिनमें संरचित तर्क और योजना की आवश्यकता होती है। यह दृष्टिकोण चुनौतीपूर्ण परिदृश्यों जैसे यात्रा योजना में महत्वपूर्ण सफलता दिखा चुका है और विभिन्न डोमेन में आशाजनक दिखता है, जिसमें रचनात्मक लेखन, वैज्ञानिक अनुसंधान, और कोड जेनरेशन शामिल है। जबकि उच्च कम्प्यूटेशनल लागत और अच्छी तरह से डिज़ाइन किए गए फिटनेस फंक्शन की आवश्यकता जैसी चुनौतियां बनी हुई हैं, यह दृष्टिकोण एआई क्षमताओं में सुधार के लिए एक स्केलेबल फ्रेमवर्क प्रदान करता है। माइंड इवोल्यूशन वास्तविक दुनिया की चुनौतियों का समाधान करने में सक्षम अधिक शक्तिशाली एआई प्रणालियों के लिए मंच तैयार करता है।

Dr. Tehseen Zia

डॉ. तहसीन ज़िया कोम्सैट्स यूनिवर्सिटी इस्लामाबाद में एक टेन्योर्ड एसोसिएट प्रोफेसर हैं, जो ऑस्ट्रिया की वियना टेक्नोलॉजी यूनिवर्सिटी से एआई में पीएचडी रखते हैं। आर्टिफिशियल इंटेलिजेंस, मशीन लर्निंग, डेटा साइंस और कंप्यूटर विजन में विशेषज्ञता, उन्होंने प्रतिष्ठित वैज्ञानिक पत्रिकाओं में प्रकाशन के साथ महत्वपूर्ण योगदान दिया है। डॉ. तहसीन ने प्रिंसिपल इन्वेस्टिगेटर के रूप में विभिन्न औद्योगिक परियोजनाओं का नेतृत्व किया है और एक एआई सलाहकार के रूप में कार्य किया है।