विचार नेता

जेनरेटिव एआई में एलएलएम एजेंटों के लिए अवसरों और चुनौतियों को डिकोड करना

Published September 7, 2023

Updated April 4, 2026

Dattaraj Rao

हम जेनरेटिव एआई एप्लिकेशन को बड़े भाषा मॉडल (एलएलएम) द्वारा संचालित प्रॉम्प्ट से रिट्रीवल ऑगमेंटेड जेनरेशन (आरएजी) से एजेंटों तक एक प्रगति देख रहे हैं। एजेंट उद्योग और अनुसंधान सर्किलों में भारी मात्रा में चर्चा की जा रही है, मुख्य रूप से इस प्रौद्योगिकी द्वारा प्रदान की जाने वाली शक्ति के लिए एंटरप्राइज़ एप्लिकेशन को बदलने और श्रेष्ठ ग्राहक अनुभव प्रदान करने के लिए। एजेंटों के निर्माण के लिए सामान्य पैटर्न हैं जो कृत्रिम सामान्य बुद्धिमत्ता (एजीआई) की ओर पहले कदम को सक्षम बनाते हैं।

मेरे पिछले लेख में, हमने एलएलएम पावर्ड एप्लिकेशन के निर्माण के लिए बुद्धिमत्ता की एक सीढ़ी देखी। प्रॉम्प्ट के साथ शुरू जो समस्या डोमेन को पकड़ता है और आउटपुट उत्पन्न करने के लिए एलएलएम की आंतरिक मेमोरी का उपयोग करता है। आरएजी के साथ, हम प्रॉम्प्ट को एक वेक्टर डेटाबेस से खोजे गए बाहरी ज्ञान के साथ बढ़ाते हैं ताकि आउटपुट को नियंत्रित किया जा सके। अगले एलएलएम कॉल को चेनिंग करके हम जटिल एप्लिकेशन को महसूस करने के लिए कार्य प्रवाह बना सकते हैं। एजेंट इसे एक अगले स्तर पर ले जाते हैं जो यह निर्धारित करने के लिए कि इन एलएलएम श्रृंखलाओं का गठन कैसे किया जाना है। आइए विस्तार से देखें।

एजेंट – अंडर द हुड

एजेंटों के साथ एक प्रमुख पैटर्न यह है कि वे एलएलएम की भाषा समझने की शक्ति का उपयोग एक दिए गए समस्या को हल करने के लिए एक योजना बनाने के लिए करते हैं। एलएलएम समस्या को समझता है और हमें समस्या को हल करने के लिए चरणों की एक श्रृंखला देता है। लेकिन यह वहीं नहीं रुकता। एजेंट एक शुद्ध समर्थन प्रणाली नहीं है जो आपको समस्या को हल करने के लिए सिफारिशें प्रदान करेगी और फिर आपको सिफारिश किए गए चरणों को लेने के लिए बटन दे देगी। एजेंटों को टूलिंग से सशक्त बनाया गया है ताकि वे आगे बढ़कर कार्रवाई कर सकें। डरावना है, है ना?!

यदि हम एजेंट से एक बुनियादी प्रश्न पूछते हैं जैसे:

मानव: टेलीफोन के आविष्कारक ने किस कंपनी की स्थापना की?

निम्नलिखित एक एजेंट द्वारा लिए जाने वाले सोच के चरणों का एक नमूना है।

एजेंट (सोच):

विचार: मुझे टेलीफोन के आविष्कारक के लिए खोज करने की आवश्यकता है।
कार्रवाई: खोज [टेलीफोन के आविष्कारक]
अवलोकन: अलेक्जेंडर ग्राहम बेल
विचार: मुझे अलेक्जेंडर ग्राहम बेल द्वारा स्थापित एक कंपनी के लिए खोज करने की आवश्यकता है
कार्रवाई: खोज [अलेक्जेंडर ग्राहम बेल द्वारा स्थापित कंपनी]
अवलोकन: अलेक्जेंडर ग्राहम बेल ने 1885 में अमेरिकन टेलीफोन और टेलीग्राफ कंपनी (एटी एंड टी) की सह-स्थापना की
विचार: मैंने उत्तर पाया है। मैं लौटूंगा。

एजेंट (प्रतिक्रिया): अलेक्जेंडर ग्राहम बेल ने 1885 में एटी एंड टी की सह-स्थापना की

आप देख सकते हैं कि एजेंट समस्या को हल करने के लिए एक तर्कसंगत तरीके से समस्या को उप-समस्याओं में तोड़ता है जो विशिष्ट कार्रवाइयों को लेने से हल की जा सकती हैं। यहाँ कार्रवाइयाँ एलएलएम द्वारा सिफारिश की जाती हैं और हम इन्हें विशिष्ट टूल्स से मैप कर सकते हैं ताकि इन कार्रवाइयों को लागू किया जा सके। हम एक एजेंट के लिए एक खोज टूल को सक्षम कर सकते हैं ताकि जब यह महसूस करे कि एलएलएम ने खोज को एक कार्रवाई के रूप में प्रदान किया है, तो यह टूल को एलएलएम द्वारा प्रदान किए गए पैरामीटर के साथ कॉल करेगा। यहाँ खोज इंटरनेट पर हो सकती है लेकिन इसे एक आंतरिक ज्ञान आधार जैसे कि एक वेक्टर डेटाबेस में भी निर्देशित किया जा सकता है। प्रणाली अब स्वयं-सufficient हो जाती है और जटिल समस्याओं को हल करने के लिए चरणों की एक श्रृंखला का पता लगा सकती है। लैंगचेन और एलएलएमएइंडेक्स जैसे फ्रेमवर्क आपको इन एजेंटों को बनाने और टूलिंग और एपीआई से कनेक्ट करने का एक आसान तरीका प्रदान करते हैं। अमेज़न ने हाल ही में अपने बेडरॉक एजेंट्स फ्रेमवर्क लॉन्च किया है जो एजेंटों को डिज़ाइन करने के लिए एक दृश्य इंटरफ़ेस प्रदान करता है।

अंडर द हुड, एजेंट एलएलएम को प्रॉम्प्ट भेजने की एक विशेष शैली का पालन करते हैं जो उन्हें एक कार्रवाई योजना उत्पन्न करने के लिए प्रेरित करते हैं। उपरोक्त विचार-कार्रवाई-अवलोकन पैटर्न रिएक्ट (रीज़निंग एंड एक्टिंग) नामक एक प्रकार के एजेंट में लोकप्रिय है। अन्य प्रकार के एजेंटों में एमआरकेएल और प्लान एंड एक्जीक्यूट शामिल हैं, जो मुख्य रूप से उनकी प्रॉम्प्टिंग शैली में भिन्न होते हैं।

जटिल एजेंटों के लिए, कार्रवाइयाँ स्रोत प्रणालियों में परिवर्तन पैदा करने वाले टूल्स से जुड़ी हो सकती हैं। उदाहरण के लिए, हम एजेंट को एक टूल से कनेक्ट कर सकते हैं जो एक ईआरपी प्रणाली में एक कर्मचारी के लिए अवकाश संतुलन की जांच करता है और अवकाश के लिए आवेदन करता है। अब हम एक अच्छा चैटबॉट बना सकते हैं जो उपयोगकर्ताओं के साथ बातचीत करेगा और एक चैट कमांड के माध्यम से प्रणाली में अवकाश के लिए आवेदन करेगा। अवकाश के लिए आवेदन करने के लिए अब जटिल स्क्रीन नहीं होंगी, एक सरल एकीकृत चैट इंटरफ़ेस। यह रोमांचक लगता है!

सावधानियां और जिम्मेदार एआई की आवश्यकता

अब अगर हमारे पास एक टूल है जो एक पूर्व-अधिकृत एपीआई का उपयोग करके स्टॉक ट्रेडिंग पर लेनदेन को आमंत्रित करता है। आप एक ऐसा एप्लिकेशन बनाते हैं जहां एजेंट स्टॉक परिवर्तनों (टूल्स का उपयोग करके) का अध्ययन करता है और आपके लिए स्टॉक की खरीद और बिक्री पर निर्णय लेता है। लेकिन अगर एजेंट गलत स्टॉक बेच देता है क्योंकि यह भ्रमित हो गया और एक गलत निर्णय लिया? चूंकि एलएलएम विशाल मॉडल हैं, इसलिए यह जानना मुश्किल है कि वे कुछ निर्णय क्यों लेते हैं, इसलिए भ्रम की अनुपस्थिति में उचित गार्डरेल के बिना भ्रम आम है।

जबकि एजेंट सभी आकर्षक हैं, आप शायद अनुमान लगा सकते हैं कि वे कितने खतरनाक हो सकते हैं। यदि वे भ्रमित हो जाते हैं और एक गलत कार्रवाई करते हैं जो बड़े वित्तीय नुकसान या एंटरप्राइज़ प्रणालियों में बड़ी समस्याएं पैदा कर सकते हैं। इसलिए, जिम्मेदार एआई एलएलएम पावर्ड एप्लिकेशन के युग में अत्यंत महत्वपूर्ण हो रहा है। जिम्मेदार एआई के सिद्धांत पुनरुत्पादन, पारदर्शिता और जवाबदेही के आसपास एजेंटों द्वारा लिए गए निर्णयों पर गार्डरेल लगाने का प्रयास करते हैं और यह तय करने के लिए जोखिम विश्लेषण का सुझाव देते हैं कि किन कार्रवाइयों के लिए मानव-इन-द-लूप की आवश्यकता है। जैसे ही अधिक जटिल एजेंट डिज़ाइन किए जा रहे हैं, उन्हें सुनिश्चित करने के लिए अधिक स्क्रूटिनी, पारदर्शिता और जवाबदेही की आवश्यकता है कि हम जानते हैं कि वे क्या कर रहे हैं।

समापन विचार

एजेंटों की क्षमता एक तर्कसंगत चरणों की श्रृंखला के साथ कार्रवाई उत्पन्न करने के लिए उन्हें मानव तर्क के बहुत करीब ले जाती है। उन्हें अधिक शक्तिशाली टूल्स से सशक्त बनाने से उन्हें सुपरपावर मिल सकती है। रिएक्ट जैसे पैटर्न मानव द्वारा समस्या को हल करने के तरीके की नकल करने का प्रयास करते हैं और हम विशिष्ट संदर्भों और डोमेन (बैंकिंग, बीमा, स्वास्थ्य सेवा, औद्योगिक, आदि) के लिए प्रासंगिक बेहतर एजेंट पैटर्न देखेंगे। भविष्य यहाँ है और एजेंटों के पीछे की तकनीक हमारे उपयोग के लिए तैयार है। साथ ही, हमें जिम्मेदार एआई गार्डरेल पर करीब से ध्यान देने की आवश्यकता है ताकि हम सुनिश्चित कर सकें कि हम स्काईनेट! का निर्माण नहीं कर रहे हैं!

Related Topics:generative ai Langchain Large Language Models LLM RAG retrieval augmented generation thought leaders

Dattaraj Rao

डाटाराज राव, Persistent Systems में चीफ डेटा साइंटिस्ट, पुस्तक “केरस टू क्यूबरनेट्स: एक मशीन लर्निंग मॉडल की उत्पादन यात्रा” के लेखक हैं। पERSISTENT सिस्टम में, डाटाराज एआई रिसर्च लैब का नेतृत्व करते हैं जो कंप्यूटर विजन, नेचरल लैंग्वेज अंडरस्टैंडिंग, प्रोबेबिलिस्टिक प्रोग्रामिंग, रिनफोर्समेंट लर्निंग, एक्सप्लेनेबल एआई आदि में राज्य-कला एल्गोरिदम का अन्वेषण करता है और स्वास्थ्य सेवा, बैंकिंग और औद्योगिक क्षेत्रों में इसकी व्यावहारिकता का प्रदर्शन करता है। डाटाराज के पास मशीन लर्निंग और कंप्यूटर विजन में 11 पेटेंट हैं।