рд╡рд┐рдЪрд╛рд░ рдиреЗрддрд╛
рдЬреЗрдирд░реЗрдЯрд┐рд╡ рдПрдЖрдИ рдореЗрдВ рдПрд▓рдПрд▓рдПрдо рдПрдЬреЗрдВрдЯреЛрдВ рдХреЗ рд▓рд┐рдП рдЕрд╡рд╕рд░реЛрдВ рдФрд░ рдЪреБрдиреМрддрд┐рдпреЛрдВ рдХреЛ рдбрд┐рдХреЛрдб рдХрд░рдирд╛

हम जेनरेटिव एआई एप्लिकेशन को बड़े भाषा मॉडल (एलएलएम) द्वारा संचालित प्रॉम्प्ट से रिट्रीवल ऑगमेंटेड जेनरेशन (आरएजी) से एजेंटों तक एक प्रगति देख रहे हैं। एजेंट उद्योग और अनुसंधान सर्किलों में भारी मात्रा में चर्चा की जा रही है, मुख्य रूप से इस प्रौद्योगिकी द्वारा प्रदान की जाने वाली शक्ति के लिए एंटरप्राइज़ एप्लिकेशन को बदलने और श्रेष्ठ ग्राहक अनुभव प्रदान करने के लिए। एजेंटों के निर्माण के लिए सामान्य पैटर्न हैं जो कृत्रिम सामान्य बुद्धिमत्ता (एजीआई) की ओर पहले कदम को सक्षम बनाते हैं।
मेरे पिछले लेख में, हमने एलएलएम पावर्ड एप्लिकेशन के निर्माण के लिए बुद्धिमत्ता की एक सीढ़ी देखी। प्रॉम्प्ट के साथ शुरू जो समस्या डोमेन को पकड़ता है और आउटपुट उत्पन्न करने के लिए एलएलएम की आंतरिक मेमोरी का उपयोग करता है। आरएजी के साथ, हम प्रॉम्प्ट को एक वेक्टर डेटाबेस से खोजे गए बाहरी ज्ञान के साथ बढ़ाते हैं ताकि आउटपुट को नियंत्रित किया जा सके। अगले एलएलएम कॉल को चेनिंग करके हम जटिल एप्लिकेशन को महसूस करने के लिए कार्य प्रवाह बना सकते हैं। एजेंट इसे एक अगले स्तर पर ले जाते हैं जो यह निर्धारित करने के लिए कि इन एलएलएम श्रृंखलाओं का गठन कैसे किया जाना है। आइए विस्तार से देखें।

एजेंट – अंडर द हुड
एजेंटों के साथ एक प्रमुख पैटर्न यह है कि वे एलएलएम की भाषा समझने की शक्ति का उपयोग एक दिए गए समस्या को हल करने के लिए एक योजना बनाने के लिए करते हैं। एलएलएम समस्या को समझता है और हमें समस्या को हल करने के लिए चरणों की एक श्रृंखला देता है। लेकिन यह वहीं नहीं रुकता। एजेंट एक शुद्ध समर्थन प्रणाली नहीं है जो आपको समस्या को हल करने के लिए सिफारिशें प्रदान करेगी और फिर आपको सिफारिश किए गए चरणों को लेने के लिए बटन दे देगी। एजेंटों को टूलिंग से सशक्त बनाया गया है ताकि वे आगे बढ़कर कार्रवाई कर सकें। डरावना है, है ना?!
यदि हम एजेंट से एक बुनियादी प्रश्न पूछते हैं जैसे:
मानव: टेलीफोन के आविष्कारक ने किस कंपनी की स्थापना की?
निम्नलिखित एक एजेंट द्वारा लिए जाने वाले सोच के चरणों का एक नमूना है।
एजेंट (सोच):
- विचार: मुझे टेलीफोन के आविष्कारक के लिए खोज करने की आवश्यकता है।
- कार्रवाई: खोज [टेलीफोन के आविष्कारक]
- अवलोकन: अलेक्जेंडर ग्राहम बेल
- विचार: मुझे अलेक्जेंडर ग्राहम बेल द्वारा स्थापित एक कंपनी के लिए खोज करने की आवश्यकता है
- कार्रवाई: खोज [अलेक्जेंडर ग्राहम बेल द्वारा स्थापित कंपनी]
- अवलोकन: अलेक्जेंडर ग्राहम बेल ने 1885 में अमेरिकन टेलीफोन और टेलीग्राफ कंपनी (एटी एंड टी) की सह-स्थापना की
- विचार: मैंने उत्तर पाया है। मैं लौटूंगा。
एजेंट (प्रतिक्रिया): अलेक्जेंडर ग्राहम बेल ने 1885 में एटी एंड टी की सह-स्थापना की
आप देख सकते हैं कि एजेंट समस्या को हल करने के लिए एक तर्कसंगत तरीके से समस्या को उप-समस्याओं में तोड़ता है जो विशिष्ट कार्रवाइयों को लेने से हल की जा सकती हैं। यहाँ कार्रवाइयाँ एलएलएम द्वारा सिफारिश की जाती हैं और हम इन्हें विशिष्ट टूल्स से मैप कर सकते हैं ताकि इन कार्रवाइयों को लागू किया जा सके। हम एक एजेंट के लिए एक खोज टूल को सक्षम कर सकते हैं ताकि जब यह महसूस करे कि एलएलएम ने खोज को एक कार्रवाई के रूप में प्रदान किया है, तो यह टूल को एलएलएम द्वारा प्रदान किए गए पैरामीटर के साथ कॉल करेगा। यहाँ खोज इंटरनेट पर हो सकती है लेकिन इसे एक आंतरिक ज्ञान आधार जैसे कि एक वेक्टर डेटाबेस में भी निर्देशित किया जा सकता है। प्रणाली अब स्वयं-सufficient हो जाती है और जटिल समस्याओं को हल करने के लिए चरणों की एक श्रृंखला का पता लगा सकती है। लैंगचेन और एलएलएमएइंडेक्स जैसे फ्रेमवर्क आपको इन एजेंटों को बनाने और टूलिंग और एपीआई से कनेक्ट करने का एक आसान तरीका प्रदान करते हैं। अमेज़न ने हाल ही में अपने बेडरॉक एजेंट्स फ्रेमवर्क लॉन्च किया है जो एजेंटों को डिज़ाइन करने के लिए एक दृश्य इंटरफ़ेस प्रदान करता है।
अंडर द हुड, एजेंट एलएलएम को प्रॉम्प्ट भेजने की एक विशेष शैली का पालन करते हैं जो उन्हें एक कार्रवाई योजना उत्पन्न करने के लिए प्रेरित करते हैं। उपरोक्त विचार-कार्रवाई-अवलोकन पैटर्न रिएक्ट (रीज़निंग एंड एक्टिंग) नामक एक प्रकार के एजेंट में लोकप्रिय है। अन्य प्रकार के एजेंटों में एमआरकेएल और प्लान एंड एक्जीक्यूट शामिल हैं, जो मुख्य रूप से उनकी प्रॉम्प्टिंग शैली में भिन्न होते हैं।
जटिल एजेंटों के लिए, कार्रवाइयाँ स्रोत प्रणालियों में परिवर्तन पैदा करने वाले टूल्स से जुड़ी हो सकती हैं। उदाहरण के लिए, हम एजेंट को एक टूल से कनेक्ट कर सकते हैं जो एक ईआरपी प्रणाली में एक कर्मचारी के लिए अवकाश संतुलन की जांच करता है और अवकाश के लिए आवेदन करता है। अब हम एक अच्छा चैटबॉट बना सकते हैं जो उपयोगकर्ताओं के साथ बातचीत करेगा और एक चैट कमांड के माध्यम से प्रणाली में अवकाश के लिए आवेदन करेगा। अवकाश के लिए आवेदन करने के लिए अब जटिल स्क्रीन नहीं होंगी, एक सरल एकीकृत चैट इंटरफ़ेस। यह रोमांचक लगता है!
सावधानियां और जिम्मेदार एआई की आवश्यकता
अब अगर हमारे पास एक टूल है जो एक पूर्व-अधिकृत एपीआई का उपयोग करके स्टॉक ट्रेडिंग पर लेनदेन को आमंत्रित करता है। आप एक ऐसा एप्लिकेशन बनाते हैं जहां एजेंट स्टॉक परिवर्तनों (टूल्स का उपयोग करके) का अध्ययन करता है और आपके लिए स्टॉक की खरीद और बिक्री पर निर्णय लेता है। लेकिन अगर एजेंट गलत स्टॉक बेच देता है क्योंकि यह भ्रमित हो गया और एक गलत निर्णय लिया? चूंकि एलएलएम विशाल मॉडल हैं, इसलिए यह जानना मुश्किल है कि वे कुछ निर्णय क्यों लेते हैं, इसलिए भ्रम की अनुपस्थिति में उचित गार्डरेल के बिना भ्रम आम है।
जबकि एजेंट सभी आकर्षक हैं, आप शायद अनुमान लगा सकते हैं कि वे कितने खतरनाक हो सकते हैं। यदि वे भ्रमित हो जाते हैं और एक गलत कार्रवाई करते हैं जो बड़े वित्तीय नुकसान या एंटरप्राइज़ प्रणालियों में बड़ी समस्याएं पैदा कर सकते हैं। इसलिए, जिम्मेदार एआई एलएलएम पावर्ड एप्लिकेशन के युग में अत्यंत महत्वपूर्ण हो रहा है। जिम्मेदार एआई के सिद्धांत पुनरुत्पादन, पारदर्शिता और जवाबदेही के आसपास एजेंटों द्वारा लिए गए निर्णयों पर गार्डरेल लगाने का प्रयास करते हैं और यह तय करने के लिए जोखिम विश्लेषण का सुझाव देते हैं कि किन कार्रवाइयों के लिए मानव-इन-द-लूप की आवश्यकता है। जैसे ही अधिक जटिल एजेंट डिज़ाइन किए जा रहे हैं, उन्हें सुनिश्चित करने के लिए अधिक स्क्रूटिनी, पारदर्शिता और जवाबदेही की आवश्यकता है कि हम जानते हैं कि वे क्या कर रहे हैं।
समापन विचार
एजेंटों की क्षमता एक तर्कसंगत चरणों की श्रृंखला के साथ कार्रवाई उत्पन्न करने के लिए उन्हें मानव तर्क के बहुत करीब ले जाती है। उन्हें अधिक शक्तिशाली टूल्स से सशक्त बनाने से उन्हें सुपरपावर मिल सकती है। रिएक्ट जैसे पैटर्न मानव द्वारा समस्या को हल करने के तरीके की नकल करने का प्रयास करते हैं और हम विशिष्ट संदर्भों और डोमेन (बैंकिंग, बीमा, स्वास्थ्य सेवा, औद्योगिक, आदि) के लिए प्रासंगिक बेहतर एजेंट पैटर्न देखेंगे। भविष्य यहाँ है और एजेंटों के पीछे की तकनीक हमारे उपयोग के लिए तैयार है। साथ ही, हमें जिम्मेदार एआई गार्डरेल पर करीब से ध्यान देने की आवश्यकता है ताकि हम सुनिश्चित कर सकें कि हम स्काईनेट! का निर्माण नहीं कर रहे हैं!










