कृत्रिम बुद्धिमत्ता

स्वायत्त एजेंट्स के साथ एजेंटऑप्स: आपके एआई एप्लिकेशन के लिए पर्यवेक्षणीयता, अनुसंधानीयता, और परे

Published November 20, 2024

Updated April 3, 2026

Aayush Mittal Mittal

AgentOps: Enabling Observability and Traceability for Autonomous Agents

फाउंडेशन मॉडल्स (एफएम) जैसे लार्ज लैंग्वेज मॉडल्स (एलएलएम) द्वारा स्वायत्त एजेंट्स की वृद्धि ने जटिल, बहु-चरण समस्याओं को हल करने के तरीके को संशोधित किया है। ये एजेंट ग्राहक समर्थन से लेकर सॉफ्टवेयर इंजीनियरिंग तक कार्यों की एक श्रृंखला का संचालन करते हैं, जो तर्क, टूल का उपयोग, और स्मृति को मिलाकर जटिल कार्य प्रवाहों का नेविगेशन करते हैं।

हालांकि, जब ये सिस्टम क्षमता और जटिलता में बढ़ते हैं, तो पर्यवेक्षणीयता, विश्वसनीयता, और अनुपालन में चुनौतियां उत्पन्न होती हैं।

यहीं पर एजेंटऑप्स आता है; एक अवधारणा जो डेवऑप्स और एमएलओप्स के बाद बनाई गई है, लेकिन एफएम-आधारित एजेंट्स के जीवन चक्र को प्रबंधित करने के लिए अनुकूलित है।

एजेंटऑप्स और इसकी महत्वपूर्ण भूमिका को समझने के लिए, मैंने हाल के शोध पत्र एजेंटऑप्स के लिए फाउंडेशन मॉडल-आधारित एजेंट्स की पर्यवेक्षणीयता के लिए एक टैक्सोनॉमी से जानकारी प्राप्त की है, जो लिमिंग डोंग, क्विंगहुआ लू, और लिमिंग झू द्वारा लिखा गया है। यह पत्र एजेंटऑप्स की एक व्यापक खोज प्रदान करता है, जो इसकी आवश्यकता को एजेंट्स के जीवन चक्र को प्रबंधित करने के लिए उजागर करता है – निर्माण और निष्पादन से मूल्यांकन और निगरानी तक। लेखक अनुसंधानीय कलाकृतियों को वर्गीकृत करते हैं, पर्यवेक्षणीयता प्लेटफ़ॉर्म के लिए मुख्य विशेषताओं का प्रस्ताव करते हैं, और निर्णय जटिलता और नियामक अनुपालन जैसी चुनौतियों का समाधान करते हैं।

जबकि एजेंटऑप्स (टूल) ने एआई एजेंट्स (जैसे ऑटोजेन, क्रू एआई) की निगरानी, डीबगिंग, और अनुकूलन के लिए एक प्रमुख टूल के रूप में महत्वपूर्ण गति प्राप्त की है, यह लेख एआई ऑपरेशन्स (ओप्स) की व्यापक अवधारणा पर केंद्रित है।

उस कहा, एजेंटऑप्स (टूल) डेवलपर्स को एजेंट कार्य प्रवाहों में अंतर्दृष्टि प्रदान करता है, जैसे कि सत्र पुनरावृत्ति, एलएलएम लागत ट्रैकिंग, और अनुपालन निगरानी। एआई में सबसे लोकप्रिय ओप्स टूल्स में से एक के रूप में, बाद में इस लेख में हम इसकी कार्यक्षमता के माध्यम से एक ट्यूटोरियल के साथ जाएंगे।

एजेंटऑप्स क्या है?

एजेंटऑप्स उत्पादन में एफएम-आधारित स्वायत्त एजेंट्स को डिज़ाइन, तैनात, निगरानी, और अनुकूलित करने के लिए आवश्यक अंत-से-अंत प्रक्रियाओं, टूल्स, और फ्रेमवर्क्स को संदर्भित करता है। इसके लक्ष्य हैं:

पर्यवेक्षणीयता: एजेंट के निष्पादन और निर्णय लेने की प्रक्रियाओं में पूर्ण दृश्यता प्रदान करना।
अनुसंधानीयता: एजेंट के जीवन चक्र में विस्तृत कलाकृतियों को कब्जे में लेना डीबगिंग, अनुकूलन, और अनुपालन के लिए।
विश्वसनीयता: निगरानी और मजबूत कार्य प्रवाहों के माध्यम से संगत और विश्वसनीय आउटपुट सुनिश्चित करना।

इसके मूल में, एजेंटऑप्स पारंपरिक एमएलओप्स से परे जाता है, जो पुनरावृत्ति, बहु-चरण कार्य प्रवाहों, टूल एकीकरण, और अनुकूली स्मृति पर जोर देता है, जबकि कठोर ट्रैकिंग और निगरानी बनाए रखता है।

एजेंटऑप्स द्वारा संबोधित प्रमुख चुनौतियां

1. एजेंटिक सिस्टम्स की जटिलता

स्वायत्त एजेंट व्यापक कार्य स्थान में कार्यों को संसाधित करते हैं, जिसमें प्रत्येक चरण में निर्णय लेने की आवश्यकता होती है। यह जटिलता परिष्कृत योजना और निगरानी तंत्रों की मांग करती है।

2. पर्यवेक्षणीयता आवश्यकताएं

उच्च जोखिम वाले उपयोग के मामले – जैसे कि चिकित्सा निदान या कानूनी विश्लेषण – विस्तृत अनुसंधानीयता की मांग करते हैं। नियमन जैसे कि ईयू एआई अधिनियम के अनुपालन के लिए भी पर्यवेक्षणीयता फ्रेमवर्क की आवश्यकता को रेखांकित करता है।

3. डीबगिंग और अनुकूलन

बहु-चरण कार्य प्रवाहों में त्रुटियों की पहचान करना या मध्यवर्ती आउटपुट का मूल्यांकन करना एजेंट की क्रियाओं के विस्तृत ट्रेस के बिना चुनौतीपूर्ण है।

4. स्केलेबिलिटी और लागत प्रबंधन

उत्पादन के लिए एजेंट्स को स्केल करने के लिए लेटेंसी, टोकन उपयोग, और परिचालन लागत जैसे मेट्रिक्स की निगरानी करना आवश्यक है ताकि यह सुनिश्चित किया जा सके कि गुणवत्ता के साथ कुशलता है।

एजेंटऑप्स प्लेटफ़ॉर्म की मुख्य विशेषताएं

1. एजेंट निर्माण और अनुकूलन

डेवलपर्स घटकों के रजिस्ट्री का उपयोग करके एजेंट्स को कॉन्फ़िगर कर सकते हैं:

भूमिकाएं: जिम्मेदारियों (जैसे कि शोधकर्ता, योजनाकार) को परिभाषित करें।
गार्डरेल: नैतिक और विश्वसनीय व्यवहार सुनिश्चित करने के लिए प्रतिबंध सेट करें।
टूलकिट: एपीआई, डेटाबेस, या ज्ञान ग्राफ के साथ एकीकरण को सक्षम करें।

एजेंट्स विशिष्ट डेटासेट, टूल्स, और प्रॉम्प्ट्स के साथ बातचीत करने के लिए बनाए जाते हैं, जबकि पूर्वनिर्धारित नियमों के अनुपालन को बनाए रखते हैं।

2. पर्यवेक्षणीयता और अनुसंधानीयता

एजेंटऑप्स विस्तृत निष्पादन लॉग्स को कब्जे में लेता है:

ट्रेस: एजेंट के कार्य प्रवाह में प्रत्येक चरण को रिकॉर्ड करें, एलएलएम कॉल्स से लेकर टूल उपयोग तक।
स्पैन: ट्रेस को विस्तृत चरणों में तोड़ें, जैसे कि पुनर्प्राप्ति, एम्बेडिंग जनरेशन, या टूल इनवोकेशन।
कलाकृतियां: मध्यवर्ती आउटपुट, स्मृति राज्य, और प्रॉम्प्ट टेम्पलेट्स को ट्रैक करें ताकि डीबगिंग में मदद मिले।

पर्यवेक्षणीयता टूल्स जैसे कि लैंगफ्यूज़ या अराइज़ डैशबोर्ड प्रदान करते हैं जो इन ट्रेस को विज़ुअलाइज़ करते हैं, जो बोतलनेक या त्रुटियों की पहचान करने में मदद करते हैं।

3. प्रॉम्प्ट प्रबंधन

प्रॉम्प्ट इंजीनियरिंग एजेंट व्यवहार को आकार देने में एक महत्वपूर्ण भूमिका निभाता है। मुख्य विशेषताएं हैं:

संस्करण: प्रदर्शन तुलना के लिए प्रॉम्प्ट्स के संस्करणों को ट्रैक करें।
इंजेक्शन डिटेक्शन: प्रॉम्प्ट्स के भीतर दुर्भाग्यपूर्ण कोड या इनपुट त्रुटियों की पहचान करें।
अनुकूलन: तकनीकों जैसे कि चेन-ऑफ-थॉट (सीओटी) या ट्री ऑफ थॉट रीज़निंग क्षमताओं में सुधार करते हैं।

4. फीडबैक एकीकरण

मानव फीडबैक एजेंट के प्रदर्शन और मूल्यांकन बेंचमार्क को सुधारने के लिए महत्वपूर्ण है:

स्पष्ट फीडबैक: उपयोगकर्ता आउटपुट को रेट करते हैं या टिप्पणियां प्रदान करते हैं।
अस्पष्ट फीडबैक: मेट्रिक्स जैसे कि समय-पर-कार्य या क्लिक-थ्रू दरों का विश्लेषण किया जाता है ताकि प्रभावशीलता का आकलन किया जा सके।

यह फीडबैक लूप एजेंट के प्रदर्शन और मूल्यांकन बेंचमार्क दोनों को सुधारता है।

5. मूल्यांकन और परीक्षण

एजेंटऑप्स प्लेटफ़ॉर्म उद्योग मानकों के खिलाफ एजेंट प्रदर्शन की तुलना करने के लिए परीक्षण को सुविधाजनक बनाता है:

बेंचमार्क: एजेंट प्रदर्शन की तुलना उद्योग मानकों के साथ करें।
चरण-दर-चरण मूल्यांकन: कार्य प्रवाहों में मध्यवर्ती चरणों का मूल्यांकन करें ताकि सहीपन सुनिश्चित किया जा सके।
ट्रेजेक्टरी मूल्यांकन: एजेंट द्वारा अपनाई गई निर्णय लेने की पथ को मान्य करें।

6. स्मृति और ज्ञान एकीकरण

एजेंट्स अल्पकालिक स्मृति का उपयोग संदर्भ (जैसे कि बातचीत इतिहास) के लिए और दीर्घकालिक स्मृति के लिए पिछले कार्यों से अंतर्दृष्टि संग्रहीत करने के लिए करते हैं। यह एजेंट्स को गतिविधियों को अनुकूलित करने की अनुमति देता है, जबकि समय के साथ सुसंगतता बनाए रखता है।

7. निगरानी और मेट्रिक्स

व्यापक निगरानी मेट्रिक्स को ट्रैक करती है:

लेटेंसी: प्रतिक्रिया समय को मापें ताकि अनुकूलन सुनिश्चित किया जा सके।
टोकन उपयोग: संसाधन खपत की निगरानी करें ताकि लागत नियंत्रित की जा सके।
गुणवत्ता मेट्रिक्स: प्रासंगिकता, सटीकता, और विषाक्तता का मूल्यांकन करें।

इन मेट्रिक्स को उपयोगकर्ता सत्र, प्रॉम्प्ट्स, और कार्य प्रवाह जैसे आयामों में दिखाया जाता है, जो वास्तविक समय हस्तक्षेप को सक्षम बनाता है।

अनुसंधानीय कलाकृतियों की टैक्सोनॉमी

पत्र एजेंटऑप्स पर्यवेक्षणीयता के लिए एक व्यवस्थित टैक्सोनॉमी पेश करता है:

एजेंट निर्माण कलाकृतियां: भूमिकाओं, लक्ष्यों, और प्रतिबंधों के बारे में मेटाडेटा।
निष्पादन कलाकृतियां: टूल कॉल, उपकार्य कतारें, और तर्क चरणों के लॉग।
मूल्यांकन कलाकृतियां: बेंचमार्क, फीडबैक लूप, और स्कोरिंग मेट्रिक्स।
अनुसंधानीय कलाकृतियां: सत्र आईडी, ट्रेस आईडी, और स्पैन विस्तृत निगरानी के लिए।

यह टैक्सोनॉमी एजेंट के जीवन चक्र में सुसंगतता और स्पष्टता सुनिश्चित करती है, जो डीबगिंग और अनुपालन को अधिक प्रबंधनीय बनाती है।

एजेंटऑप्स (टूल) वॉकथ्रू

यह आपको एजेंटऑप्स सेट अप करने और अपने एआई एजेंट्स को निगरानी और अनुकूलित करने के लिए मार्गदर्शन करेगा।

चरण 1: एजेंटऑप्स एसडीके स्थापित करें

पाइथन पैकेज मैनेजर का उपयोग करके एजेंटऑप्स स्थापित करें:

pip install agentops

चरण 2: एजेंटऑप्स को आरंभ करें

एजेंटऑप्स आयात करें और अपने एपीआई कुंजी का उपयोग करके इसे आरंभ करें। सुरक्षा के लिए एपीआई कुंजी को एक .env फ़ाइल में स्टोर करें:

# एजेंटऑप्स को एपीआई कुंजी के साथ आरंभ करें
import agentops
import os
from dotenv import load_dotenv

# पर्यावरण переменшки लोड करें
load_dotenv()
AGENTOPS_API_KEY = os.getenv("AGENTOPS_API_KEY")

# एजेंटऑप्स क्लाइंट को आरंभ करें
agentops.init(api_key=AGENTOPS_API_KEY, default_tags=["my-first-agent"])

यह चरण आपके अनुप्रयोग में एलएलएम इंटरैक्शन के लिए पर्यवेक्षणीयता सेट अप करता है।

चरण 3: डिकोरेटर्स के साथ क्रियाओं को रिकॉर्ड करें

निर्दिष्ट फ़ंक्शन को @record_action डिकोरेटर का उपयोग करके इंस्ट्रुमेंट करें, जो उनके पैरामीटर, निष्पादन समय, और आउटपुट को ट्रैक करता है। यहाँ एक उदाहरण है:

from agentops import record_action

@record_action("custom-action-tracker")
def is_prime(number):
"""एक संख्या को प्राइम जांचें।"""
if number &lt; 2:
return False
for i in range(2, int(number**0.5) + 1):
if number % i == 0:
return False
return True

फ़ंक्शन अब एजेंटऑप्स डैशबोर्ड में लॉग किया जाएगा, जो निष्पादन समय और इनपुट-आउटपुट ट्रैकिंग के लिए मेट्रिक्स प्रदान करता है।

चरण 4: नामित एजेंट्स को ट्रैक करें

यदि आप नामित एजेंट्स का उपयोग कर रहे हैं, तो @track_agent डिकोरेटर का उपयोग करके सभी क्रियाओं और घटनाओं को विशिष्ट एजेंट्स से जोड़ें।

from agentops import track_agent

@track_agent(name=”math-agent”)

Aayush Mittal

मैं पिछले पांच वर्षों से मशीन लर्निंग और डीप लर्निंग की आकर्षक दुनिया में खुद को डूबा रहा हूं। मेरा जुनून और विशेषज्ञता ने मुझे 50 से अधिक विविध सॉफ्टवेयर इंजीनियरिंग परियोजनाओं में योगदान देने के लिए प्रेरित किया है, जिसमें विशेष रूप से एआई/एमएल पर ध्यान केंद्रित किया गया है। मेरी लगातार जिज्ञासा ने मुझे प्राकृतिक भाषा प्रसंस्करण की ओर आकर्षित किया है, जो एक क्षेत्र है जिसे मैं आगे अन्वेषण करने के लिए उत्सुक हूं।