Connect with us

рд╕реНрд╡рд╛рдпрддреНрдд рдПрдЬреЗрдВрдЯреНрд╕ рдХреЗ рд╕рд╛рде рдПрдЬреЗрдВрдЯрдСрдкреНрд╕: рдЖрдкрдХреЗ рдПрдЖрдИ рдПрдкреНрд▓рд┐рдХреЗрд╢рди рдХреЗ рд▓рд┐рдП рдкрд░реНрдпрд╡реЗрдХреНрд╖рдгреАрдпрддрд╛, рдЕрдиреБрд╕рдВрдзрд╛рдиреАрдпрддрд╛, рдФрд░ рдкрд░реЗ

рдХреГрддреНрд░рд┐рдо рдмреБрджреНрдзрд┐рдорддреНрддрд╛

рд╕реНрд╡рд╛рдпрддреНрдд рдПрдЬреЗрдВрдЯреНрд╕ рдХреЗ рд╕рд╛рде рдПрдЬреЗрдВрдЯрдСрдкреНрд╕: рдЖрдкрдХреЗ рдПрдЖрдИ рдПрдкреНрд▓рд┐рдХреЗрд╢рди рдХреЗ рд▓рд┐рдП рдкрд░реНрдпрд╡реЗрдХреНрд╖рдгреАрдпрддрд╛, рдЕрдиреБрд╕рдВрдзрд╛рдиреАрдпрддрд╛, рдФрд░ рдкрд░реЗ

mm
AgentOps: Enabling Observability and Traceability for Autonomous Agents

फाउंडेशन मॉडल्स (एफएम) जैसे लार्ज लैंग्वेज मॉडल्स (एलएलएम) द्वारा स्वायत्त एजेंट्स की वृद्धि ने जटिल, बहु-चरण समस्याओं को हल करने के तरीके को संशोधित किया है। ये एजेंट ग्राहक समर्थन से लेकर सॉफ्टवेयर इंजीनियरिंग तक कार्यों की एक श्रृंखला का संचालन करते हैं, जो तर्क, टूल का उपयोग, और स्मृति को मिलाकर जटिल कार्य प्रवाहों का नेविगेशन करते हैं।

हालांकि, जब ये सिस्टम क्षमता और जटिलता में बढ़ते हैं, तो पर्यवेक्षणीयता, विश्वसनीयता, और अनुपालन में चुनौतियां उत्पन्न होती हैं।

यहीं पर एजेंटऑप्स आता है; एक अवधारणा जो डेवऑप्स और एमएलओप्स के बाद बनाई गई है, लेकिन एफएम-आधारित एजेंट्स के जीवन चक्र को प्रबंधित करने के लिए अनुकूलित है।

एजेंटऑप्स और इसकी महत्वपूर्ण भूमिका को समझने के लिए, मैंने हाल के शोध पत्र एजेंटऑप्स के लिए फाउंडेशन मॉडल-आधारित एजेंट्स की पर्यवेक्षणीयता के लिए एक टैक्सोनॉमी से जानकारी प्राप्त की है, जो लिमिंग डोंग, क्विंगहुआ लू, और लिमिंग झू द्वारा लिखा गया है। यह पत्र एजेंटऑप्स की एक व्यापक खोज प्रदान करता है, जो इसकी आवश्यकता को एजेंट्स के जीवन चक्र को प्रबंधित करने के लिए उजागर करता है – निर्माण और निष्पादन से मूल्यांकन और निगरानी तक। लेखक अनुसंधानीय कलाकृतियों को वर्गीकृत करते हैं, पर्यवेक्षणीयता प्लेटफ़ॉर्म के लिए मुख्य विशेषताओं का प्रस्ताव करते हैं, और निर्णय जटिलता और नियामक अनुपालन जैसी चुनौतियों का समाधान करते हैं।

जबकि एजेंटऑप्स (टूल) ने एआई एजेंट्स (जैसे ऑटोजेन, क्रू एआई) की निगरानी, डीबगिंग, और अनुकूलन के लिए एक प्रमुख टूल के रूप में महत्वपूर्ण गति प्राप्त की है, यह लेख एआई ऑपरेशन्स (ओप्स) की व्यापक अवधारणा पर केंद्रित है।

उस कहा, एजेंटऑप्स (टूल) डेवलपर्स को एजेंट कार्य प्रवाहों में अंतर्दृष्टि प्रदान करता है, जैसे कि सत्र पुनरावृत्ति, एलएलएम लागत ट्रैकिंग, और अनुपालन निगरानी। एआई में सबसे लोकप्रिय ओप्स टूल्स में से एक के रूप में, बाद में इस लेख में हम इसकी कार्यक्षमता के माध्यम से एक ट्यूटोरियल के साथ जाएंगे।

एजेंटऑप्स क्या है?

एजेंटऑप्स उत्पादन में एफएम-आधारित स्वायत्त एजेंट्स को डिज़ाइन, तैनात, निगरानी, और अनुकूलित करने के लिए आवश्यक अंत-से-अंत प्रक्रियाओं, टूल्स, और फ्रेमवर्क्स को संदर्भित करता है। इसके लक्ष्य हैं:

  • पर्यवेक्षणीयता: एजेंट के निष्पादन और निर्णय लेने की प्रक्रियाओं में पूर्ण दृश्यता प्रदान करना।
  • अनुसंधानीयता: एजेंट के जीवन चक्र में विस्तृत कलाकृतियों को कब्जे में लेना डीबगिंग, अनुकूलन, और अनुपालन के लिए।
  • विश्वसनीयता: निगरानी और मजबूत कार्य प्रवाहों के माध्यम से संगत और विश्वसनीय आउटपुट सुनिश्चित करना।

इसके मूल में, एजेंटऑप्स पारंपरिक एमएलओप्स से परे जाता है, जो पुनरावृत्ति, बहु-चरण कार्य प्रवाहों, टूल एकीकरण, और अनुकूली स्मृति पर जोर देता है, जबकि कठोर ट्रैकिंग और निगरानी बनाए रखता है।

एजेंटऑप्स द्वारा संबोधित प्रमुख चुनौतियां

1. एजेंटिक सिस्टम्स की जटिलता

स्वायत्त एजेंट व्यापक कार्य स्थान में कार्यों को संसाधित करते हैं, जिसमें प्रत्येक चरण में निर्णय लेने की आवश्यकता होती है। यह जटिलता परिष्कृत योजना और निगरानी तंत्रों की मांग करती है।

2. पर्यवेक्षणीयता आवश्यकताएं

उच्च जोखिम वाले उपयोग के मामले – जैसे कि चिकित्सा निदान या कानूनी विश्लेषण – विस्तृत अनुसंधानीयता की मांग करते हैं। नियमन जैसे कि ईयू एआई अधिनियम के अनुपालन के लिए भी पर्यवेक्षणीयता फ्रेमवर्क की आवश्यकता को रेखांकित करता है।

3. डीबगिंग और अनुकूलन

बहु-चरण कार्य प्रवाहों में त्रुटियों की पहचान करना या मध्यवर्ती आउटपुट का मूल्यांकन करना एजेंट की क्रियाओं के विस्तृत ट्रेस के बिना चुनौतीपूर्ण है।

4. स्केलेबिलिटी और लागत प्रबंधन

उत्पादन के लिए एजेंट्स को स्केल करने के लिए लेटेंसी, टोकन उपयोग, और परिचालन लागत जैसे मेट्रिक्स की निगरानी करना आवश्यक है ताकि यह सुनिश्चित किया जा सके कि गुणवत्ता के साथ कुशलता है।

एजेंटऑप्स प्लेटफ़ॉर्म की मुख्य विशेषताएं

1. एजेंट निर्माण और अनुकूलन

डेवलपर्स घटकों के रजिस्ट्री का उपयोग करके एजेंट्स को कॉन्फ़िगर कर सकते हैं:

  • भूमिकाएं: जिम्मेदारियों (जैसे कि शोधकर्ता, योजनाकार) को परिभाषित करें।
  • गार्डरेल: नैतिक और विश्वसनीय व्यवहार सुनिश्चित करने के लिए प्रतिबंध सेट करें।
  • टूलकिट: एपीआई, डेटाबेस, या ज्ञान ग्राफ के साथ एकीकरण को सक्षम करें।

एजेंट्स विशिष्ट डेटासेट, टूल्स, और प्रॉम्प्ट्स के साथ बातचीत करने के लिए बनाए जाते हैं, जबकि पूर्वनिर्धारित नियमों के अनुपालन को बनाए रखते हैं।

2. पर्यवेक्षणीयता और अनुसंधानीयता

एजेंटऑप्स विस्तृत निष्पादन लॉग्स को कब्जे में लेता है:

  • ट्रेस: एजेंट के कार्य प्रवाह में प्रत्येक चरण को रिकॉर्ड करें, एलएलएम कॉल्स से लेकर टूल उपयोग तक।
  • स्पैन: ट्रेस को विस्तृत चरणों में तोड़ें, जैसे कि पुनर्प्राप्ति, एम्बेडिंग जनरेशन, या टूल इनवोकेशन।
  • कलाकृतियां: मध्यवर्ती आउटपुट, स्मृति राज्य, और प्रॉम्प्ट टेम्पलेट्स को ट्रैक करें ताकि डीबगिंग में मदद मिले।

पर्यवेक्षणीयता टूल्स जैसे कि लैंगफ्यूज़ या अराइज़ डैशबोर्ड प्रदान करते हैं जो इन ट्रेस को विज़ुअलाइज़ करते हैं, जो बोतलनेक या त्रुटियों की पहचान करने में मदद करते हैं।

3. प्रॉम्प्ट प्रबंधन

प्रॉम्प्ट इंजीनियरिंग एजेंट व्यवहार को आकार देने में एक महत्वपूर्ण भूमिका निभाता है। मुख्य विशेषताएं हैं:

  • संस्करण: प्रदर्शन तुलना के लिए प्रॉम्प्ट्स के संस्करणों को ट्रैक करें।
  • इंजेक्शन डिटेक्शन: प्रॉम्प्ट्स के भीतर दुर्भाग्यपूर्ण कोड या इनपुट त्रुटियों की पहचान करें।
  • अनुकूलन: तकनीकों जैसे कि चेन-ऑफ-थॉट (सीओटी) या ट्री ऑफ थॉट रीज़निंग क्षमताओं में सुधार करते हैं।

4. फीडबैक एकीकरण

मानव फीडबैक एजेंट के प्रदर्शन और मूल्यांकन बेंचमार्क को सुधारने के लिए महत्वपूर्ण है:

  • स्पष्ट फीडबैक: उपयोगकर्ता आउटपुट को रेट करते हैं या टिप्पणियां प्रदान करते हैं।
  • अस्पष्ट फीडबैक: मेट्रिक्स जैसे कि समय-पर-कार्य या क्लिक-थ्रू दरों का विश्लेषण किया जाता है ताकि प्रभावशीलता का आकलन किया जा सके।

यह फीडबैक लूप एजेंट के प्रदर्शन और मूल्यांकन बेंचमार्क दोनों को सुधारता है।

5. मूल्यांकन और परीक्षण

एजेंटऑप्स प्लेटफ़ॉर्म उद्योग मानकों के खिलाफ एजेंट प्रदर्शन की तुलना करने के लिए परीक्षण को सुविधाजनक बनाता है:

  • बेंचमार्क: एजेंट प्रदर्शन की तुलना उद्योग मानकों के साथ करें।
  • चरण-दर-चरण मूल्यांकन: कार्य प्रवाहों में मध्यवर्ती चरणों का मूल्यांकन करें ताकि सहीपन सुनिश्चित किया जा सके।
  • ट्रेजेक्टरी मूल्यांकन: एजेंट द्वारा अपनाई गई निर्णय लेने की पथ को मान्य करें।

6. स्मृति और ज्ञान एकीकरण

एजेंट्स अल्पकालिक स्मृति का उपयोग संदर्भ (जैसे कि बातचीत इतिहास) के लिए और दीर्घकालिक स्मृति के लिए पिछले कार्यों से अंतर्दृष्टि संग्रहीत करने के लिए करते हैं। यह एजेंट्स को गतिविधियों को अनुकूलित करने की अनुमति देता है, जबकि समय के साथ सुसंगतता बनाए रखता है।

7. निगरानी और मेट्रिक्स

व्यापक निगरानी मेट्रिक्स को ट्रैक करती है:

  • लेटेंसी: प्रतिक्रिया समय को मापें ताकि अनुकूलन सुनिश्चित किया जा सके।
  • टोकन उपयोग: संसाधन खपत की निगरानी करें ताकि लागत नियंत्रित की जा सके।
  • गुणवत्ता मेट्रिक्स: प्रासंगिकता, सटीकता, और विषाक्तता का मूल्यांकन करें।

इन मेट्रिक्स को उपयोगकर्ता सत्र, प्रॉम्प्ट्स, और कार्य प्रवाह जैसे आयामों में दिखाया जाता है, जो वास्तविक समय हस्तक्षेप को सक्षम बनाता है।

अनुसंधानीय कलाकृतियों की टैक्सोनॉमी

पत्र एजेंटऑप्स पर्यवेक्षणीयता के लिए एक व्यवस्थित टैक्सोनॉमी पेश करता है:

  • एजेंट निर्माण कलाकृतियां: भूमिकाओं, लक्ष्यों, और प्रतिबंधों के बारे में मेटाडेटा।
  • निष्पादन कलाकृतियां: टूल कॉल, उपकार्य कतारें, और तर्क चरणों के लॉग।
  • मूल्यांकन कलाकृतियां: बेंचमार्क, फीडबैक लूप, और स्कोरिंग मेट्रिक्स।
  • अनुसंधानीय कलाकृतियां: सत्र आईडी, ट्रेस आईडी, और स्पैन विस्तृत निगरानी के लिए।

यह टैक्सोनॉमी एजेंट के जीवन चक्र में सुसंगतता और स्पष्टता सुनिश्चित करती है, जो डीबगिंग और अनुपालन को अधिक प्रबंधनीय बनाती है।

एजेंटऑप्स (टूल) वॉकथ्रू

यह आपको एजेंटऑप्स सेट अप करने और अपने एआई एजेंट्स को निगरानी और अनुकूलित करने के लिए मार्गदर्शन करेगा।

चरण 1: एजेंटऑप्स एसडीके स्थापित करें

पाइथन पैकेज मैनेजर का उपयोग करके एजेंटऑप्स स्थापित करें:

pip install agentops

चरण 2: एजेंटऑप्स को आरंभ करें

एजेंटऑप्स आयात करें और अपने एपीआई कुंजी का उपयोग करके इसे आरंभ करें। सुरक्षा के लिए एपीआई कुंजी को एक .env फ़ाइल में स्टोर करें:

# एजेंटऑप्स को एपीआई कुंजी के साथ आरंभ करें
import agentops
import os
from dotenv import load_dotenv

# पर्यावरण переменшки लोड करें
load_dotenv()
AGENTOPS_API_KEY = os.getenv("AGENTOPS_API_KEY")

# एजेंटऑप्स क्लाइंट को आरंभ करें
agentops.init(api_key=AGENTOPS_API_KEY, default_tags=["my-first-agent"])

यह चरण आपके अनुप्रयोग में एलएलएम इंटरैक्शन के लिए पर्यवेक्षणीयता सेट अप करता है।

चरण 3: डिकोरेटर्स के साथ क्रियाओं को रिकॉर्ड करें

निर्दिष्ट फ़ंक्शन को @record_action डिकोरेटर का उपयोग करके इंस्ट्रुमेंट करें, जो उनके पैरामीटर, निष्पादन समय, और आउटपुट को ट्रैक करता है। यहाँ एक उदाहरण है:

from agentops import record_action

@record_action("custom-action-tracker")
def is_prime(number):
"""एक संख्या को प्राइम जांचें।"""
if number < 2:
return False
for i in range(2, int(number**0.5) + 1):
if number % i == 0:
return False
return True

फ़ंक्शन अब एजेंटऑप्स डैशबोर्ड में लॉग किया जाएगा, जो निष्पादन समय और इनपुट-आउटपुट ट्रैकिंग के लिए मेट्रिक्स प्रदान करता है।

चरण 4: नामित एजेंट्स को ट्रैक करें

यदि आप नामित एजेंट्स का उपयोग कर रहे हैं, तो @track_agent डिकोरेटर का उपयोग करके सभी क्रियाओं और घटनाओं को विशिष्ट एजेंट्स से जोड़ें।

from agentops import track_agent

@track_agent(name=”math-agent”)

рдореИрдВ рдкрд┐рдЫрд▓реЗ рдкрд╛рдВрдЪ рд╡рд░реНрд╖реЛрдВ рд╕реЗ рдорд╢реАрди рд▓рд░реНрдирд┐рдВрдЧ рдФрд░ рдбреАрдк рд▓рд░реНрдирд┐рдВрдЧ рдХреА рдЖрдХрд░реНрд╖рдХ рджреБрдирд┐рдпрд╛ рдореЗрдВ рдЦреБрдж рдХреЛ рдбреВрдмрд╛ рд░рд╣рд╛ рд╣реВрдВред рдореЗрд░рд╛ рдЬреБрдиреВрди рдФрд░ рд╡рд┐рд╢реЗрд╖рдЬреНрдЮрддрд╛ рдиреЗ рдореБрдЭреЗ 50 рд╕реЗ рдЕрдзрд┐рдХ рд╡рд┐рд╡рд┐рдз рд╕реЙрдлреНрдЯрд╡реЗрдпрд░ рдЗрдВрдЬреАрдирд┐рдпрд░рд┐рдВрдЧ рдкрд░рд┐рдпреЛрдЬрдирд╛рдУрдВ рдореЗрдВ рдпреЛрдЧрджрд╛рди рджреЗрдиреЗ рдХреЗ рд▓рд┐рдП рдкреНрд░реЗрд░рд┐рдд рдХрд┐рдпрд╛ рд╣реИ, рдЬрд┐рд╕рдореЗрдВ рд╡рд┐рд╢реЗрд╖ рд░реВрдк рд╕реЗ рдПрдЖрдИ/рдПрдордПрд▓ рдкрд░ рдзреНрдпрд╛рди рдХреЗрдВрджреНрд░рд┐рдд рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИред рдореЗрд░реА рд▓рдЧрд╛рддрд╛рд░ рдЬрд┐рдЬреНрдЮрд╛рд╕рд╛ рдиреЗ рдореБрдЭреЗ рдкреНрд░рд╛рдХреГрддрд┐рдХ рднрд╛рд╖рд╛ рдкреНрд░рд╕рдВрд╕реНрдХрд░рдг рдХреА рдУрд░ рдЖрдХрд░реНрд╖рд┐рдд рдХрд┐рдпрд╛ рд╣реИ, рдЬреЛ рдПрдХ рдХреНрд╖реЗрддреНрд░ рд╣реИ рдЬрд┐рд╕реЗ рдореИрдВ рдЖрдЧреЗ рдЕрдиреНрд╡реЗрд╖рдг рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдЙрддреНрд╕реБрдХ рд╣реВрдВред