Tekoäly

Autonomiset agentit AgentOpsilla: Havainnoitavuus, jäljitettävyys ja muuta tekoälysovelluksellesi

Julkaistu

8 kuukautta sitten

Marraskuussa 20, 2024

Aayush Mittal

AgentOps: Havainnon ja jäljitettävyyden ottaminen käyttöön autonomisille agenteille

Autonomisten agenttien kasvu perustusmalleilla (FM:illä), kuten Large Language Models (LLM) -mallilla, on uudistanut tapaa, jolla ratkaisemme monimutkaisia, monivaiheisia ongelmia. Nämä agentit suorittavat tehtäviä, jotka vaihtelevat asiakastuesta ohjelmistosuunnitteluun, navigoivat monimutkaisissa työnkulkuissa, joissa yhdistyvät päättely, työkalujen käyttö ja muisti.

Kuitenkin näiden järjestelmien kyvykkyyden ja monimutkaisuuden kasvaessa havaittavuuden, luotettavuuden ja vaatimustenmukaisuuden haasteita ilmaantuu.

Tässä AgentOps tulee esiin; konsepti, joka on mallinnettu DevOpsin ja MLOpsin mukaan, mutta joka on räätälöity FM-pohjaisten agenttien elinkaaren hallintaan.

Saadakseni perustavanlaatuisen käsityksen AgentOpsista ja sen tärkeästä roolista FM-pohjaisten autonomisten agenttien havaittavuuden ja jäljitettävyyden mahdollistamisessa, olen saanut näkemyksiä viimeaikaisesta paperista. AgentOps-taksonomia, joka mahdollistaa säätiön mallipohjaisten agenttien havainnoinnin Liming Dong, Qinghua Lu ja Liming Zhu. Paperi tarjoaa kattavan tarkastelun AgentOpsiin ja korostaa sen tarvetta autonomisten agenttien elinkaaren hallinnassa – luomisesta ja toteutuksesta arviointiin ja seurantaan. Kirjoittajat luokittelevat jäljitettävissä olevat artefaktit, ehdottavat havainnointialustojen keskeisiä ominaisuuksia ja käsittelevät haasteita, kuten päätösten monimutkaisuutta ja säännösten noudattamista.

Vaikka A gentOps (työkalu) on saavuttanut merkittävän vetovoiman yhtenä johtavista työkaluista AI-agenttien (kuten autogeeni, crew ai), tämä artikkeli keskittyy laajempaan tekoälytoimintojen (Ops) käsitteeseen.

AgentOps (työkalu) tarjoaa kuitenkin kehittäjille käsityksen agenttien työnkuluista ominaisuuksilla, kuten istunnon toistolla, LLM-kustannusten seurannalla ja vaatimustenmukaisuuden valvonnalla. Yhtenä AI:n suosituimmista Ops-työkaluista käymme myöhemmin artikkelissa läpi sen toiminnot opetusohjelman avulla.

Mikä on AgentOps?

AgentOps viittaa päästä päähän prosesseihin, työkaluihin ja kehyksiin, joita tarvitaan FM-pohjaisten autonomisten agenttien suunnitteluun, käyttöönottoon, valvontaan ja optimointiin tuotannossa. Sen tavoitteet ovat:

Havaittavuus: Tarjoaa täyden näkyvyyden agentin toimeenpano- ja päätöksentekoprosesseihin.
jäljitettävyys: Yksityiskohtaisten artefaktien tallentaminen agentin elinkaaren ajalta virheenkorjausta, optimointia ja vaatimustenmukaisuutta varten.
Luotettavuus: Johdonmukaisten ja luotettavien tulosten varmistaminen seurannan ja vankan työnkulun avulla.

AgentOps ulottuu ytimenään perinteisiä MLOpseja pidemmälle korostamalla iteratiivisia, monivaiheisia työnkulkuja, työkalujen integrointia ja mukautuvaa muistia, samalla kun se ylläpitää tiukkaa seurantaa ja valvontaa.

AgentOpsin ratkaisemat keskeiset haasteet

1. Monimutkaisuus Agenttijärjestelmät

Autonomiset agentit käsittelevät tehtäviä laajassa toimintatilassa ja vaativat päätöksiä jokaisessa vaiheessa. Tämä monimutkaisuus vaatii kehittyneitä suunnittelu- ja seurantamekanismeja.

2. Havaittavuusvaatimukset

Suuret käyttötapaukset, kuten lääketieteellinen diagnoosi tai oikeudellinen analyysi, vaativat rakeista jäljitettävyyttä. EU:n tekoälylain kaltaisten määräysten noudattaminen korostaa entisestään vankkojen havainnointikehysten tarvetta.

3. Virheenkorjaus ja optimointi

Virheiden tunnistaminen monivaiheisissa työnkuluissa tai välitulosten arvioiminen on haastavaa ilman yksityiskohtaisia jälkiä agentin toimista.

4. Skaalautuvuus ja kustannusten hallinta

Tuotannon skaalausaineet edellyttävät mittareita, kuten viivettä, tunnuksen käyttöä ja käyttökustannuksia, jotta voidaan varmistaa tehokkuus laadusta tinkimättä.

AgentOps-alustojen ydinominaisuudet

1. Agentin luominen ja mukauttaminen

Kehittäjät voivat määrittää agentit käyttämällä komponenttirekisteriä:

roolit: Määrittele vastuualueet (esim. tutkija, suunnittelija).
Suojakaiteet: Aseta rajoituksia varmistaaksesi eettisen ja luotettavan toiminnan.
Työkalusarjat: Ota käyttöön integrointi sovellusliittymien, tietokantojen tai tietokaavioiden kanssa.

Agentit on suunniteltu toimimaan vuorovaikutuksessa tiettyjen tietojoukkojen, työkalujen ja kehotteiden kanssa säilyttäen samalla ennalta määritettyjen sääntöjen noudattamisen.

2. Havaittavuus ja jäljitys

AgentOps tallentaa yksityiskohtaiset suorituslokit:

Jäljet: Tallenna edustajan työnkulun jokainen vaihe LLM-kutsuista työkalujen käyttöön.
Kantavuus: Jaa jäljet rakeisiin vaiheisiin, kuten haku, upotus luominen tai työkalun kutsuminen.
Artefaktit: Seuraa välitulosteita, muistitiloja ja kehotemalleja virheenkorjauksen avuksi.

Havainnointityökalut, kuten Langfuse tai Arize, tarjoavat kojelaudat, jotka visualisoivat nämä jäljet ja auttavat tunnistamaan pullonkauloja tai virheitä.

3. Nopea hallinta

Nopealla suunnittelulla on tärkeä rooli agenttien käyttäytymisen muodostumisessa. Keskeisiä ominaisuuksia ovat:

Versiointi: Seuraa kehotteiden iteraatioita suorituskyvyn vertailua varten.
Injektion tunnistus: Tunnista haitallinen koodi tai syöttövirheet kehotteiden sisällä.
optimointi: Tekniikat, kuten Chain-of-thought (CoT) tai Tree-of-thought, parantavat päättelykykyä.

4. Palautteen integrointi

Ihmisten palaute on edelleen ratkaisevan tärkeää iteratiivisten parannusten kannalta:

Selkeä palaute: Käyttäjät arvioivat tuloksia tai kommentoivat niitä.
Implisiittinen palaute: Mittarit, kuten tehtävään käytetty aika tai napsautussuhteet, analysoidaan tehokkuuden mittaamiseksi.

Tämä palautesilmukka tarkentaa sekä agentin suorituskykyä että testaamiseen käytettyjä arvioinnin vertailuarvoja.

5. Arviointi ja testaus

AgentOps-alustat mahdollistavat tiukan testauksen:

vertailuarvot: Vertaa agenttien suorituskykyä alan standardeihin.
Vaiheittaiset arvioinnit: Arvioi työnkulkujen välivaiheet varmistaaksesi oikeellisuuden.
Liikeradan arviointi: Vahvista edustajan valitsema päätöksentekopolku.

6. Muistin ja tiedon integrointi

Agentit käyttävät lyhytaikaista muistia kontekstille (esim. keskusteluhistoria) ja pitkäaikaista muistia tallentaakseen oivalluksia menneistä tehtävistä. Tämä antaa agenteille mahdollisuuden mukautua dynaamisesti säilyttäen samalla johdonmukaisuuden ajan myötä.

7. Valvonta ja mittaukset

Kattavat seurantaradat:

Viive: Mittaa vasteajat optimointia varten.
Tokenin käyttö: Seuraa resurssien kulutusta kustannusten hallitsemiseksi.
Laatumittarit: Arvioi relevanssi, tarkkuus ja myrkyllisyys.

Nämä mittarit visualisoidaan eri ulottuvuuksien, kuten käyttäjäistuntojen, kehotteiden ja työnkulkujen välillä, mahdollistaen reaaliaikaiset toimet.

Jäljitettävien esineiden taksonomia

Paperi esittelee systemaattisen taksonomian artefakteista, jotka tukevat AgentOps-havaintoja:

Agentin luontiesineet: Metatiedot rooleista, tavoitteista ja rajoituksista.
Toteutusartefaktit: Työkalukutsujen, alitehtäväjonojen ja päättelyvaiheiden lokit.
Artefaktit: Vertailuarvot, palautesilmukat ja pisteytysmittarit.
Artefaktien jäljitys: Istuntotunnukset, jäljitystunnukset ja jaksot yksityiskohtaista seurantaa varten.

Tämä taksonomia varmistaa johdonmukaisuuden ja selkeyden agentin elinkaaren ajan, mikä tekee virheenkorjauksesta ja vaatimustenmukaisuudesta helpommin hallittavissa.

AgentOps (työkalu) Esittely

Tämä opastaa sinua määrittämään ja käyttämään AgentOpsia tekoälyagenttesi seuraamiseen ja optimointiin.

Vaihe 1: Asenna AgentOps SDK

Asenna AgentOps käyttämällä haluamaasi Python-paketinhallintaa:

pip install agentops

Vaihe 2: Alusta AgentOps

Tuo ensin AgentOps ja alusta se API-avaimellasi. Tallenna API-avain paikkaan .env tiedosto turvallisuuden vuoksi:

# Initialize AgentOps with API Key
import agentops
import os
from dotenv import load_dotenv

# Load environment variables
load_dotenv()
AGENTOPS_API_KEY = os.getenv("AGENTOPS_API_KEY")

# Initialize the AgentOps client
agentops.init(api_key=AGENTOPS_API_KEY, default_tags=["my-first-agent"])

Tämä vaihe määrittää havaittavuuden kaikille LLM-vuorovaikutuksille sovelluksessasi.

Vaihe 3: Tallenna toiminnot sisustajien kanssa

Voit instrumentoida tiettyjä toimintoja käyttämällä @record_action decorator, joka seuraa niiden parametreja, suoritusaikaa ja tulosta. Tässä on esimerkki:

from agentops import record_action

@record_action("custom-action-tracker")
def is_prime(number):
    """Check if a number is prime."""
    if number < 2:
        return False
    for i in range(2, int(number**0.5) + 1):
        if number % i == 0:
            return False
    return True

Toiminto kirjataan nyt AgentOps-hallintapaneeliin, ja se tarjoaa mittareita suoritusajan ja syötteiden ja tulosten seurannasta.

Vaihe 4: Seuraa nimettyjä agentteja

Jos käytät nimettyjä agentteja, käytä @track_agent sisustaja sitoa kaikki toiminnot ja tapahtumat tiettyihin agentteihin.

from agentops import track_agent

@track_agent(name="math-agent")
class MathAgent:
    def __init__(self, name):
        self.name = name

    def factorial(self, n):
        """Calculate factorial recursively."""
        return 1 if n == 0 else n * self.factorial(n - 1)

Kaikki tämän agentin toiminnot tai LLM-kutsut on nyt liitetty tähän "math-agent" tunnisteita.

Vaihe 5: Multi-Agent-tuki

Useita agentteja käyttävissä järjestelmissä voit seurata tapahtumia eri agenttien välillä parantaaksesi havaittavuutta. Tässä on esimerkki:

@track_agent(name="qa-agent")
class QAAgent:
    def generate_response(self, prompt):
        return f"Responding to: {prompt}"

@track_agent(name="developer-agent")
class DeveloperAgent:
    def generate_code(self, task_description):
        return f"# Code to perform: {task_description}"

qa_agent = QAAgent()
developer_agent = DeveloperAgent()

response = qa_agent.generate_response("Explain observability in AI.")
code = developer_agent.generate_code("calculate Fibonacci sequence")

Jokainen puhelu näkyy AgentOps-hallintapaneelissa vastaavan edustajan jäljityksen alla.

Vaihe 6: Lopeta istunto

Jos haluat ilmoittaa istunnon päättymisestä, käytä end_session menetelmä. Lisää valinnaisesti istunnon tila (Success or Fail) ja syy.

# End of session
agentops.end_session(state="Success", reason="Completed workflow")

Tämä varmistaa, että kaikki tiedot kirjataan lokiin ja ovat käytettävissä AgentOps-hallintapaneelissa.

Vaihe 7: Visualisoi AgentOps Dashboardissa

Vierailla AgentOps Dashboard tutkia:

Istunnon toistot: Vaiheittaiset toteutusjäljet.
Analytics: LLM-kustannukset, tunnuksen käyttö ja viivemittarit.
Virheiden tunnistus: Tunnista ja korjaa viat tai rekursiiviset silmukat.

Parannettu esimerkki: Rekursiivinen ajattelun havaitseminen

AgentOps tukee myös rekursiivisten silmukoiden havaitsemista agentin työnkuluissa. Laajennetaan edellistä esimerkkiä rekursiivisella tunnistuksella:

@track_agent(name="recursive-agent")
class RecursiveAgent:
    def solve(self, task, depth=0, max_depth=5):
        """Simulates recursive task solving with depth control."""
        if depth >= max_depth:
            return f"Max recursion depth reached for task: {task}"
        return self.solve(task, depth + 1)

recursive_agent = RecursiveAgent()
output = recursive_agent.solve("Optimize database queries")
print(output)

AgentOps kirjaa rekursion osana istuntoa, mikä auttaa sinua tunnistamaan äärettömät silmukat tai liiallisen syvyyden.

Yhteenveto

Autonomiset tekoälyagentit, jotka toimivat perustusmalleilla, kuten LLM:illä, ovat määrittäneet uudelleen tavan, jolla lähestymme monimutkaisia, monivaiheisia ongelmia eri toimialoilla. Niiden hienostuneisuus tuo kuitenkin ainutlaatuisia haasteita havaittavuuden, jäljitettävyyden ja luotettavuuden suhteen. Tässä AgentOps toimii välttämättömänä kehyksenä, joka tarjoaa kehittäjille työkalut tekoälyagenttien valvontaan, optimointiin ja vaatimustenmukaisuuden varmistamiseen koko niiden elinkaaren ajan.

Liittyvät aiheet:AgentOps AI AGENTIT autonomiset agentit matemaattinen agentti havaittavuus Rekursiivisen ajattelun tekoäly AgentOpsin taksonomia jäljitettävyys

Seuraavaksi

Microsoftin Drasi: Uusi lähestymistapa nopeiden tietomuutosten seurantaan

Älä missaa

Itsestään kehittyvä tekoäly: olemmeko astumassa itseään rakentavan tekoälyn aikakauteen?