Inteligencia Artificial
Agentes autónomos con AgentOps: observabilidad, trazabilidad y más para su aplicación de IA

El crecimiento de los agentes autónomos mediante modelos básicos (FM), como los modelos de lenguaje grande (LLM), ha reformado la forma en que resolvemos problemas complejos de varios pasos. Estos agentes realizan tareas que van desde la atención al cliente hasta la ingeniería de software, y navegan por flujos de trabajo complejos que combinan razonamiento, uso de herramientas y memoria.
Sin embargo, a medida que estos sistemas crecen en capacidad y complejidad, surgen desafíos en materia de observabilidad, confiabilidad y cumplimiento.
Aquí es donde entra en juego AgentOps, un concepto inspirado en DevOps y MLOps, pero diseñado para gestionar el ciclo de vida de los agentes basados en FM.
¿Qué es AgentOps?
AgentOps se refiere a los procesos, herramientas y marcos de trabajo de extremo a extremo necesarios para diseñar, implementar, monitorear y optimizar agentes autónomos basados en FM en producción. Sus objetivos son:
- Observabilidad: Proporcionar visibilidad completa de los procesos de ejecución y toma de decisiones del agente.
- Trazabilidad: Captura de artefactos detallados a lo largo del ciclo de vida del agente para depuración, optimización y cumplimiento.
- Fiabilidad: Garantizar resultados consistentes y confiables mediante monitoreo y flujos de trabajo sólidos.
En esencia, AgentOps se extiende más allá de los MLOps tradicionales al enfatizar flujos de trabajo iterativos de múltiples pasos, integración de herramientas y memoria adaptativa, todo mientras mantiene un seguimiento y monitoreo rigurosos.
Principales desafíos que aborda AgentOps
1. Complejidad de Sistemas de agentes
Los agentes autónomos procesan tareas en un vasto espacio de acción, lo que exige tomar decisiones en cada paso. Esta complejidad exige sofisticados mecanismos de planificación y seguimiento.
2. Requisitos de observabilidad
Los casos de uso de alto riesgo, como el diagnóstico médico o el análisis legal, exigen una trazabilidad granular. El cumplimiento de regulaciones como la Ley de Inteligencia Artificial de la UE subraya aún más la necesidad de contar con marcos de observabilidad sólidos.
3. Depuración y optimización
Identificar errores en flujos de trabajo de varios pasos o evaluar resultados intermedios es un desafío si no se cuenta con rastros detallados de las acciones del agente.
4. Escalabilidad y gestión de costos
Los agentes de escalamiento para producción requieren monitorear métricas como latencia, uso de tokens y costos operativos para garantizar la eficiencia sin comprometer la calidad.
Características principales de las plataformas AgentOps
1. Creación y personalización de agentes
Los desarrolladores pueden configurar agentes utilizando un registro de componentes:
- Roles: Definir responsabilidades (por ejemplo, investigador, planificador).
- Barandillas: Establecer restricciones para garantizar un comportamiento ético y confiable.
- Juegos de herramientas: Habilite la integración con API, bases de datos o gráficos de conocimiento.
Los agentes están diseñados para interactuar con conjuntos de datos, herramientas y avisos específicos, manteniendo al mismo tiempo el cumplimiento de reglas predefinidas.
2. Observabilidad y rastreo
AgentOps captura registros de ejecución detallados:
- Rastros: Registre cada paso del flujo de trabajo del agente, desde las llamadas LLM hasta el uso de herramientas.
- Se extiende: Divida los rastros en pasos granulares, como recuperación, generación de incrustaciones o invocación de herramientas.
- Artefactos: Realice un seguimiento de las salidas intermedias, los estados de la memoria y las plantillas de indicaciones para facilitar la depuración.
Las herramientas de observación como Langfuse o Arize proporcionan paneles que visualizan estos rastros, lo que ayuda a identificar cuellos de botella o errores.
3. Gestión rápida
La ingeniería rápida desempeña un papel importante en la formación del comportamiento del agente. Las características clave incluyen:
- Versionado: Realice un seguimiento de las iteraciones de las indicaciones para comparar el rendimiento.
- Detección de inyección: Identifique códigos maliciosos o errores de entrada dentro de las indicaciones.
- Mejoramiento: Técnicas como la cadena de pensamiento (CoT) o el árbol de pensamiento mejoran las capacidades de razonamiento.
4. Integración de retroalimentación
La retroalimentación humana sigue siendo crucial para las mejoras iterativas:
- Comentarios explícitos: Los usuarios califican los resultados o proporcionan comentarios.
- Retroalimentación implícita: Se analizan métricas como el tiempo dedicado a la tarea o las tasas de clics para medir la eficacia.
Este ciclo de retroalimentación refina tanto el desempeño del agente como los puntos de referencia de evaluación utilizados para las pruebas.
5. Evaluación y prueba
Las plataformas AgentOps facilitan pruebas rigurosas en:
- Puntos de referencia: Compare el rendimiento del agente con los estándares de la industria.
- Evaluaciones paso a paso: Evaluar los pasos intermedios en los flujos de trabajo para garantizar su corrección.
- Evaluación de trayectoria: Validar la ruta de toma de decisiones tomada por el agente.
6. Integración de la memoria y el conocimiento
Los agentes utilizan la memoria a corto plazo para el contexto (por ejemplo, el historial de conversaciones) y la memoria a largo plazo para almacenar información de tareas anteriores. Esto les permite adaptarse de forma dinámica y mantener la coherencia a lo largo del tiempo.
7. Monitoreo y Métricas
Seguimiento exhaustivo de las rutas:
- Estado latente: Medir los tiempos de respuesta para la optimización.
- Uso de tokens: Monitorizar el consumo de recursos para controlar costes.
- Métricas de calidad: Evaluar relevancia, precisión y toxicidad.
Estas métricas se visualizan en dimensiones como sesiones de usuario, indicaciones y flujos de trabajo, lo que permite realizar intervenciones en tiempo real.
La taxonomía de los artefactos rastreables
El artículo presenta una taxonomía sistemática de artefactos que sustentan la observabilidad de AgentOps:
- Artefactos de creación de agentes: Metadatos sobre roles, objetivos y restricciones.
- Artefactos de ejecución: Registros de llamadas a herramientas, colas de subtareas y pasos de razonamiento.
- Artefactos de evaluación: Puntos de referencia, bucles de retroalimentación y métricas de puntuación.
- Rastreo de artefactos: ID de sesión, ID de seguimiento y lapsos para monitoreo granular.
Esta taxonomía garantiza la coherencia y la claridad durante todo el ciclo de vida del agente, lo que hace que la depuración y el cumplimiento sean más manejables.
Agente de operaciones (herramienta) Tutorial
Esto lo guiará a través de la configuración y el uso de AgentOps para monitorear y optimizar sus agentes de IA.
Paso 1: Instalar el SDK de AgentOps
Instale AgentOps utilizando su administrador de paquetes Python preferido:
pip install agentops
Paso 2: Inicializar AgentOps
Primero, importe AgentOps e inicialícelo usando su clave API. Almacene la clave API en un .env archivo de seguridad:
# Initialize AgentOps with API Key
import agentops
import os
from dotenv import load_dotenv
# Load environment variables
load_dotenv()
AGENTOPS_API_KEY = os.getenv("AGENTOPS_API_KEY")
# Initialize the AgentOps client
agentops.init(api_key=AGENTOPS_API_KEY, default_tags=["my-first-agent"])
Este paso configura la observabilidad de todas las interacciones LLM en su aplicación.
Paso 3: Registrar acciones con decoradores
Puede instrumentar funciones específicas utilizando el @record_action Decorador, que rastrea sus parámetros, tiempo de ejecución y salida. Aquí hay un ejemplo:
from agentops import record_action
@record_action("custom-action-tracker")
def is_prime(number):
"""Check if a number is prime."""
if number < 2:
return False
for i in range(2, int(number**0.5) + 1):
if number % i == 0:
return False
return True
La función ahora se registrará en el panel de AgentOps, proporcionando métricas para el tiempo de ejecución y el seguimiento de entrada y salida.
Paso 4: Seguimiento de agentes designados
Si está utilizando agentes con nombre, utilice el @track_agent decorador para vincular todas las acciones y eventos a agentes específicos.
from agentops import track_agent
@track_agent(name="math-agent")
class MathAgent:
def __init__(self, name):
self.name = name
def factorial(self, n):
"""Calculate factorial recursively."""
return 1 if n == 0 else n * self.factorial(n - 1)
Cualquier acción o llamada LLM dentro de este agente ahora está asociada con el "math-agent" </head>.
Paso 5: Compatibilidad con múltiples agentes
En sistemas que utilizan varios agentes, se puede rastrear eventos entre ellos para una mejor observabilidad. A continuación, un ejemplo:
@track_agent(name="qa-agent")
class QAAgent:
def generate_response(self, prompt):
return f"Responding to: {prompt}"
@track_agent(name="developer-agent")
class DeveloperAgent:
def generate_code(self, task_description):
return f"# Code to perform: {task_description}"
qa_agent = QAAgent()
developer_agent = DeveloperAgent()
response = qa_agent.generate_response("Explain observability in AI.")
code = developer_agent.generate_code("calculate Fibonacci sequence")
Cada llamada aparecerá en el panel de AgentOps bajo el seguimiento de su respectivo agente.
Paso 6: Finalizar la sesión
Para señalar el final de una sesión, utilice el end_session método. Opcionalmente, incluya el estado de la sesión (Success or Fail) y una razón.
# End of session agentops.end_session(state="Success", reason="Completed workflow")
Esto garantiza que todos los datos se registren y sean accesibles en el panel de AgentOps.
Paso 7: Visualizar en el panel de AgentOps
Visita el sitio web del Panel de control de AgentOps para explorar:
- Repeticiones de sesiones: Rastros de ejecución paso a paso.
- Analítica: Costo de LLM, uso de token y métricas de latencia.
- Detección de errores: Identificar y depurar fallos o bucles recursivos.
Ejemplo mejorado: detección recursiva de pensamientos
AgentOps también permite detectar bucles recursivos en los flujos de trabajo de los agentes. Ampliemos el ejemplo anterior con la detección recursiva:












