Искусственный интеллект

Автономные агенты с AgentOps: наблюдаемость, отслеживаемость и больше для вашего приложения ИИ

Published November 20, 2024

Updated April 27, 2026

Aayush Mittal Mittal

AgentOps: Enabling Observability and Traceability for Autonomous Agents

Рост автономных агентов на основе фундаментальных моделей (ФМ) таких, как большие языковые модели (БЯМ), изменил способ решения сложных, многоступенчатых задач. Эти агенты выполняют задачи, начиная от поддержки клиентов и заканчивая разработкой программного обеспечения, ориентируясь в сложных рабочих процессах, которые сочетают рассуждения, использование инструментов и память.

Однако по мере роста возможностей и сложности этих систем возникают проблемы с наблюдаемостью, надежностью и соблюдением требований.

Именно здесь на сцену выходит AgentOps – концепция, созданная по образцу DevOps и MLOps, но адаптированная для управления жизненным циклом агентов на основе ФМ.

Чтобы предоставить основное понимание AgentOps и его критической роли в обеспечении наблюдаемости и отслеживаемости для автономных агентов на основе ФМ, я черпал идеи из недавней статьи Таксономия AgentOps для обеспечения наблюдаемости агентов на основе фундаментальных моделей Лиминга Дона, Цинхуа Лу и Лиминга Чжу. В статье представлена всесторонняя экспертиза AgentOps, подчеркивающая его необходимость в управлении жизненным циклом автономных агентов – от создания и выполнения до оценки и мониторинга. Авторы категоризируют отслеживаемые артефакты, предлагают ключевые функции для платформ наблюдаемости и решают проблемы, такие как сложность принятия решений и соблюдение нормативных требований.

Хотя AgentOps (инструмент) получил значительное внимание как один из ведущих инструментов для мониторинга, отладки и оптимизации ИИ-агентов (например, autogen, crew ai), эта статья фокусируется на более широкой концепции операций ИИ (Ops).

Тем не менее, AgentOps (инструмент) предлагает разработчикам информацию об рабочих процессах агентов с функциями, такими как повторное воспроизведение сеансов, отслеживание затрат на БЯМ и мониторинг соблюдения требований. Как один из самых популярных инструментов Ops в ИИ, позже в статье мы пройдем через его функциональность с помощью учебника.

Что такое AgentOps?

AgentOps относится к процессам, инструментам и фреймворкам от начала до конца, необходимым для проектирования, развертывания, мониторинга и оптимизации автономных агентов на основе ФМ в производстве. Его цели:

Наблюдаемость: Предоставление полной видимости процесса выполнения и принятия решений агентом.
Отслеживаемость: Захват подробных артефактов на протяжении всего жизненного цикла агента для отладки, оптимизации и соблюдения требований.
Надежность: Обеспечение последовательных и достоверных выходных данных посредством мониторинга и прочных рабочих процессов.

В своей основе AgentOps выходит за рамки традиционного MLOps, подчеркивая итеративные, многоступенчатые рабочие процессы, интеграцию инструментов и адаптивную память, все при сохранении строгого отслеживания и мониторинга.

Ключевые проблемы, решаемые AgentOps

1. Сложность агентных систем

Автономные агенты обрабатывают задачи в огромном пространстве действий, требуя принятия решений на каждом шаге. Эта сложность требует сложных механизмов планирования и мониторинга.

2. Требования к наблюдаемости

Высокие ставки в случаях использования – такие, как медицинская диагностика или юридический анализ – требуют детальной отслеживаемости. Соблюдение нормативных требований, таких как закон ЕС об ИИ, еще больше подчеркивает необходимость прочных фреймворков наблюдаемости.

3. Отладка и оптимизация

Определение ошибок в многоступенчатых рабочих процессах или оценка промежуточных выходных данных без подробных следов действий агента является сложной задачей.

4. Масштабируемость и управление затратами

Масштабирование агентов для производства требует отслеживания метрик, таких как задержка, использование токенов и операционные затраты, для обеспечения эффективности без компрометации качества.

Основные функции платформ AgentOps

1. Создание и настройка агентов

Разработчики могут настроить агентов, используя реестр компонентов:

Роли: Определите обязанности (например, исследователь, планировщик).
Ограничители: Установите ограничения для обеспечения этичного и надежного поведения.
Наборы инструментов: Включите интеграцию с API, базами данных или графами знаний.

Агенты создаются для взаимодействия с конкретными наборами данных, инструментами и подсказками, сохраняя при этом соблюдение предварительно определенных правил.

2. Наблюдаемость и отслеживание

AgentOps захватывает подробные журналы выполнения:

Следы: Записывайте каждый шаг в рабочем процессе агента, от вызовов БЯМ до использования инструментов.
Диапазоны: Разбейте следы на гранулярные шаги, такие как извлечение, генерация вложений или вызов инструментов.
Артефакты: Отслеживайте промежуточные выходные данные, состояния памяти и шаблоны подсказок для помощи в отладке.

Инструменты наблюдаемости, такие как Langfuse или Arize, предоставляют панели, которые визуализируют эти следы, помогая выявить узкие места или ошибки.

3. Управление подсказками

Инженерия подсказок играет важную роль в формировании поведения агента. Ключевые функции включают:

Версионирование: Отслеживайте итерации подсказок для сравнения производительности.
Обнаружение инъекций: Выявляйте вредоносный код или ошибки ввода внутри подсказок.
Оптимизация: Техники, такие как цепочка мыслей (CoT) или дерево мыслей, улучшают возможности рассуждения.

4. Интеграция обратной связи

Обратная связь человека остается важной для итеративных улучшений:

Явная обратная связь: Пользователи оценивают выходные данные или предоставляют комментарии.
Неявная обратная связь: Метрики, такие как время, затраченное на задачу, или показатели кликов, анализируются для оценки эффективности.

Этот цикл обратной связи совершенствует как производительность агента, так и используемые для тестирования оценочные эталоны.

5. Оценка и тестирование

Платформы AgentOps облегчают тщательное тестирование на:

Эталоны: Сравните производительность агента с отраслевыми стандартами.
Оценка шаг за шагом: Оцените промежуточные шаги в рабочих процессах, чтобы обеспечить правильность.
Оценка траектории: Подтвердите путь принятия решений, пройденный агентом.

6. Интеграция памяти и знаний

Агенты используют краткосрочную память для контекста (например, истории разговора) и долгосрочную память для хранения выводов из прошлых задач. Это позволяет агентам адаптироваться динамически, сохраняя при этом последовательность во времени.

7. Мониторинг и метрики

Комплексный мониторинг отслеживает:

Задержка: Измерьте время ответа для оптимизации.
Использование токенов: Мониторьте потребление ресурсов для контроля затрат.
Метрики качества: Оцените актуальность, точность и токсичность.

Эти метрики визуализируются по различным измерениям, таким как сеансы пользователей, подсказки и рабочие процессы, позволяя вносить реальные коррективы.

Таксономия отслеживаемых артефактов

Статья представляет систематическую таксономию артефактов, которые лежат в основе наблюдаемости AgentOps:

Артефакты создания агентов: Метаданные о ролях, целях и ограничениях.
Артефакты выполнения: Журналы вызовов инструментов, очередей подзадач и шагов рассуждения.
Артефакты оценки: Эталоны, циклы обратной связи и метрики оценки.
Артефакты отслеживания: Идентификаторы сеансов, идентификаторы следов и диапазоны для гранулярного мониторинга.

Эта таксономия обеспечивает последовательность и ясность на протяжении всего жизненного цикла агента, что делает отладку и соблюдение требований более управляемыми.

AgentOps (инструмент) Обзор

Это проведет вас через настройку и использование AgentOps для мониторинга и оптимизации ваших ИИ-агентов.

Шаг 1: Установите SDK AgentOps

Установите AgentOps, используя ваш предпочитаемый менеджер пакетов Python:

pip install agentops

Шаг 2: Инициализируйте AgentOps

Сначала импортируйте AgentOps и инициализируйте его, используя ваш ключ API. Храните ключ API в файле .env для безопасности:

# Инициализируйте AgentOps с помощью ключа API
import agentops
import os
from dotenv import load_dotenv

# Загрузите переменные окружения
load_dotenv()
AGENTOPS_API_KEY = os.getenv("AGENTOPS_API_KEY")

# Инициализируйте клиент AgentOps
agentops.init(api_key=AGENTOPS_API_KEY, default_tags=["my-first-agent"])

Этот шаг настраивает наблюдаемость для всех взаимодействий БЯМ в вашем приложении.

Шаг 3: Запишите действия с помощью декораторов

Вы можете инструментировать конкретные функции, используя декоратор @record_action, который отслеживает их параметры, время выполнения и выходные данные. Вот пример:

from agentops import record_action

@record_action("custom-action-tracker")
def is_prime(number):
"""Проверьте, является ли число простым."""
if number &lt; 2:
return False
for i in range(2, int(number**0.5) + 1):
if number % i == 0:
return False
return True

Функция теперь будет записана в панели управления AgentOps, предоставляя метрики для времени выполнения и отслеживания входных и выходных данных.

Шаг 4: Отслеживайте именованные агенты

Если вы используете именованные агенты, используйте декоратор @track_agent, чтобы привязать все действия и события к конкретным агентам.

from agentops import track_agent

@track_agent(name="math-agent")
class MathAgent:
def __init__(self, name):
self.name = name

def factorial(self, n):
"""Рассчитайте факториал рекурсивно."""
return 1 if n == 0 else n * self.factorial(n - 1)

Любые действия или вызовы БЯМ внутри этого агента теперь связаны с тегом "math-agent".

Шаг 5: Поддержка нескольких агентов

Для систем, использующих несколько агентов, вы можете отслеживать события между агентами для лучшей наблюдаемости. Вот пример:

@track_agent(name="qa-agent")
class QAAgent:
def generate_response(self, prompt):
return f"Отвечаю на: {prompt}";

@track_agent(name="developer-agent")
class DeveloperAgent:
def generate_code(self, task_description):
return f"# Код для выполнения: {task_description}";

qa_agent = QAAgent()
developer_agent = DeveloperAgent()

response = qa_agent.generate_response("Объясните наблюдаемость в ИИ.")
code = developer_agent.generate_code("Рассчитайте последовательность Фибоначчи")

Каждый вызов будет отображаться в панели управления AgentOps под соответствующим идентификатором агента.

Шаг 6: Завершите сеанс

Чтобы сигнализировать об окончании сеанса, используйте метод end_session. Необязательно, включите состояние сеанса (Success или Fail) и причину.

# Окончание сеанса
agentops.end_session(state="Success", reason="Завершен рабочий процесс")

Это обеспечивает запись всех данных и доступ к ним в панели управления AgentOps.

Шаг 7: Визуализируйте в панели управления AgentOps

Посетите Панель управления AgentOps, чтобы изучить:

Повторное воспроизведение сеансов: Шаг за шагом следы выполнения.
Аналитика: Метрики затрат на БЯМ, использования токенов и задержки.
Обнаружение ошибок: Выявляйте и отлаживайте неудачи или рекурсивные циклы.

Улучшенный пример: Обнаружение рекурсивной мысли

AgentOps также поддерживает обнаружение рекурсивных циклов в рабочих процессах агентов. Давайте расширим предыдущий пример с обнаружением рекурсии:

@track_agent(name="recursive-agent")
class RecursiveAgent:
def solve(self, task, depth=0, max_depth=5):
"""Имитация рекурсивного решения задач с контролем глубины."""
if depth &gt;= max_depth:
return f"Максимальная глубина рекурсии достигнута для задачи: {task}"
return self.solve(task, depth + 1)

recursive_agent = RecursiveAgent()
output = recursive_agent.solve("Оптимизируйте запросы базы данных")
print(output)

AgentOps запишет рекурсию как часть сеанса, помогая выявить бесконечные циклы или чрезмерную глубину.

Заключение

Автономные ИИ-агенты, работающие на основе фундаментальных моделей, таких как БЯМ, переопределили подход к сложным, многоступенчатым задачам в различных отраслях. Однако их сложность представляет уникальные проблемы в наблюдаемости, отслеживаемости и надежности. Именно здесь AgentOps выступает в качестве незаменимого фреймворка, предлагая разработчикам инструменты для мониторинга, оптимизации и обеспечения соблюдения требований для ИИ-агентов на протяжении всего их жизненного цикла.

Aayush Mittal

Я провел последние пять лет, погружаясь в увлекательный мир Machine Learning и Deep Learning. Моя страсть и экспертиза привели меня к участию в более чем 50 различных проектах по разработке программного обеспечения, с особым акцентом на AI/ML. Мое непрекращающееся любопытство также привело меня к Natural Language Processing, области, которую я с нетерпением жду возможности изучить более подробно.