Мониторинг

Руководство по мониторингу системы OneAPA.

Точки мониторинга

Компонент
Что мониторить

Proxy-сервер

Доступность, время ответа

LLM провайдеры

Ошибки, лимиты

1С сервер

Производительность

Агенты

Использование, ошибки

Мониторинг Proxy

Health Check

# Проверка доступности
curl http://proxy:9000/health

# Ожидаемый ответ
{
  "message": "OK",
  "version": "1.0.1"
}

Автоматическая проверка

Docker мониторинг

Метрики

Основные метрики

Метрика
Описание
Порог

Время ответа

Среднее время ответа агента

< 30 сек

Ошибки LLM

Количество ошибок в час

< 10

Вызовы инструментов

Количество вызовов

-

Активные сессии

Параллельные диалоги

Зависит от ресурсов

Prometheus

Мониторинг LLM

OpenAI

  • Проверяйте баланс

  • Следите за rate limits

  • Мониторьте ошибки 429

Yandex GPT

  • Проверяйте IAM токен (истекает через 12ч)

  • Следите за квотами

Ollama

  • Мониторьте использование GPU

  • Проверяйте загрузку RAM

Алерты

Критические

  • Proxy недоступен

  • 100% ошибок LLM

  • Нет места на диске

Предупреждения

  • Время ответа > 60 сек

  • Ошибки > 10% запросов

  • Низкий баланс LLM провайдера

Dashboard

Grafana пример

Last updated