Мониторинг — это сбор и анализ метрик состояния системы (CPU, RAM, сеть, диски, ошибки, задержки) для выявления проблем в реальном времени или ретроспективно.
Трассировка (распределенная трассировка) — это запись и визуализация пути запроса (транзакции) через различные сервисы и компоненты распределенной системы, позволяющая понять, как запрос обрабатывается на каждом этапе, где возникают задержки и ошибки.
| Признак | Мониторинг | Трассировка |
|---|---|---|
| Цель | Оценить общее состояние системы/сервиса | Понять путь конкретного запроса/транзакции |
| Данные | Агрегированные метрики (счетчики, средние, процентили) | Данные о каждом сегменте запроса (спаны) |
| Применение | Выявление общих проблем, трендов | Отладка конкретных проблем, оптимизация потока |
| Примеры | Prometheus, Zabbix, Grafana | Jaeger, Zipkin, OpenTelemetry |
Трассировка часто дополняет мониторинг, предоставляя детализацию для метрик, указывающих на проблемы. Например, метрика высокой задержки (мониторинг) может быть исследована с помощью трассировки, чтобы понять, какой именно сервис или компонент вызвал эту задержку.