Методология расследования production-инцидентов с использованием observability стека
«Методология важнее инструментов»
# Логи за период инцидента
{service="payment"} |= "ERROR"# Метрики за тот же период
sum(rate(payment_errors_total[5m]))После resolved:
Вопросы ещё не добавлены
Вопросы для этой подтемы ещё не добавлены.