Развёрнутый курс по выявлению, измерению и устранению причин длинного хвоста задержек в распределённых системах. Охватывает метрики, паттерны отказоустойчивости, кэширование, асинхронность, балансировку нагрузки, оптимизацию БД, очереди и адаптивные системы.
Percentiles, histograms, tail at scale, правильные инструменты измерения
Настройка таймаутов, exponential backoff, jitter, retry budgets
Паттерн автоматического отключения неисправных сервисов
Изоляция пулов ресурсов для предотвращения каскадных сбоев
Multi-level caching, cache invalidation, warming, stale-while-revalidate
asyncio, speculative execution, hedged requests, parallel execution
Latency-aware routing, consistent hashing, load balancing algorithms
Connection pooling, query optimization, read replicas, partitioning
Flow control, bounded queues, reactive streams, Kafka patterns
Rate limiting, load shedding, adaptive concurrency control