Экспертный курс по проектированию и поддержке observability-платформ для high-load и распределённых систем. Глубокое погружение в архитектуру Thanos и Cortex, шардирование Prometheus, глобальные запросы, мульти-тенантность, capacity planning, disaster recovery. Продвинутые паттерны алертинга для микросервисов, security hardening, compliance. Реальные кейсы масштабирования от ведущих технологических компаний.
Часть уроков закрыта. Разблокируйте курс за 1 500 кредитов, чтобы открыть все материалы.
Детальный разбор компонентов Thanos: Sidecar, Store Gateway, Query, Compactor, Ruler, Receiver
Архитектура Cortex/Mimir, отличие от Thanos, шардирование, мульти-тенантность
Построение иерархии Prometheus через federation, cross-service Prometheus
Горизонтальное разделение Prometheus по job, tenant, hash шarding
Единый PromQL endpoint для множества кластеров Prometheus/Thanos
Настройка bucket storage, оптимизация costs, lifecycle policies
Формулы для расчёта CPU, RAM, disk, network для Prometheus кластеров
Стратегии бэкапа TSDB, snapshot, replication, failover сценарии
Разделение данных по tenant, RBAC, quota, billing
Loki в режиме microservices, scalable write path, read path optimization
Grafana Enterprise, HA deployment, database backend, caching
TLS, authentication, authorization, audit logging, security alerting
Мониторинг для compliance требований, audit trails, retention policies
Снижение затрат на хранение, вычисления, трафик в cloud environments
Разбор архитектур мониторинга от Uber, Shopify, DigitalOcean, Red Hat