Подходит ли платформа для начинающих без опыта работы?

Да, курсы разбиты по уровням: Junior, Middle, Senior. Начинающие могут стартовать с базовых тем Python, Docker и алгоритмов и постепенно двигаться к более сложным темам.

Как быстро можно подготовиться к собеседованию на позицию Junior разработчика?

При занятиях 1–2 часа в день — от 2 до 4 недель на основные темы. Платформа анализирует слабые места по результатам квизов и строит персональный план подготовки.

Какие технологии охватывает платформа?

Python, FastAPI, Django, Docker, алгоритмы и структуры данных, Agile/Scrum, SQL, CI/CD, системный дизайн, код-ревью и более 50 других тем для разработчиков.

Платформа бесплатная?

Большинство учебных материалов и квизов доступны бесплатно после регистрации. Регистрация занимает менее минуты.

Как платформа помогает найти работу программистом?

Платформа даёт фундаментальные знания, которые проверяют на технических собеседованиях: алгоритмы, архитектура, фреймворки. Мок-интервью имитирует реальное собеседование. Система прогресса показывает, какие темы нужно подтянуть перед собеседованием.

node_exporter

Node Exporter: мониторинг сервера

Сбор метрик инфраструктуры: CPU, память, диск, сеть

Node Exporter: мониторинг сервера

«Инфраструктура — это фундамент. Если фундамент кривой, приложение не устоит»

Что такое Node Exporter

Node Exporter — официальный экспортёр Prometheus для сбора метрик Linux/Unix серверов.

Собирает:

CPU (загрузка по ядрам и режимам)
Память (использование, swap, кэш)
Диск (место, I/O, операции)
Сеть (трафик, ошибки, пакеты)
Системная информация (uptime, загрузки, процессы)

Не собирает:

Метрики приложений (для этого инструментирйте приложение)
Логи (для этого используйте Loki или ELK)

Установка Node Exporter

Вариант 1: Docker Compose (рекомендуется для курса)

Добавьте в docker-compose.yml:

services:
  node_exporter:
    image: prom/node-exporter:v1.7.0
    container_name: node_exporter
    ports:
      - "9100:9100"
    volumes:
      - /proc:/host/proc:ro
      - /sys:/host/sys:ro
      - /:/rootfs:ro
    command:
      - '--path.procfs=/host/proc'
      - '--path.sysfs=/host/sys'
      - '--path.rootfs=/rootfs'
      - '--collector.filesystem.mount-points-exclude=^/(sys|proc|dev|host|etc)($$|/)'
    restart: unless-stopped

Важно: volumes дают доступ к системной информации хоста из контейнера.

Вариант 2: Установка на сервер

# Скачать
wget https://github.com/prometheus/node_exporter/releases/download/v1.7.0/node_exporter-1.7.0.linux-amd64.tar.gz

# Распаковать
tar xvfz node_exporter-1.7.0.linux-amd64.tar.gz
cd node_exporter-1.7.0.linux-amd64

# Запустить
./node_exporter &

# Или как systemd сервис
sudo systemctl enable node_exporter
sudo systemctl start node_exporter

Настройка Prometheus

Добавьте job в prometheus.yml:

scrape_configs:
  - job_name: 'node'
    static_configs:
      - targets: ['localhost:9100']
    # Для нескольких серверов:
    # - targets:
    #     - 'server1:9100'
    #     - 'server2:9100'
    #   labels:
    #     env: 'production'
    #     datacenter: 'us-east'

Перезапустите Prometheus и проверьте в UI:

Status → Targets
Должен увидеть node exporter со статусом UP

Ключевые метрики Node Exporter

Node Exporter экспортирует сотни метрик. Вот основные.

CPU

# Загрузка CPU по ядрам (процент)
100 - (avg by (instance, cpu) (rate(node_cpu_seconds_total{mode="idle"}[5m])) * 100)

# Загрузка по режимам (user, system, iowait, irq)
sum by (mode) (rate(node_cpu_seconds_total{mode=~"user|system|iowait|irq"}[5m]))

# Средняя загрузка по всем ядрам
100 - (avg(rate(node_cpu_seconds_total{mode="idle"}[5m])) * 100)

Режимы CPU:

user — время пользовательских процессов
system — время ядра
idle — простой
iowait — ожидание I/O (диск, сеть)
irq — обработка прерываний

Важно: высокий iowait указывает на узкое место в диске или сети.

Память

# Процент использования памяти
(node_memory_MemTotal_bytes - node_memory_MemAvailable_bytes) 
/ 
node_memory_MemTotal_bytes 
* 100

# Использованная память (байты)
node_memory_MemTotal_bytes - node_memory_MemAvailable_bytes

# Swap usage
(node_memory_SwapTotal_bytes - node_memory_SwapFree_bytes) 
/ 
node_memory_SwapTotal_bytes 
* 100

# Кэш и буферы
node_memory_Cached_bytes + node_memory_Buffers_bytes

Важно: используйте MemAvailable, а не MemFree. Linux использует свободную память для кэша, что хорошо для производительности.

Диск

# Использование диска (процент)
(node_disk_size_bytes - node_disk_free_bytes) 
/ 
node_disk_size_bytes 
* 100

# Чтение/запись (байт в секунду)
sum(rate(node_disk_read_bytes_total[5m]))
sum(rate(node_disk_written_bytes_total[5m]))

# I/O операции в секунду (IOPS)
sum(rate(node_disk_reads_completed_total[5m]))
sum(rate(node_disk_writes_completed_total[5m]))

# Время ожидания диска (секунд)
rate(node_disk_io_time_seconds_total[5m])

Важно: высокий io_time_seconds_total (>0.8) указывает на перегрузку диска.

Сеть

# Входящий трафик (бит в секунду)
sum(rate(node_network_receive_bytes_total{device!="lo"}[5m])) * 8

# Исходящий трафик (бит в секунду)
sum(rate(node_network_transmit_bytes_total{device!="lo"}[5m])) * 8

# Ошибки приёма/передачи
sum(rate(node_network_receive_errs_total[5m]))
sum(rate(node_network_transmit_errs_total[5m]))

# Drop packets (потерянные пакеты)
sum(rate(node_network_receive_drop_total[5m]))
sum(rate(node_network_transmit_drop_total[5m]))

Важно: исключите lo (loopback интерфейс), если не нужен внутренний трафик.

Uptime и загрузки

# Uptime в секундах
node_time_seconds - node_boot_time_seconds

# Uptime в днях
(node_time_seconds - node_boot_time_seconds) / 86400

# Количество загрузок
node_boot_time_seconds  # меняется при перезагрузке

Процессы

# Количество процессов
node_procs_running

# Количество потоков
node_procs_blocked

# Состояние процессов (running, sleeping, zombie)
sum by (state) (node_processes_state)

Готовые запросы для дашборда

KPI панели (Stat)

# CPU Usage %
100 - (avg(rate(node_cpu_seconds_total{mode="idle"}[5m])) * 100)

# Memory Usage %
(node_memory_MemTotal_bytes - node_memory_MemAvailable_bytes) 
/ 
node_memory_MemTotal_bytes 
* 100

# Disk Usage %
(node_disk_size_bytes - node_disk_free_bytes) 
/ 
node_disk_size_bytes 
* 100

# Uptime (days)
(node_time_seconds - node_boot_time_seconds) / 86400

Графики (Time series)

# CPU по режимам
sum by (mode) (rate(node_cpu_seconds_total{mode=~"user|system|iowait|idle"}[5m])) * 100

# Memory breakdown
node_memory_MemTotal_bytes - node_memory_MemAvailable_bytes,  # Used
node_memory_Cached_bytes + node_memory_Buffers_bytes,          # Cached
node_memory_MemFree_bytes                                       # Free

# Network traffic
sum by (device) (rate(node_network_receive_bytes_total{device!="lo"}[5m])) * 8,
sum by (device) (rate(node_network_transmit_bytes_total{device!="lo"}[5m])) * -8

# Disk I/O
sum(rate(node_disk_read_bytes_total[5m])),
sum(rate(node_disk_written_bytes_total[5m]))

Алерты для инфраструктуры

Высокая загрузка CPU

- alert: HighCPUUsage
  expr: 100 - (avg by (instance) (rate(node_cpu_seconds_total{mode="idle"}[5m])) * 100) > 80
  for: 15m
  labels:
    severity: warning
  annotations:
    summary: "High CPU usage on {{ $labels.instance }}"
    description: "CPU usage is {{ $value | humanizePercentage }} for more than 15 minutes"

Нехватка памяти

- alert: HighMemoryUsage
  expr: |
    (node_memory_MemTotal_bytes - node_memory_MemAvailable_bytes) 
    / 
    node_memory_MemTotal_bytes 
    * 100 > 90
  for: 15m
  labels:
    severity: warning
  annotations:
    summary: "High memory usage on {{ $labels.instance }}"
    description: "Memory usage is {{ $value | humanizePercentage }}"

Диск заполняется

- alert: DiskSpaceLow
  expr: |
    (node_disk_size_bytes - node_disk_free_bytes) 
    / 
    node_disk_size_bytes 
    * 100 > 85
  for: 1h
  labels:
    severity: warning
  annotations:
    summary: "Disk space low on {{ $labels.instance }}"
    description: "Disk usage is {{ $value | humanizePercentage }} on {{ $labels.device }}"

Диск скоро заполнится

- alert: DiskWillFillIn24Hours
  expr: |
    predict_linear(node_disk_free_bytes[24h], 24*3600) < 0
  for: 30m
  labels:
    severity: critical
  annotations:
    summary: "Disk will fill in 24 hours on {{ $labels.instance }}"
    description: "Based on 24h trend, disk {{ $labels.device }} will be full"

Высокий I/O wait

- alert: HighIOWait
  expr: |
    avg by (instance) (rate(node_cpu_seconds_total{mode="iowait"}[5m])) 
    / 
    count by (instance) (node_cpu_seconds_total{mode="idle"}) 
    * 100 > 20
  for: 15m
  labels:
    severity: warning
  annotations:
    summary: "High I/O wait on {{ $labels.instance }}"
    description: "I/O wait is {{ $value | humanizePercentage }} — possible disk bottleneck"

Сервер перезагрузился

- alert: ServerRebooted
  expr: changes(node_boot_time_seconds[5m]) > 0
  for: 0m
  labels:
    severity: info
  annotations:
    summary: "Server {{ $labels.instance }} was rebooted"
    description: "Boot time changed at {{ $value | humanizeTimestamp }}"

Готовый дашборд

Импортируйте готовый дашборд из каталога Grafana:

Node Exporter Full (ID: 8919)

В Grafana: Dashboards → Import
Введите ID: 8919
Выберите источник данных Prometheus
Нажмите Import

Что включает:

CPU, Memory, Disk, Network графики
Температуры (если доступны)
Файловая система
Сетевые интерфейсы
Системные метрики

Мониторинг нескольких серверов

Статическая конфигурация

scrape_configs:
  - job_name: 'node'
    static_configs:
      - targets:
          - 'server1:9100'
          - 'server2:9100'
          - 'server3:9100'
        labels:
          env: 'production'
          datacenter: 'us-east'

File Service Discovery

Для динамического добавления серверов используйте file_sd:

scrape_configs:
  - job_name: 'node'
    file_sd_configs:
      - files:
          - '/etc/prometheus/targets/node.json'
        refresh_interval: 5m

Файл node.json:

[
  {
    "targets": ["server1:9100", "server2:9100"],
    "labels": {
      "env": "production",
      "datacenter": "us-east"
    }
  },
  {
    "targets": ["server3:9100"],
    "labels": {
      "env": "staging",
      "datacenter": "eu-west"
    }
  }
]

Преимущество: можно обновлять список серверов без перезапуска Prometheus.

Отладка проблем

Проблема: target DOWN

Причины:

Node Exporter не запущен
Порт 9100 заблокирован фаерволом
Неправильный адрес в конфигурации

Решение:

# Проверьте статус
systemctl status node_exporter

# Проверьте порт
curl http://localhost:9100/metrics

# Проверьте сеть
telnet server1 9100

Проблема: нет метрик

Причины:

Неправильные пути к proc/sys
Контейнер не имеет доступа к хосту

Решение:

Проверьте volumes в Docker Compose
Проверьте аргументы --path.procfs, --path.sysfs

Проблема: слишком много метрик

Node Exporter экспортирует 1000+ метрик. Если не все нужны:

scrape_configs:
  - job_name: 'node'
    metric_relabel_configs:
      # Отбросить метрики, не начинающиеся с node_cpu или node_memory
      - source_labels: [__name__]
        regex: 'node_(cpu|memory)_.*'
        action: keep

Резюме

Node Exporter — стандарт для мониторинга Linux серверов.
Установка: Docker (рекомендуется) или бинарник на сервер.
Ключевые метрики: CPU, Memory, Disk, Network, Uptime.
Алерты: настраивайте пороги для CPU > 80%, Memory > 90%, Disk > 85%.
Готовые дашборды: импортируйте Node Exporter Full (ID: 8919).
File SD: для динамического добавления серверов.
Метрик много: используйте metric_relabel_configs для фильтрации.

Что дальше?

Теперь вы умеете мониторить инфраструктуру. В следующей теме вы изучите Service Discovery — автоматическое обнаружение целей в динамических средах.

Проверьте свои знания

Вопросы ещё не добавлены

Вопросы для этой подтемы ещё не добавлены.