Подходит ли платформа для начинающих без опыта работы?

Да, курсы разбиты по уровням: Junior, Middle, Senior. Начинающие могут стартовать с базовых тем Python, Docker и алгоритмов и постепенно двигаться к более сложным темам.

Как быстро можно подготовиться к собеседованию на позицию Junior разработчика?

При занятиях 1–2 часа в день — от 2 до 4 недель на основные темы. Платформа анализирует слабые места по результатам квизов и строит персональный план подготовки.

Какие технологии охватывает платформа?

Python, FastAPI, Django, Docker, алгоритмы и структуры данных, Agile/Scrum, SQL, CI/CD, системный дизайн, код-ревью и более 50 других тем для разработчиков.

Платформа бесплатная?

Большинство учебных материалов и квизов доступны бесплатно после регистрации. Регистрация занимает менее минуты.

Как платформа помогает найти работу программистом?

Платформа даёт фундаментальные знания, которые проверяют на технических собеседованиях: алгоритмы, архитектура, фреймворки. Мок-интервью имитирует реальное собеседование. Система прогресса показывает, какие темы нужно подтянуть перед собеседованием.

logs

Logs — логирование

Логи как потоки событий, агрегация и маршрутизация

Logs: Логирование

Рассматривайте логи как потоки событий

Суть принципа

Logs — одиннадцатый фактор 12-Factor App. Принцип гласит:

Логи — это потоки событий, упорядоченных по времени. Приложение не должно управлять хранением логов, а должно писать в stdout/stderr.**

┌─────────────────────────────────────────────────────────────────┐
│                    Поток логов (stream)                         │
│                                                                  │
│  Приложение ──▶ stdout/stderr ──▶ Агрегатор ──▶ Хранилище      │
│                                                                  │
│  Приложение только пишет логи                                   │
│  Агрегатор собирает, маршрутизирует, хранит                     │
└─────────────────────────────────────────────────────────────────┘

Почему потоки событий?

Проблема: приложение управляет логами

# ❌ Неправильно: приложение управляет файлами логов
import logging
from logging.handlers import RotatingFileHandler

logger = logging.getLogger(__name__)

# Настройка ротации файлов
handler = RotatingFileHandler(
    '/var/log/myapp/app.log',
    maxBytes=10*1024*1024,  # 10 MB
    backupCount=5
)
logger.addHandler(handler)

@app.route('/api/users')
def get_users():
    logger.info(f"User request from {request.remote_addr}")
    # ...

Проблемы:

Зависимость от файловой системы — логи пишутся на диск контейнера
Потеря логов при перезапуске — контейнер удаляется, логи теряются
Сложность агрегации — логи разбросаны по множеству контейнеров
Масштабирование — каждый процесс пишет в свой файл

Решение: логи как потоки

# ✅ Правильно: логи в stdout/stderr
import logging
import sys

# Настройка логирования в stdout
logging.basicConfig(
    stream=sys.stdout,
    level=logging.INFO,
    format='%(asctime)s - %(name)s - %(levelname)s - %(message)s'
)

logger = logging.getLogger(__name__)

@app.route('/api/users')
def get_users():
    logger.info(f"User request from {request.remote_addr}")
    # ...

┌──────────────────────────────────────────────────────────────┐
│  Docker контейнер                                            │
│  ┌────────────┐                                             │
│  │ Приложение │                                             │
│  │            │                                             │
│  │ stdout ────┼────────────────────────▶ Docker daemon      │
│  │ stderr ────┼────────────────────────▶ Docker daemon      │
│  └────────────┘                                             │
└──────────────────────────────────────────────────────────────┘
                          │
                          ▼
              ┌───────────────────────┐
              │  Log Aggregator       │
              │  (ELK, Splunk, etc.)  │
              └───────────────────────┘

Преимущества:

✅ Независимость от ФС — логи не пишутся на диск
✅ Сохранность — агрегатор собирает логи до удаления контейнера
✅ Централизация — все логи в одном месте
✅ Маршрутизация — разные логи в разные системы

Уровни логирования

Стандартные уровни

import logging

logger = logging.getLogger(__name__)

# DEBUG — детальная информация для отладки
logger.debug("Database query: SELECT * FROM users WHERE id = %s", user_id)

# INFO — подтверждение нормальной работы
logger.info("User %s logged in successfully", user_id)

# WARNING — неожиданное событие, но приложение работает
logger.warning("Rate limit approaching for user %s: %d/1000", user_id, count)

# ERROR — ошибка, но приложение продолжает работу
logger.error("Failed to send email to %s: %s", email, str(exc))

# CRITICAL — серьёзная ошибка, приложение не может работать
logger.critical("Database connection lost: %s", str(exc))

Структурированное логирование

JSON формат

import logging
import json
import sys
from datetime import datetime

class JSONFormatter(logging.Formatter):
    """Форматирование логов в JSON"""
    
    def format(self, record):
        log_entry = {
            'timestamp': datetime.utcnow().isoformat() + 'Z',
            'level': record.levelname,
            'logger': record.name,
            'message': record.getMessage(),
            'module': record.module,
            'function': record.funcName,
            'line': record.lineno,
        }
        
        # Добавление контекста
        if hasattr(record, 'user_id'):
            log_entry['user_id'] = record.user_id
        if hasattr(record, 'request_id'):
            log_entry['request_id'] = record.request_id
        
        # Добавление исключения
        if record.exc_info:
            log_entry['exception'] = {
                'type': record.exc_info[0].__name__ if record.exc_info[0] else None,
                'message': str(record.exc_info[1]) if record.exc_info[1] else None,
                'traceback': self.formatException(record.exc_info)
            }
        
        return json.dumps(log_entry)

# Настройка
logger = logging.getLogger(__name__)
handler = logging.StreamHandler(sys.stdout)
handler.setFormatter(JSONFormatter())
logger.addHandler(handler)
logger.setLevel(logging.INFO)

# Использование
logger.info(
    "User login successful",
    extra={'user_id': 123, 'request_id': 'req-abc-123'}
)

Вывод:

{
  "timestamp": "2024-03-24T10:30:45.123Z",
  "level": "INFO",
  "logger": "app.auth",
  "message": "User login successful",
  "module": "auth",
  "function": "login",
  "line": 45,
  "user_id": 123,
  "request_id": "req-abc-123"
}

Контекстное логирование

from contextvars import ContextVar
import logging

# Контекстные переменные для запроса
request_id_ctx = ContextVar('request_id', default=None)
user_id_ctx = ContextVar('user_id', default=None)

class ContextFilter(logging.Filter):
    """Добавление контекста к каждому логу"""
    
    def filter(self, record):
        record.request_id = request_id_ctx.get()
        record.user_id = user_id_ctx.get()
        return True

# Настройка
logger = logging.getLogger(__name__)
handler = logging.StreamHandler()
handler.addFilter(ContextFilter())
handler.setFormatter(JSONFormatter())
logger.addHandler(handler)

# Middleware для добавления контекста
from flask import request, g

@app.before_request
def set_request_context():
    request_id_ctx.set(request.headers.get('X-Request-ID', str(uuid.uuid4())))
    if hasattr(g, 'user_id'):
        user_id_ctx.set(g.user_id)

# Теперь каждый лог автоматически содержит request_id и user_id
logger.info("Processing request")  # Автоматически добавит контекст

Логирование в Docker

Базовая конфигурация

# Dockerfile
FROM python:3.12-slim

WORKDIR /app

COPY requirements.txt .
RUN pip install --no-cache-dir -r requirements.txt

COPY . .

# Логи пишутся в stdout/stderr по умолчанию
CMD ["gunicorn", "--bind", "0.0.0.0:5000", "app:app"]

# docker-compose.yml
version: '3.8'

services:
  web:
    build: .
    ports:
      - "5000:5000"
    environment:
      - LOG_LEVEL=INFO
      - LOG_FORMAT=json
    # Docker по умолчанию собирает stdout/stderr
    # и отправляет в logging driver
    logging:
      driver: json-file
      options:
        max-size: "10m"
        max-file: "3"

Logging drivers

# json-file (по умолчанию)
logging:
  driver: json-file
  options:
    max-size: "10m"
    max-file: "3"

# syslog
logging:
  driver: syslog
  options:
    syslog-address: "udp://logs.example.com:514"

# journald
logging:
  driver: journald

# splunk
logging:
  driver: splunk
  options:
    splunk-token: "xxx-xxx-xxx"
    splunk-url: "https://splunk.example.com:8088"

# fluentd
logging:
  driver: fluentd
  options:
    fluentd-address: "localhost:24224"

Агрегация логов

Архитектура с ELK Stack

┌─────────────────────────────────────────────────────────────────┐
│                    ELK Stack Architecture                       │
│                                                                  │
│  ┌─────────┐  ┌─────────┐  ┌─────────┐                        │
│  │  App 1  │  │  App 2  │  │  App 3  │                        │
│  └────┬────┘  └────┬────┘  └────┬────┘                        │
│       │           │           │                                 │
│       └───────────┼───────────┘                                 │
│                   │                                             │
│                   ▼                                             │
│            ┌─────────────┐                                      │
│            │  Filebeat/  │                                      │
│            │  Fluentd    │                                      │
│            └──────┬──────┘                                      │
│                   │                                             │
│                   ▼                                             │
│            ┌─────────────┐                                      │
│            │  Logstash   │  (парсинг, обогащение)              │
│            └──────┬──────┘                                      │
│                   │                                             │
│                   ▼                                             │
│            ┌─────────────┐                                      │
│            │ Elasticsearch│  (индексирование, хранение)         │
│            └──────┬──────┘                                      │
│                   │                                             │
│                   ▼                                             │
│            ┌─────────────┐                                      │
│            │   Kibana    │  (визуализация, поиск)              │
│            └─────────────┘                                      │
└─────────────────────────────────────────────────────────────────┘

Docker Compose с ELK

version: '3.8'

services:
  elasticsearch:
    image: docker.elastic.co/elasticsearch/elasticsearch:8.11.0
    environment:
      - discovery.type=single-node
      - xpack.security.enabled=false
    volumes:
      - elasticsearch_data:/usr/share/elasticsearch/data
    ports:
      - "9200:9200"

  logstash:
    image: docker.elastic.co/logstash/logstash:8.11.0
    volumes:
      - ./logstash/pipeline:/usr/share/logstash/pipeline
    ports:
      - "5044:5044"

  kibana:
    image: docker.elastic.co/kibana/kibana:8.11.0
    environment:
      - ELASTICSEARCH_HOSTS=http://elasticsearch:9200
    ports:
      - "5601:5601"

  filebeat:
    image: docker.elastic.co/beats/filebeat:8.11.0
    volumes:
      - ./filebeat.yml:/usr/share/filebeat/filebeat.yml:ro
      - /var/lib/docker/containers:/var/lib/docker/containers:ro
      - /var/run/docker.sock:/var/run/docker.sock:ro
    depends_on:
      - logstash

volumes:
  elasticsearch_data:

# filebeat.yml
filebeat.inputs:
  - type: container
    paths:
      - /var/lib/docker/containers/*/*.log

processors:
  - add_kubernetes_metadata:
      host: ${NODE_NAME}
      matchers:
        - logs_path:
            logs_path: "/var/lib/docker/containers/"

output.logstash:
  hosts: ["logstash:5044"]

Logstash pipeline

# logstash/pipeline/logstash.conf
input {
  beats {
    port => 5044
  }
}

filter {
  # Парсинг JSON логов
  json {
    source => "message"
  }

  # Добавление временной метки
  date {
    match => ["timestamp", "ISO8601"]
    target => "@timestamp"
  }

  # Фильтрация по уровням
  if [level] == "ERROR" {
    mutate {
      add_tag => ["error"]
    }
  }
}

output {
  elasticsearch {
    hosts => ["elasticsearch:9200"]
    index => "logs-%{+YYYY.MM.dd}"
  }
  
  # Отправка ошибок в Slack
  if "error" in [tags] {
    slack {
      url => "https://hooks.slack.com/services/xxx/yyy/zzz"
      message => "Error: %{message}"
    }
  }
}

Маршрутизация логов

Разные потоки для разных целей

import logging
import sys

# Логирование приложения
app_logger = logging.getLogger('app')
app_handler = logging.StreamHandler(sys.stdout)
app_handler.setFormatter(JSONFormatter())
app_logger.addHandler(app_handler)
app_logger.setLevel(logging.INFO)

# Логирование аудита (отдельный поток)
audit_logger = logging.getLogger('audit')
audit_handler = logging.StreamHandler(sys.stdout)
audit_handler.setFormatter(JSONFormatter())
audit_logger.addHandler(audit_handler)
audit_logger.setLevel(logging.INFO)

# Разные логи для разных целей
app_logger.info("User logged in")  # Обычный лог
audit_logger.info("User login", extra={
    'user_id': 123,
    'event_type': 'login',
    'ip_address': request.remote_addr
})  # Аудит

# Logstash для маршрутизации
output {
  # Все логи в Elasticsearch
  elasticsearch {
    hosts => ["elasticsearch:9200"]
    index => "app-logs-%{+YYYY.MM.dd}"
  }
  
  # Аудит логи в отдельный индекс
  if [logger] == "audit" {
    elasticsearch {
      hosts => ["elasticsearch:9200"]
      index => "audit-logs-%{+YYYY.MM.dd}"
    }
  }
  
  # Ошибки в Slack
  if [level] == "ERROR" {
    slack {
      url => "https://hooks.slack.com/services/xxx"
      message => "Error in %{logger}: %{message}"
    }
  }
  
  # Критические ошибки в PagerDuty
  if [level] == "CRITICAL" {
    pagerduty {
      service_key => "xxx"
      description => "%{message}"
    }
  }
}

Антипаттерны

❌ Логирование в файлы

# ❌ Неправильно: логи в файлы
logging.basicConfig(
    filename='/var/log/app.log',  # Файл в контейнере
    level=logging.INFO
)

Проблема: При удалении контейнера логи теряются. В Kubernetes с ephemeral storage логи недоступны после перезапуска пода.

❌ Логирование чувствительных данных

# ❌ Неправильно: логирование секретов
logger.info(f"User login: {username}, password: {password}")
logger.info(f"API request with key: {api_key}")
logger.info(f"Credit card: {card_number}")

Решение:

# ✅ Правильно: маскирование секретов
def mask_sensitive(value, visible_chars=4):
    if len(value) <= visible_chars:
        return '*' * len(value)
    return '*' * (len(value) - visible_chars) + value[-visible_chars:]

logger.info(f"User login: {username}, password: {'*' * len(password)}")
logger.info(f"API key: {mask_sensitive(api_key)}")

❌ Чрезмерное логирование

# ❌ Неправильно: слишком много логов
for item in items:
    logger.debug(f"Processing item {item.id}: {item.name}")
    logger.debug(f"Item price: {item.price}")
    logger.debug(f"Item stock: {item.stock}")

Проблема: Миллионы строк логов в секунду, сложно найти важное, высокие затраты на хранение.

❌ Неструктурированное логирование

# ❌ Неправильно: неструктурированные логи
logger.info(f"User {user_id} from {ip} bought {count} items for ${total}")

Решение:

# ✅ Правильно: структурированные логи
logger.info("Purchase completed", extra={
    'user_id': user_id,
    'ip_address': ip,
    'item_count': count,
    'total_amount': total,
    'event_type': 'purchase'
})

Проверка соответствия принципу

Задайте себе вопросы:

Пишет ли приложение логи только в stdout/stderr?
Используется ли структурированное логирование (JSON)?
Настроен ли агрегатор логов (ELK, Splunk)?
Не логируются ли чувствительные данные?
Есть ли контекст в логах (request_id, user_id)?
Настроена ли маршрутизация логов?

Связь с другими факторами

Processes — каждый процесс пишет в stdout/stderr
Dev/Prod Parity — одинаковое логирование во всех средах
Telemetry — логи дополняются метриками и трейсами

Пример из практики

До: логи в файлы

# ❌ Логирование в файлы
import logging

logging.basicConfig(
    filename='/var/log/myapp/app.log',
    level=logging.INFO,
    format='%(asctime)s - %(levelname)s - %(message)s'
)

logger = logging.getLogger(__name__)

Проблемы:

Логи теряются при перезапуске контейнера
Невозможно агрегировать логи с нескольких экземпляров
Нет структурированного формата для поиска

После: логи как потоки

# ✅ Логирование в stdout с JSON форматом
import logging
import sys
import json

class JSONFormatter(logging.Formatter):
    def format(self, record):
        log = {
            'timestamp': self.formatTime(record),
            'level': record.levelname,
            'logger': record.name,
            'message': record.getMessage(),
        }
        if record.exc_info:
            log['exception'] = self.formatException(record.exc_info)
        return json.dumps(log)

logger = logging.getLogger(__name__)
handler = logging.StreamHandler(sys.stdout)
handler.setFormatter(JSONFormatter())
logger.addHandler(handler)
logger.setLevel(logging.INFO)

logger.info("Application started")

# docker-compose.yml с агрегацией
services:
  web:
    build: .
    logging:
      driver: json-file
      options:
        max-size: "10m"
        max-file: "3"

  elasticsearch:
    image: elasticsearch:8.11.0

  logstash:
    image: logstash:8.11.0
    volumes:
      - ./pipeline:/usr/share/logstash/pipeline

  kibana:
    image: kibana:8.11.0

Результат:

✅ Логи сохраняются после удаления контейнера
✅ Централизованный поиск по всем экземплярам
✅ Структурированный формат для анализа
✅ Маршрутизация ошибок в Slack

Ключевой вывод: Логи — это потоки событий, упорядоченных по времени. Приложение должно писать в stdout/stderr, а агрегатор собирает, маршрутизирует и хранит логи. Это обеспечивает сохранность, централизацию и возможность анализа логов в распределённых системах.

Проверьте свои знания

Вопросы ещё не добавлены

Вопросы для этой подтемы ещё не добавлены.

┌─────────────────────────────────────────────────────────────────┐ │ Поток логов (stream) │ │ │ │ Приложение ──▶ stdout/stderr ──▶ Агрегатор ──▶ Хранилище │ │ │ │ Приложение только пишет логи │ │ Агрегатор собирает, маршрутизирует, хранит │ └─────────────────────────────────────────────────────────────────┘

┌──────────────────────────────────────────────────────────────┐ │ Docker контейнер │ │ ┌────────────┐ │ │ │ Приложение │ │ │ │ │ │ │ │ stdout ────┼────────────────────────▶ Docker daemon │ │ │ stderr ────┼────────────────────────▶ Docker daemon │ │ └────────────┘ │ └──────────────────────────────────────────────────────────────┘ │ ▼ ┌───────────────────────┐ │ Log Aggregator │ │ (ELK, Splunk, etc.) │ └───────────────────────┘

┌─────────────────────────────────────────────────────────────────┐ │ ELK Stack Architecture │ │ │ │ ┌─────────┐ ┌─────────┐ ┌─────────┐ │ │ │ App 1 │ │ App 2 │ │ App 3 │ │ │ └────┬────┘ └────┬────┘ └────┬────┘ │ │ │ │ │ │ │ └───────────┼───────────┘ │ │ │ │ │ ▼ │ │ ┌─────────────┐ │ │ │ Filebeat/ │ │ │ │ Fluentd │ │ │ └──────┬──────┘ │ │ │ │ │ ▼ │ │ ┌─────────────┐ │ │ │ Logstash │ (парсинг, обогащение) │ │ └──────┬──────┘ │ │ │ │ │ ▼ │ │ ┌─────────────┐ │ │ │ Elasticsearch│ (индексирование, хранение) │ │ └──────┬──────┘ │ │ │ │ │ ▼ │ │ ┌─────────────┐ │ │ │ Kibana │ (визуализация, поиск) │ │ └─────────────┘ │ └─────────────────────────────────────────────────────────────────┘

Logs — логирование

Logs: Логирование

Суть принципа

Почему потоки событий?

Проблема: приложение управляет логами

Решение: логи как потоки

Уровни логирования

Стандартные уровни

Рекомендации по уровням

Структурированное логирование

JSON формат

Контекстное логирование

Логирование в Docker

Базовая конфигурация

Logging drivers

Агрегация логов

Архитектура с ELK Stack

Docker Compose с ELK

Logstash pipeline

Маршрутизация логов

Разные потоки для разных целей

Антипаттерны

❌ Логирование в файлы

❌ Логирование чувствительных данных

❌ Чрезмерное логирование

❌ Неструктурированное логирование

Проверка соответствия принципу

Связь с другими факторами

Пример из практики

До: логи в файлы

После: логи как потоки

Проверьте свои знания

Logs — логирование

Logs: Логирование

Суть принципа

Почему потоки событий?

Проблема: приложение управляет логами

Решение: логи как потоки

Уровни логирования

Стандартные уровни

Рекомендации по уровням

Структурированное логирование

JSON формат

Контекстное логирование

Логирование в Docker

Базовая конфигурация

Logging drivers

Агрегация логов

Архитектура с ELK Stack

Docker Compose с ELK

Logstash pipeline

Маршрутизация логов

Разные потоки для разных целей

Антипаттерны

❌ Логирование в файлы

❌ Логирование чувствительных данных

❌ Чрезмерное логирование

❌ Неструктурированное логирование

Проверка соответствия принципу

Связь с другими факторами

Пример из практики

До: логи в файлы

После: логи как потоки

Проверьте свои знания