Подходит ли платформа для начинающих без опыта работы?

Да, курсы разбиты по уровням: Junior, Middle, Senior. Начинающие могут стартовать с базовых тем Python, Docker и алгоритмов и постепенно двигаться к более сложным темам.

Как быстро можно подготовиться к собеседованию на позицию Junior разработчика?

При занятиях 1–2 часа в день — от 2 до 4 недель на основные темы. Платформа анализирует слабые места по результатам квизов и строит персональный план подготовки.

Какие технологии охватывает платформа?

Python, FastAPI, Django, Docker, алгоритмы и структуры данных, Agile/Scrum, SQL, CI/CD, системный дизайн, код-ревью и более 50 других тем для разработчиков.

Платформа бесплатная?

Большинство учебных материалов и квизов доступны бесплатно после регистрации. Регистрация занимает менее минуты.

Как платформа помогает найти работу программистом?

Платформа даёт фундаментальные знания, которые проверяют на технических собеседованиях: алгоритмы, архитектура, фреймворки. Мок-интервью имитирует реальное собеседование. Система прогресса показывает, какие темы нужно подтянуть перед собеседованием.

query_optimization

Оптимизация запросов (EXPLAIN)

Анализ планов выполнения, поиск узких мест, оптимизация запросов

Оптимизация запросов (EXPLAIN)

EXPLAIN — главный инструмент анализа производительности запросов в PostgreSQL. В этой теме вы научитесь читать планы выполнения, находить узкие места и оптимизировать запросы.

EXPLAIN и EXPLAIN ANALYZE

Базовое использование

-- Показать план без выполнения
EXPLAIN SELECT * FROM users WHERE email = 'test@example.com';

-- Показать план с фактическим выполнением
EXPLAIN ANALYZE SELECT * FROM users WHERE email = 'test@example.com';

-- Подробный вывод со статистикой буферов
EXPLAIN (ANALYZE, BUFFERS) SELECT * FROM users WHERE email = 'test@example.com';

Опции EXPLAIN

Опция	Описание
`ANALYZE`	Выполнить запрос и показать фактическое время
`BUFFERS`	Показать статистику использования буферов
`VERBOSE`	Показать дополнительную информацию
`COSTS`	Показать оценку стоимости (по умолчанию)
`SETTINGS`	Показать настройки планировщика
`FORMAT TEXT/JSON/XML/YAML`	Формат вывода

-- Полный пример
EXPLAIN (ANALYZE, BUFFERS, VERBOSE, FORMAT JSON)
SELECT * FROM users WHERE email = 'test@example.com';

Чтение плана выполнения

Пример плана

Index Scan using idx_users_email on users  (cost=0.29..8.30 rows=1 width=32)
  Actual Time=0.025..0.026 rows=1 loops=1
  Index Cond: (email = 'test@example.com'::text)
  Buffers: shared hit=2

Ключевые метрики

Метрика	Описание
`cost=0.29..8.30`	Оценка стоимости (startup..total)
`rows=1`	Оценка количества строк
`width=32`	Средняя ширина строки в байтах
`Actual Time=0.025..0.026`	Фактическое время (startup..total) в мс
`rows=1`	Фактическое количество строк
`loops=1`	Сколько раз выполнен узел
`Buffers: shared hit=2`	Чтение из памяти (hit) и диска (read)

Типы сканирования

Seq Scan (Последовательное сканирование)

Seq Scan on users  (cost=0.00..35.50 rows=1000 width=32)
  Actual Time=0.010..0.150 rows=1000 loops=1
  Filter: (age > 25)
  Rows Removed by Filter: 5000

Когда используется:

Маленькие таблицы
Запрос возвращает большую часть таблицы
Нет подходящего индекса

Проблема: O(n) — читает всю таблицу

Решение: Создать индекс для фильтра

Index Scan

Index Scan using idx_users_email on users  (cost=0.29..8.30 rows=1 width=32)
  Actual Time=0.020..0.021 rows=1 loops=1
  Index Cond: (email = 'test@example.com'::text)

Когда используется:

Поиск по индексированному столбцу
Диапазонные запросы
Сортировка по индексу

Преимущество: O(log n) — быстрее для селективных запросов

Index Only Scan

Index Only Scan using idx_users_email on users  (cost=0.29..8.30 rows=1 width=8)
  Actual Time=0.015..0.016 rows=1 loops=1
  Index Cond: (email = 'test@example.com'::text)
  Heap Fetches: 0

Когда используется:

Все нужные столбцы есть в индексе
Не нужно обращаться к таблице (heap)

Преимущество: Самый быстрый тип сканирования

Требование: VACUUM для поддержания видимости строк

Bitmap Index Scan + Bitmap Heap Scan

Bitmap Heap Scan on users  (cost=4.32..20.50 rows=100 width=32)
  Actual Time=0.050..0.100 rows=100 loops=1
  Recheck Cond: (age > 25)
  Heap Blocks: exact=50
->  Bitmap Index Scan on idx_users_age  (cost=0.00..4.30 rows=100 width=0)
      Actual Time=0.030..0.030 rows=100 loops=1
      Index Cond: (age > 25)

Когда используется:

Несколько индексов для одного запроса
Запрос возвращает среднее число строк

Механизм:

Bitmap Index Scan создаёт битовую картуmatching строк
Bitmap Heap Scan читает строки из таблицы

Типы JOIN

Nested Loop

Nested Loop  (cost=0.29..50.00 rows=10 width=64)
  Actual Time=0.050..0.200 rows=10 loops=1
  ->  Index Scan using idx_users_id on users  (cost=0.29..8.30 rows=1 width=32)
        Actual Time=0.020..0.021 rows=1 loops=10
        Index Cond: (id = orders.user_id)
  ->  Seq Scan on orders  (cost=0.00..40.00 rows=1000 width=32)
        Actual Time=0.005..0.015 rows=100 loops=1

Когда используется:

Маленькая внешняя таблица
Есть индекс для внутренней таблицы
Ожидается мало строк результата

Сложность: O(n * m) в худшем случае

Hash Join

Hash Join  (cost=50.00..150.00 rows=1000 width=64)
  Actual Time=1.0..5.0 rows=1000 loops=1
  Hash Cond: (orders.user_id = users.id)
  ->  Seq Scan on orders  (cost=0.00..80.00 rows=5000 width=32)
        Actual Time=0.5..3.0 rows=5000 loops=1
  ->  Hash  (cost=40.00..40.00 rows=1000 width=32)
        Actual Time=0.4..0.4 rows=1000 loops=1
        Buckets: 1024  Batches: 1  Memory Usage: 64kB
        ->  Seq Scan on users  (cost=0.00..40.00 rows=1000 width=32)
              Actual Time=0.1..0.2 rows=1000 loops=1

Когда используется:

Большие таблицы без индексов
Ожидается много строк результата
Нет подходящих индексов

Преимущество: O(n + m) — эффективно для больших данных

Merge Join

Merge Join  (cost=30.00..100.00 rows=500 width=64)
  Actual Time=0.5..2.0 rows=500 loops=1
  Merge Cond: (orders.user_id = users.id)
  ->  Index Scan using idx_orders_user on orders  (cost=0.29..60.00 rows=5000 width=32)
        Actual Time=0.1..1.0 rows=5000 loops=1
  ->  Index Scan using idx_users_id on users  (cost=0.29..30.00 rows=1000 width=32)
        Actual Time=0.1..0.5 rows=1000 loops=1

Когда используется:

Обе таблицы отсортированы по ключу JOIN
Большие отсортированные данные

Преимущество: O(n + m) при отсортированных данных

Поиск проблем производительности

1. Seq Scan с фильтрацией

Seq Scan on users  (cost=0.00..100.00 rows=1 width=32)
  Actual Time=0.5..50.0 rows=1 loops=1
  Filter: (email = 'test@example.com')
  Rows Removed by Filter: 99999

Проблема: 99999 строк отфильтровано, найдена 1

Решение: Создать индекс

CREATE INDEX idx_users_email ON users(email);

2. Неправильный порядок JOIN

Nested Loop  (cost=0.29..50000.00 rows=10000 width=64)
  Actual Time=0.1..5000.0 rows=10000 loops=1
  ->  Seq Scan on large_table  (cost=0.00..40000.00 rows=100000 width=32)
        Actual Time=0.05..4000.0 rows=100000 loops=1
  ->  Index Scan using idx_small_id on small_table  (cost=0.29..0.10 rows=1 width=32)
        Actual Time=0.005..0.005 rows=1 loops=100000

Проблема: Внешний цикл — большая таблица

Решение: Обновить статистику

ANALYZE large_table;
ANALYZE small_table;

3. Функция в WHERE

Seq Scan on users  (cost=0.00..100.00 rows=1 width=32)
  Actual Time=0.5..50.0 rows=1 loops=1
  Filter: (LOWER(email) = 'test@example.com')

Проблема: Индекс не используется из-за функции

Решение: Функциональный индекс

CREATE INDEX idx_users_email_lower ON users(LOWER(email));

4. Неправильный тип данных

Index Scan using idx_users_id on users  (cost=0.29..8.30 rows=1 width=32)
  Actual Time=0.5..0.5 rows=0 loops=1
  Index Cond: (id = '123')
  Filter: (id = '123'::integer)

Проблема: Неявное приведение типов

Решение: Использовать правильный тип

-- Плохо
SELECT * FROM users WHERE id = '123';

-- Хорошо
SELECT * FROM users WHERE id = 123;

5. Отсутствие статистики

Seq Scan on users  (cost=0.00..100.00 rows=5000 width=32)
  Actual Time=0.5..50.0 rows=1 loops=1
  Filter: (is_active = true)

Проблема: Планировщик ошибся в оценке (ожидал 5000, получил 1)

Решение: Обновить статистику

ANALYZE users;

-- Или для конкретных столбцов
ANALYZE users(is_active);

Оптимизация запросов

1. Выборка только нужных столбцов

-- Плохо: выбирает все столбцы
SELECT * FROM users WHERE id = 1;

-- Хорошо: только нужные столбцы
SELECT id, name, email FROM users WHERE id = 1;

Преимущество: Index Only Scan возможен

2. Использование EXISTS вместо IN для подзапросов

-- Медленно: IN с подзапросом
SELECT * FROM users
WHERE id IN (SELECT user_id FROM orders WHERE total > 1000);

-- Быстрее: EXISTS
SELECT * FROM users
WHERE EXISTS (
    SELECT 1 FROM orders 
    WHERE orders.user_id = users.id AND total > 1000
);

3. Ограничение результата

-- Без LIMIT: сканирует всю таблицу
SELECT * FROM orders ORDER BY created_at DESC;

-- С LIMIT: останавливается после N строк
SELECT * FROM orders ORDER BY created_at DESC LIMIT 10;

4. Избегание SELECT DISTINCT

-- Медленно: DISTINCT требует сортировки
SELECT DISTINCT user_id FROM orders;

-- Быстрее: GROUP BY
SELECT user_id FROM orders GROUP BY user_id;

-- Или EXISTS для проверки существования
SELECT u.* FROM users u
WHERE EXISTS (SELECT 1 FROM orders o WHERE o.user_id = u.id);

5. Правильное использование индексов

-- Индекс не используется: LIKE с % в начале
SELECT * FROM users WHERE name LIKE '%john%';

-- Индекс используется: LIKE с константой в начале
SELECT * FROM users WHERE name LIKE 'john%';

-- Решение для поиска по подстроке: расширение pg_trgm
CREATE EXTENSION pg_trgm;
CREATE INDEX idx_users_name_trgm ON users USING gin(name gin_trgm_ops);
SELECT * FROM users WHERE name LIKE '%john%';  -- использует индекс

Настройки планировщика

Просмотр настроек

SHOW random_page_cost;
SHOW seq_page_cost;
SHOW effective_cache_size;
SHOW work_mem;

Ключевые параметры

Параметр	Описание	Рекомендация
`random_page_cost`	Стоимость случайного чтения страницы	1.1-1.5 для SSD, 4.0 для HDD
`seq_page_cost`	Стоимость последовательного чтения	1.0 (по умолчанию)
`effective_cache_size`	Оценка размера кэша ОС	50-75% от RAM
`work_mem`	Память для сортировок и хэшей	4-64MB в зависимости от нагрузки
`shared_buffers`	Размер буферов PostgreSQL	25% от RAM

Временное изменение для сессии

SET random_page_cost = 1.1;
SET work_mem = '64MB';

-- Выполнить запрос
EXPLAIN ANALYZE SELECT ...;

-- Сбросить
RESET random_page_cost;
RESET work_mem;

Практический пример оптимизации

Исходный запрос (медленно)

-- Запрос выполняется 5 секунд
EXPLAIN ANALYZE
SELECT 
    u.name,
    u.email,
    COUNT(o.id) as order_count,
    SUM(o.total) as total_spent
FROM users u
LEFT JOIN orders o ON u.id = o.user_id
WHERE u.created_at > NOW() - INTERVAL '30 days'
  AND o.status = 'completed'
GROUP BY u.id, u.name, u.email
ORDER BY total_spent DESC
LIMIT 100;

План выполнения

Sort  (cost=5000.00..5000.25 rows=100 width=64)
  Actual Time=5000.0..5000.5 rows=100 loops=1
  Sort Key: (sum(o.total)) DESC
  Sort Method: top-N heapsort  Memory: 32kB
  ->  HashAggregate  (cost=4500.00..5000.00 rows=1000 width=64)
        Actual Time=4900.0..4950.0 rows=10000 loops=1
        Group Key: u.id
        ->  Hash Join  (cost=100.00..4000.00 rows=50000 width=64)
              Actual Time=1.0..4000.0 rows=50000 loops=1
              Hash Cond: (o.user_id = u.id)
              ->  Seq Scan on orders o  (cost=0.00..3500.00 rows=50000 width=20)
                    Actual Time=0.5..3500.0 rows=50000 loops=1
                    Filter: (status = 'completed')
              ->  Hash  (cost=80.00..80.00 rows=1000 width=44)
                    Actual Time=0.3..0.3 rows=1000 loops=1
                    Buckets: 1024  Batches: 1  Memory Usage: 64kB
                    ->  Seq Scan on users u  (cost=0.00..80.00 rows=1000 width=44)
                          Actual Time=0.1..0.2 rows=1000 loops=1
                          Filter: (created_at > NOW() - '30 days'::interval)

Оптимизация

-- 1. Создать индексы
CREATE INDEX idx_users_created_at ON users(created_at);
CREATE INDEX idx_orders_user_status ON orders(user_id, status) INCLUDE (total);

-- 2. Обновить статистику
ANALYZE users;
ANALYZE orders;

-- 3. Оптимизированный запрос
EXPLAIN ANALYZE
SELECT 
    u.name,
    u.email,
    COUNT(o.id) as order_count,
    SUM(o.total) as total_spent
FROM users u
LEFT JOIN orders o ON u.id = o.user_id AND o.status = 'completed'
WHERE u.created_at > NOW() - INTERVAL '30 days'
GROUP BY u.id, u.name, u.email
ORDER BY total_spent DESC
LIMIT 100;

Новый план (быстро)

Limit  (cost=100.00..100.25 rows=100 width=64)
  Actual Time=50.0..50.1 rows=100 loops=1
  ->  Sort  (cost=100.00..100.25 rows=100 width=64)
        Actual Time=49.0..49.5 rows=100 loops=1
        Sort Key: (sum(o.total)) DESC
        Sort Method: top-N heapsort  Memory: 32kB
        ->  HashAggregate  (cost=80.00..90.00 rows=1000 width=64)
              Actual Time=40.0..45.0 rows=1000 loops=1
              Group Key: u.id
              ->  Nested Loop  (cost=0.50..70.00 rows=5000 width=64)
                    Actual Time=0.5..35.0 rows=5000 loops=1
                    ->  Index Scan using idx_users_created_at on users u  (cost=0.29..20.00 rows=1000 width=44)
                          Actual Time=0.2..10.0 rows=1000 loops=1
                          Index Cond: (created_at > NOW() - '30 days'::interval)
                    ->  Index Scan using idx_orders_user_status on orders o  (cost=0.21..0.05 rows=5 width=20)
                          Actual Time=0.02..0.02 rows=5 loops=1000
                          Index Cond: (user_id = u.id AND status = 'completed')

Результат: 5000 мс → 50 мс (100x ускорение)

Что дальше?

Теперь вы умеете анализировать и оптимизировать запросы. В следующей теме вы изучите безопасность и управление доступом — роли, привилегии и Row Level Security.

Проверьте свои знания

Вопросы ещё не добавлены

Вопросы для этой подтемы ещё не добавлены.

Далее: Безопасность и управление доступом

Опция

Описание

ANALYZE

Выполнить запрос и показать фактическое время

BUFFERS

Показать статистику использования буферов

VERBOSE

Показать дополнительную информацию

COSTS

Показать оценку стоимости (по умолчанию)

SETTINGS

Показать настройки планировщика

FORMAT TEXT/JSON/XML/YAML

Формат вывода

Метрика

Описание

cost=0.29..8.30

Оценка стоимости (startup..total)

rows=1

Оценка количества строк

width=32

Средняя ширина строки в байтах

Actual Time=0.025..0.026

Фактическое время (startup..total) в мс

rows=1

Фактическое количество строк

loops=1

Сколько раз выполнен узел

Buffers: shared hit=2

Чтение из памяти (hit) и диска (read)

Bitmap Heap Scan on users (cost=4.32..20.50 rows=100 width=32) Actual Time=0.050..0.100 rows=100 loops=1 Recheck Cond: (age > 25) Heap Blocks: exact=50 -> Bitmap Index Scan on idx_users_age (cost=0.00..4.30 rows=100 width=0) Actual Time=0.030..0.030 rows=100 loops=1 Index Cond: (age > 25)

Nested Loop (cost=0.29..50.00 rows=10 width=64) Actual Time=0.050..0.200 rows=10 loops=1 -> Index Scan using idx_users_id on users (cost=0.29..8.30 rows=1 width=32) Actual Time=0.020..0.021 rows=1 loops=10 Index Cond: (id = orders.user_id) -> Seq Scan on orders (cost=0.00..40.00 rows=1000 width=32) Actual Time=0.005..0.015 rows=100 loops=1

Hash Join (cost=50.00..150.00 rows=1000 width=64) Actual Time=1.0..5.0 rows=1000 loops=1 Hash Cond: (orders.user_id = users.id) -> Seq Scan on orders (cost=0.00..80.00 rows=5000 width=32) Actual Time=0.5..3.0 rows=5000 loops=1 -> Hash (cost=40.00..40.00 rows=1000 width=32) Actual Time=0.4..0.4 rows=1000 loops=1 Buckets: 1024 Batches: 1 Memory Usage: 64kB -> Seq Scan on users (cost=0.00..40.00 rows=1000 width=32) Actual Time=0.1..0.2 rows=1000 loops=1

Merge Join (cost=30.00..100.00 rows=500 width=64) Actual Time=0.5..2.0 rows=500 loops=1 Merge Cond: (orders.user_id = users.id) -> Index Scan using idx_orders_user on orders (cost=0.29..60.00 rows=5000 width=32) Actual Time=0.1..1.0 rows=5000 loops=1 -> Index Scan using idx_users_id on users (cost=0.29..30.00 rows=1000 width=32) Actual Time=0.1..0.5 rows=1000 loops=1

Nested Loop (cost=0.29..50000.00 rows=10000 width=64) Actual Time=0.1..5000.0 rows=10000 loops=1 -> Seq Scan on large_table (cost=0.00..40000.00 rows=100000 width=32) Actual Time=0.05..4000.0 rows=100000 loops=1 -> Index Scan using idx_small_id on small_table (cost=0.29..0.10 rows=1 width=32) Actual Time=0.005..0.005 rows=1 loops=100000

Параметр

Описание

Рекомендация

random_page_cost

Стоимость случайного чтения страницы

1.1-1.5 для SSD, 4.0 для HDD

seq_page_cost

Стоимость последовательного чтения

1.0 (по умолчанию)

effective_cache_size

Оценка размера кэша ОС

50-75% от RAM

work_mem

Память для сортировок и хэшей

4-64MB в зависимости от нагрузки

shared_buffers

Размер буферов PostgreSQL

25% от RAM

Sort (cost=5000.00..5000.25 rows=100 width=64) Actual Time=5000.0..5000.5 rows=100 loops=1 Sort Key: (sum(o.total)) DESC Sort Method: top-N heapsort Memory: 32kB -> HashAggregate (cost=4500.00..5000.00 rows=1000 width=64) Actual Time=4900.0..4950.0 rows=10000 loops=1 Group Key: u.id -> Hash Join (cost=100.00..4000.00 rows=50000 width=64) Actual Time=1.0..4000.0 rows=50000 loops=1 Hash Cond: (o.user_id = u.id) -> Seq Scan on orders o (cost=0.00..3500.00 rows=50000 width=20) Actual Time=0.5..3500.0 rows=50000 loops=1 Filter: (status = 'completed') -> Hash (cost=80.00..80.00 rows=1000 width=44) Actual Time=0.3..0.3 rows=1000 loops=1 Buckets: 1024 Batches: 1 Memory Usage: 64kB -> Seq Scan on users u (cost=0.00..80.00 rows=1000 width=44) Actual Time=0.1..0.2 rows=1000 loops=1 Filter: (created_at > NOW() - '30 days'::interval)

Limit (cost=100.00..100.25 rows=100 width=64) Actual Time=50.0..50.1 rows=100 loops=1 -> Sort (cost=100.00..100.25 rows=100 width=64) Actual Time=49.0..49.5 rows=100 loops=1 Sort Key: (sum(o.total)) DESC Sort Method: top-N heapsort Memory: 32kB -> HashAggregate (cost=80.00..90.00 rows=1000 width=64) Actual Time=40.0..45.0 rows=1000 loops=1 Group Key: u.id -> Nested Loop (cost=0.50..70.00 rows=5000 width=64) Actual Time=0.5..35.0 rows=5000 loops=1 -> Index Scan using idx_users_created_at on users u (cost=0.29..20.00 rows=1000 width=44) Actual Time=0.2..10.0 rows=1000 loops=1 Index Cond: (created_at > NOW() - '30 days'::interval) -> Index Scan using idx_orders_user_status on orders o (cost=0.21..0.05 rows=5 width=20) Actual Time=0.02..0.02 rows=5 loops=1000 Index Cond: (user_id = u.id AND status = 'completed')