Подходит ли платформа для начинающих без опыта работы?

Да, курсы разбиты по уровням: Junior, Middle, Senior. Начинающие могут стартовать с базовых тем Python, Docker и алгоритмов и постепенно двигаться к более сложным темам.

Как быстро можно подготовиться к собеседованию на позицию Junior разработчика?

При занятиях 1–2 часа в день — от 2 до 4 недель на основные темы. Платформа анализирует слабые места по результатам квизов и строит персональный план подготовки.

Какие технологии охватывает платформа?

Python, FastAPI, Django, Docker, алгоритмы и структуры данных, Agile/Scrum, SQL, CI/CD, системный дизайн, код-ревью и более 50 других тем для разработчиков.

Платформа бесплатная?

Большинство учебных материалов и квизов доступны бесплатно после регистрации. Регистрация занимает менее минуты.

Как платформа помогает найти работу программистом?

Платформа даёт фундаментальные знания, которые проверяют на технических собеседованиях: алгоритмы, архитектура, фреймворки. Мок-интервью имитирует реальное собеседование. Система прогресса показывает, какие темы нужно подтянуть перед собеседованием.

index_basics

Основы индексации

Что такое индексы, зачем они нужны и как работают. Типы операций и базовые принципы.

Основы индексации

Индексы — это фундамент производительности баз данных. Понимание того, когда и зачем они нужны, отличает профессионала от новичка.

1. Что такое индекс и зачем он нужен

Индекс — это дополнительная структура данных, которая ускоряет поиск строк в таблице. Представьте книгу без оглавления: чтобы найти нужную главу, придётся листать все страницы подряд. Индекс — это и есть «оглавление» вашей базы данных.

Цена индекса

Индексы не бесплатны:

Преимущество	Недостаток
Ускорение SELECT с WHERE, ORDER BY, JOIN	Замедление INSERT, UPDATE, DELETE
Быстрый поиск по ключу	Дополнительное место на диске
Поддержка уникальности	Накладные расходы на обслуживание

Правило: Создавайте индексы осознанно. Каждый индекс — это компромисс между скоростью чтения и записи.

2. Как работает индекс: базовый пример

Рассмотрим таблицу пользователей:

CREATE TABLE users (
    id SERIAL PRIMARY KEY,
    email VARCHAR(255),
    name VARCHAR(100),
    created_at TIMESTAMP
);

INSERT INTO users (email, name, created_at)
SELECT 
    'user' || i || '@example.com',
    'Name ' || i,
    NOW() - (i || ' days')::INTERVAL
FROM generate_series(1, 1000000) AS i;

Запрос без индекса

EXPLAIN ANALYZE SELECT * FROM users WHERE email = 'user500000@example.com';

Результат:

Seq Scan on users  (cost=0.00..23334.00 rows=1 width=...)
  Filter: (email = 'user500000@example.com'::text)
  Rows Removed by Filter: 999999
  Execution Time: 45.2 ms

Seq Scan (Sequential Scan) означает, что PostgreSQL читает все 1 000 000 строк, чтобы найти одну нужную. Это называется полное сканирование таблицы.

Создаём индекс

CREATE INDEX idx_users_email ON users(email);

Тот же запрос с индексом

EXPLAIN ANALYZE SELECT * FROM users WHERE email = 'user500000@example.com';

Результат:

Index Scan using idx_users_email on users  (cost=0.43..8.45 rows=1 width=...)
  Index Cond: (email = 'user500000@example.com'::text)
  Execution Time: 0.08 ms

Ускорение: в 560 раз! (45.2 мс → 0.08 мс)

3. Типы операций, которые ускоряют индексы

3.1. Поиск по точному значению (=)

SELECT * FROM users WHERE email = 'test@example.com';

3.2. Диапазонные запросы (<, >, BETWEEN)

SELECT * FROM users WHERE created_at > '2026-01-01';
SELECT * FROM users WHERE id BETWEEN 1000 AND 2000;

3.3. Сортировка (ORDER BY)

SELECT * FROM users ORDER BY created_at DESC LIMIT 10;

Индекс по created_at позволяет избежать сортировки — данные уже упорядочены.

3.4. Соединения (JOIN)

SELECT u.*, o.*
FROM users u
JOIN orders o ON u.id = o.user_id
WHERE u.email = 'test@example.com';

Индексы по users.email и orders.user_id критически важны для производительности JOIN.

3.5. Агрегация (GROUP BY, MIN, MAX)

SELECT DATE(created_at), COUNT(*) 
FROM users 
GROUP BY DATE(created_at);

4. Типы сканирования в PostgreSQL

PostgreSQL использует три основных типа сканирования:

4.1. Sequential Scan (Seq Scan)

Полное сканирование таблицы. Чтение всех строк последовательно.

Когда используется:

Таблица маленькая (дешевле прочитать всё, чем ходить по индексу)
Запрос возвращает большой процент строк (>10-30%)
Нет подходящего индекса

Seq Scan on users
  Filter: (status = 'active')
  Rows Removed by Filter: 750000

4.2. Index Scan

Чтение индекса + чтение строк из таблицы по указателям (TID).

Когда используется:

Высокая селективность запроса (мало подходящих строк)
Есть подходящий индекс

Index Scan using idx_users_email on users
  Index Cond: (email = 'test@example.com')

4.3. Bitmap Scan

Построение битовой карты страниц, затем чтение страниц.

Когда используется:

Несколько индексов могут быть использованы одновременно
Среднее количество подходящих строк (не мало, не много)
Случайные чтения через Index Scan были бы дороги

Bitmap Heap Scan on users
  Recheck Cond: (status = 'active')
  ->  Bitmap Index Scan on idx_users_status
        Index Cond: (status = 'active')

5. Когда индекс НЕ используется

5.1. Функции на колонке

-- ❌ Индекс не сработает
SELECT * FROM users WHERE LOWER(email) = 'test@example.com';

-- ✅ Создайте индекс по выражению
CREATE INDEX idx_lower_email ON users(LOWER(email));

5.2. Неправильный тип данных (неявное приведение)

-- ❌ Индекс может не сработать
SELECT * FROM users WHERE phone = 89001234567;  -- phone — VARCHAR

-- ✅ Явное приведение
SELECT * FROM users WHERE phone = '89001234567';

5.3. LIKE с подстановочным знаком в начале

-- ❌ Индекс не сработает
SELECT * FROM users WHERE email LIKE '%@gmail.com';

-- ✅ Сработает с префиксом
SELECT * FROM users WHERE email LIKE 'test@%';

-- ✅ Используйте GIN для поиска по подстроке
CREATE INDEX idx_email_gin ON users USING GIN (email gin_trgm_ops);

5.4. Низкая селективность

-- Индекс не поможет, если 50% строк подходят
SELECT * FROM users WHERE gender = 'M';  -- 50% пользователей

Оптимизатор выберет Seq Scan, потому что стоимость случайных чтений по индексу выше стоимости последовательного чтения всей таблицы.

5.5. Нарушение правила левой границы (для составных индексов)

CREATE INDEX idx_name ON users(last_name, first_name);

-- ✅ Сработает
SELECT * FROM users WHERE last_name = 'Ivanov';

-- ❌ Не сработает (или сработает плохо)
SELECT * FROM users WHERE first_name = 'Ivan';

6. Селективность индекса

Селективность — это доля строк, удовлетворяющих условию запроса.

Селективность = (подходящие строки) / (всего строк)

Селективность	Пример	Использовать индекс?
0.0001%	`WHERE id = 1`	✅ Да, обязательно
1%	`WHERE email = '...'`	✅ Да
10%	`WHERE status = 'pending'`	⚠️ Зависит от ситуации
50%	`WHERE gender = 'M'`	❌ Нет, лучше Seq Scan

Эмпирическое правило: Индекс эффективен, когда выбирается менее 5-10% строк таблицы.

7. Просмотр существующих индексов

-- Все индексы таблицы
SELECT indexname, indexdef 
FROM pg_indexes 
WHERE tablename = 'users';

-- Размер индексов
SELECT 
    indexrelname AS index_name,
    pg_size_pretty(pg_relation_size(indexrelid)) AS size
FROM pg_stat_user_indexes
WHERE relname = 'users';

-- Статистика использования индексов
SELECT 
    indexrelname,
    idx_scan AS index_scans,
    idx_tup_read AS tuples_read,
    idx_tup_fetch AS tuples_fetched
FROM pg_stat_user_indexes
WHERE relname = 'users';

8. Best practices для начинающих

✅ Делайте

Создавайте индексы для колонок в WHERE, JOIN, ORDER BY
Используйте EXPLAIN ANALYZE для проверки планов выполнения
Начинайте с B-дерева (индекс по умолчанию)
Удаляйте неиспользуемые индексы

❌ Не делайте

Не индексируйте всё подряд «на всякий случай»
Не создавайте индексы на маленьких таблицах (< 1000 строк)
Не забывайте про стоимость записи
Не игнорируйте составные индексы для частых комбинаций условий

9. Практическое задание

Создайте таблицу orders с полями: id, user_id, status, total, created_at
Вставьте 100 000 тестовых записей
Найдите запросы без индекса через EXPLAIN ANALYZE
Создайте индексы для ускорения:
- Поиск заказов по user_id
- Фильтрация по status
- Сортировка по created_at
Замерьте ускорение

10. Что дальше?

Вы изучили основы. Далее:

B-дерево: глубокое погружение — как устроен индекс внутри
Составные индексы — порядок колонок и правило левой границы
Hash-индексы — когда они быстрее B-дерева

Ключевые выводы

Индекс ускоряет чтение, замедляет запись — создавайте осознанно
Seq Scan ≠ всегда плохо — для больших выборок это эффективно
Селективность решает — индекс полезен, когда выбирается мало строк
EXPLAIN ANALYZE — ваш друг — всегда проверяйте планы выполнения
B-дерево по умолчанию — подходит для 90% случаев

Проверьте свои знания

Вопросы ещё не добавлены

Вопросы для этой подтемы ещё не добавлены.

Далее: B-дерево: глубокое погружение

Преимущество

Недостаток

Ускорение SELECT с WHERE, ORDER BY, JOIN

Замедление INSERT, UPDATE, DELETE

Быстрый поиск по ключу

Дополнительное место на диске

Поддержка уникальности

Накладные расходы на обслуживание

Селективность

Пример

Использовать индекс?

0.0001%

WHERE id = 1

✅ Да, обязательно

WHERE email = '...'

✅ Да

10%

WHERE status = 'pending'

⚠️ Зависит от ситуации

50%

WHERE gender = 'M'

❌ Нет, лучше Seq Scan