Подходит ли платформа для начинающих без опыта работы?

Да, курсы разбиты по уровням: Junior, Middle, Senior. Начинающие могут стартовать с базовых тем Python, Docker и алгоритмов и постепенно двигаться к более сложным темам.

Как быстро можно подготовиться к собеседованию на позицию Junior разработчика?

При занятиях 1–2 часа в день — от 2 до 4 недель на основные темы. Платформа анализирует слабые места по результатам квизов и строит персональный план подготовки.

Какие технологии охватывает платформа?

Python, FastAPI, Django, Docker, алгоритмы и структуры данных, Agile/Scrum, SQL, CI/CD, системный дизайн, код-ревью и более 50 других тем для разработчиков.

Платформа бесплатная?

Большинство учебных материалов и квизов доступны бесплатно после регистрации. Регистрация занимает менее минуты.

Как платформа помогает найти работу программистом?

Платформа даёт фундаментальные знания, которые проверяют на технических собеседованиях: алгоритмы, архитектура, фреймворки. Мок-интервью имитирует реальное собеседование. Система прогресса показывает, какие темы нужно подтянуть перед собеседованием.

hash_index

Hash-индексы

Hash-индексы для точных совпадений: устройство, ограничения и сценарии применения.

Hash-индексы

Hash-индексы специализированы на точных совпадениях. Они могут быть быстрее B-дерева для операций =, но имеют серьёзные ограничения.

1. Что такое Hash-индекс

Hash-индекс — это тип индекса, который использует хэш-функцию для вычисления позиции ключа. В отличие от B-дерева, он не хранит данные в отсортированном виде.

Ключевая особенность

Hash-индекс поддерживает только одну операцию — точное совпадение (=).

-- ✅ Работает с Hash-индексом
SELECT * FROM users WHERE email = 'test@example.com';

-- ❌ НЕ работает с Hash-индексом
SELECT * FROM users WHERE email > 'test@example.com';  -- Ошибка или Seq Scan
SELECT * FROM users WHERE email LIKE 'test%';          -- Ошибка или Seq Scan

2. Как работает Hash-индекс

2.1. Хэширование ключа

При вставке или поиске:

Вычисляется хэш от ключа: hash_value = hash_function(key)
Хэш определяет номер бакета (bucket)
В бакете ищется точное совпадение

Ключ: 'user@example.com'
         ↓
    hash_function()
         ↓
    0x7A3F2B1C (32 бита)
         ↓
    Bucket #45678
         ↓
    [(hash, TID), (hash, TID), ...]

2.2. Структура Hash-индекса

┌─────────────────────────────────────────┐
│          Metapage (страница 0)          │  ← Метаданные
├─────────────────────────────────────────┤
│          Bucket 0                       │
│          Bucket 1                       │
│          Bucket 2                       │
│          ...                            │
│          Bucket N                       │
└─────────────────────────────────────────┘

Каждый bucket содержит:
┌─────────────────────────┐
│ (hash, TID)             │
│ (hash, TID)             │
│ (hash, TID)             │  ← Коллизии в одном бакете
└─────────────────────────┘

2.3. Обработка коллизий

Коллизия — разные ключи дают одинаковый хэш.

PostgreSQL использует цепочки (chaining):

Все записи с одинаковым хэшем хранятся в одном бакете
При поиске проверяются все записи в бакете

Bucket #123:
┌──────────────────────────────┐
│ hash=0xABCD, TID=(1, 5)      │  ← Ключ 'abc'
│ hash=0xABCD, TID=(3, 2)      │  ← Ключ 'xyz' (коллизия!)
│ hash=0xABCD, TID=(7, 1)      │  ← Ключ '123' (коллизия!)
└──────────────────────────────┘

При поиске проверяются все 3 записи через точное сравнение ключей

3. Создание Hash-индекса

CREATE INDEX idx_users_email ON users USING HASH (email);

Когда использовать

Сценарий	Hash	B-дерево
Только `=`	✅ Быстрее	✅ Хорошо
`>`, `<`, `BETWEEN`	❌ Не поддерживает	✅ Отлично
`ORDER BY`	❌ Не поддерживает	✅ Отлично
`LIKE` с префиксом	❌ Не поддерживает	✅ Хорошо
`IS NULL`	❌ Не поддерживает	✅ Хорошо

4. Производительность: Hash vs B-дерево

4.1. Теоретическая сложность

Операция	Hash-индекс	B-дерево
Поиск (=)	O(1)	O(log n)
Вставка	O(1)	O(log n)
Диапазон	N/A	O(log n + k)

4.2. Практическая разница

В реальности разница часто незаметна:

-- Тест на 1 млн записей
EXPLAIN ANALYZE SELECT * FROM users WHERE email = 'test@example.com';

B-дерево:

Index Scan using idx_users_email on users
  Execution Time: 0.08 ms

Hash-индекс:

Index Scan using idx_users_hash on users
  Execution Time: 0.07 ms

Разница: 0.01 мс — в пределах погрешности.

4.3. Когда Hash быстрее

Hash-индекс может дать преимущество в специфичных случаях:

Очень большие индексы — хэш короче ключа (например, для длинных строк)
Высокая конкуренция — меньше блокировок при вставке
Специфичные workload — миллионы операций = в секунду

Для 99% приложений разница незаметна.

5. Ограничения Hash-индексов

5.1. Только точное совпадение

-- ❌ Эти запросы НЕ используют Hash-индекс
SELECT * FROM users WHERE email > 'test@example.com';
SELECT * FROM users WHERE email BETWEEN 'a' AND 'm';
SELECT * FROM users ORDER BY email;
SELECT * FROM users WHERE email LIKE 'test%';
SELECT DISTINCT email FROM users;  -- Требуется сортировка

5.2. Не поддерживает уникальность

Hash-индекс не может быть уникальным:

-- ❌ Ошибка
CREATE UNIQUE INDEX idx_unique ON users USING HASH (email);
-- ERROR: hash indexes cannot be unique

Если нужна уникальность — используйте B-дерево:

-- ✅ Работает
CREATE UNIQUE INDEX idx_unique ON users (email);

5.3. Исторические проблемы (до PostgreSQL 10)

До версии 10 Hash-индексы не были WAL-логгируемыми:

Не восстанавливались через point-in-time recovery
Не реплицировались на standby
Могли повреждаться при crash

С PostgreSQL 10 эти проблемы решены — Hash-индексы полностью безопасны.

6. Размер Hash-индекса

Hash-индексы обычно меньше B-дерева для тех же данных:

-- Создаём таблицу
CREATE TABLE test_hash (
    id BIGSERIAL,
    email VARCHAR(255)
);

INSERT INTO test_hash (email)
SELECT 'user' || i || '@example.com'
FROM generate_series(1, 1000000) AS i;

-- Индексы
CREATE INDEX idx_btree ON test_hash USING BTREE (email);
CREATE INDEX idx_hash ON test_hash USING HASH (email);

-- Сравниваем размер
SELECT 
    indexname,
    pg_size_pretty(pg_relation_size(indexname::regclass)) as size
FROM pg_indexes
WHERE tablename = 'test_hash';

Результат:

indexname    | size
-------------+--------
idx_btree    | 56 MB
idx_hash     | 42 MB

Почему меньше? Hash хранит 32-битный хэш вместо полного ключа.

7. Мониторинг Hash-индексов

7.1. Проверка использования

SELECT 
    indexrelname,
    idx_scan as scans,
    idx_tup_read as tuples_read
FROM pg_stat_user_indexes
WHERE indexrelname = 'idx_users_hash';

7.2. Обнаружение Hash-индексов

SELECT 
    indexname,
    tablename,
    indexdef
FROM pg_indexes
WHERE indexdef LIKE '%USING hash%';

7.3. Когда Hash-индекс не используется

Оптимизатор проигнорирует Hash-индекс, если:

Запрос не содержит =
Статистика устарела
Селективность низкая (выбирается >10% строк)

-- Принудительное использование (для теста)
SET enable_seqscan = off;
SET enable_indexscan = on;

8. Best practices

✅ Когда использовать Hash-индекс

Только операции = — никаких диапазонных запросов
Длинные ключи — хэш экономит место (например, VARCHAR(500))
Высокая нагрузка на запись — меньше блокировок
Временные таблицы — для быстрых JOIN по =

❌ Когда НЕ использовать

Нужна сортировка — используйте B-дерево
Нужна уникальность — используйте UNIQUE INDEX на B-дереве
Диапазонные запросы — B-дерево
LIKE с префиксом — B-дерево
Не уверены — используйте B-дерево по умолчанию

9. Практический пример

Сценарий: Словарь для JOIN

-- Таблица справочника
CREATE TABLE countries (
    code CHAR(2) PRIMARY KEY,
    name VARCHAR(100)
);

-- Частые JOIN по code
CREATE INDEX idx_countries_code ON countries USING HASH (code);

-- Запрос
SELECT o.*, c.name as country_name
FROM orders o
JOIN countries c ON o.country_code = c.code
WHERE c.code = 'US';

Почему Hash уместен:

Только точное совпадение (=)
Короткий ключ (CHAR(2))
Высокая селективность

Сценарий: Сессии пользователей

CREATE TABLE sessions (
    session_id UUID,
    user_id BIGINT,
    data JSONB
);

-- Поиск сессии по ID
CREATE INDEX idx_sessions_id ON sessions USING HASH (session_id);

-- Запрос
SELECT data FROM sessions WHERE session_id = '...';

10. Альтернативы Hash-индексу

10.1. B-дерево (рекомендуется по умолчанию)

CREATE INDEX idx_email ON users (email);  -- BTREE по умолчанию

Преимущества:

Универсальность (=, <, >, BETWEEN, ORDER BY)
Поддержка уникальности
Предсказуемое поведение

10.2. INCLUDE (для покрывающих индексов)

CREATE INDEX idx_email ON users (email) INCLUDE (name, created_at);

Преимущества:

Index Only Scan без чтения таблицы
Все данные в индексе

11. Тестирование производительности

-- Подготовка
CREATE TABLE perf_test (
    id BIGSERIAL,
    email VARCHAR(255)
);

INSERT INTO perf_test (email)
SELECT 'user' || i || '@example.com'
FROM generate_series(1, 5000000) AS i;

-- Индексы
CREATE INDEX idx_btree ON perf_test USING BTREE (email);
CREATE INDEX idx_hash ON perf_test USING HASH (email);

-- Тест B-дерева
EXPLAIN (ANALYZE, BUFFERS) 
SELECT * FROM perf_test WHERE email = 'user2500000@example.com';

-- Тест Hash
EXPLAIN (ANALYZE, BUFFERS) 
SELECT * FROM perf_test WHERE email = 'user2500000@example.com';

Сравните:

Execution Time
Buffer reads (shared hit)
Cost

12. Что дальше?

Составные индексы — порядок колонок и правило левой границы
Покрывающие индексы — INCLUDE для Index Only Scan
GIN — для массивов и полнотекстового поиска

Ключевые выводы

Hash-индекс только для = — не поддерживает диапазонные запросы
B-дерево универсальнее — в 99% случаев выбирайте его
Hash не может быть уникальным — ограничение типа индекса
Размер меньше B-дерева — хэш короче полного ключа
PostgreSQL 10+ безопасен — WAL-логгирование и репликация работают

Проверьте свои знания

Вопросы ещё не добавлены

Вопросы для этой подтемы ещё не добавлены.

Далее: Составные индексы

┌─────────────────────────────────────────┐ │ Metapage (страница 0) │ ← Метаданные ├─────────────────────────────────────────┤ │ Bucket 0 │ │ Bucket 1 │ │ Bucket 2 │ │ ... │ │ Bucket N │ └─────────────────────────────────────────┘ Каждый bucket содержит: ┌─────────────────────────┐ │ (hash, TID) │ │ (hash, TID) │ │ (hash, TID) │ ← Коллизии в одном бакете └─────────────────────────┘

Bucket #123: ┌──────────────────────────────┐ │ hash=0xABCD, TID=(1, 5) │ ← Ключ 'abc' │ hash=0xABCD, TID=(3, 2) │ ← Ключ 'xyz' (коллизия!) │ hash=0xABCD, TID=(7, 1) │ ← Ключ '123' (коллизия!) └──────────────────────────────┘ При поиске проверяются все 3 записи через точное сравнение ключей

Сценарий

Hash

B-дерево

Только =

✅ Быстрее

✅ Хорошо

>, <, BETWEEN

❌ Не поддерживает

✅ Отлично

ORDER BY

❌ Не поддерживает

✅ Отлично

LIKE с префиксом

❌ Не поддерживает

✅ Хорошо

IS NULL

❌ Не поддерживает

✅ Хорошо

Операция

Hash-индекс

B-дерево

Поиск (=)

O(1)

O(log n)

Вставка

O(1)

O(log n)

Диапазон

N/A

O(log n + k)