Подходит ли платформа для начинающих без опыта работы?

Да, курсы разбиты по уровням: Junior, Middle, Senior. Начинающие могут стартовать с базовых тем Python, Docker и алгоритмов и постепенно двигаться к более сложным темам.

Как быстро можно подготовиться к собеседованию на позицию Junior разработчика?

При занятиях 1–2 часа в день — от 2 до 4 недель на основные темы. Платформа анализирует слабые места по результатам квизов и строит персональный план подготовки.

Какие технологии охватывает платформа?

Python, FastAPI, Django, Docker, алгоритмы и структуры данных, Agile/Scrum, SQL, CI/CD, системный дизайн, код-ревью и более 50 других тем для разработчиков.

Платформа бесплатная?

Большинство учебных материалов и квизов доступны бесплатно после регистрации. Регистрация занимает менее минуты.

Как платформа помогает найти работу программистом?

Платформа даёт фундаментальные знания, которые проверяют на технических собеседованиях: алгоритмы, архитектура, фреймворки. Мок-интервью имитирует реальное собеседование. Система прогресса показывает, какие темы нужно подтянуть перед собеседованием.

gin_deep_dive

GIN: архитектура и применение

Generalized Inverted Index для полнотекстового поиска, JSONB и массивов.

GIN: архитектура и применение

GIN — это инвертированный индекс для составных значений. Если B-дерево хранит «строка → ключ», то GIN хранит «ключ → список строк».

1. Что такое GIN

GIN (Generalized Inverted Index) — это инвертированный индекс для индексации составных значений, где одна колонка содержит множество элементов.

Типичные сценарии использования

Сценарий	Пример
Массивы	Поиск статей по тегам: `WHERE 'postgresql' = ANY(tags)`
JSONB	Поиск по полям JSON: `WHERE data->>'status' = 'active'`
Полнотекстовый поиск	Поиск документов по словам: `WHERE text @@ to_tsquery('postgres')`
tsvector	Векторизованный текст для полнотекстового поиска

2. Как работает GIN

2.1. Инвертированный индекс

Обычный индекс (B-дерево):

TID → Ключ
(1) → 'hello world'
(2) → 'foo bar'

GIN-индекс:

Ключ → Список TID
'hello' → [1]
'world' → [1]
'foo' → [2]
'bar' → [2]

2.2. Структура GIN

┌─────────────────────────────────────────┐
│              Posting Tree               │
├─────────────────────────────────────────┤
│  Key: 'hello' → [TID1, TID2, TID3]      │
│  Key: 'world' → [TID1, TID5]            │
│  Key: 'foo' → [TID2, TID4]              │
│  Key: 'bar' → [TID2]                    │
└─────────────────────────────────────────┘

Posting list — список TID для каждого ключа.

2.3. Поиск в GIN

SELECT * FROM articles WHERE 'postgresql' = ANY(tags);

Находим ключ 'postgresql' в дереве
Получаем posting list: [TID1, TID5, TID10]
Читаем строки из таблицы по TID

3. GIN для массивов

3.1. Создание таблицы

CREATE TABLE articles (
    id BIGSERIAL PRIMARY KEY,
    title VARCHAR(255),
    tags TEXT[]  -- Массив тегов
);

INSERT INTO articles (title, tags) VALUES
('PostgreSQL Guide', ARRAY['postgresql', 'database', 'sql']),
('Python Tips', ARRAY['python', 'programming']),
('Web Development', ARRAY['html', 'css', 'javascript']),
('Advanced PostgreSQL', ARRAY['postgresql', 'database', 'performance']);

3.2. Создание GIN-индекса

CREATE INDEX idx_articles_tags ON articles USING GIN (tags);

3.3. Запросы с GIN

-- Поиск по одному тегу
SELECT * FROM articles WHERE 'postgresql' = ANY(tags);
-- Или эквивалентно:
SELECT * FROM articles WHERE tags && ARRAY['postgresql'];

-- Поиск по нескольким тегам (пересечение)
SELECT * FROM articles WHERE tags @> ARRAY['postgresql', 'database'];

-- Поиск по любому из тегов (объединение)
SELECT * FROM articles WHERE tags && ARRAY['python', 'postgresql'];

-- Точное совпадение массива
SELECT * FROM articles WHERE tags = ARRAY['postgresql', 'database', 'sql'];

3.4. Операторы для массивов

Оператор	Описание	Пример
`=`	Точное совпадение	`tags = ARRAY['a', 'b']`
`@>`	Содержит	`tags @> ARRAY['postgresql']`
`<@`	Содержится в	`ARRAY['postgresql'] <@ tags`
`&&`	Пересекается	`tags && ARRAY['python', 'sql']`
`ANY()`	Любой элемент	`'postgresql' = ANY(tags)`

4. GIN для JSONB

4.1. Создание таблицы

CREATE TABLE products (
    id BIGSERIAL PRIMARY KEY,
    name VARCHAR(255),
    attributes JSONB
);

INSERT INTO products (name, attributes) VALUES
('Laptop', '{"brand": "Apple", "price": 1500, "color": "silver"}'),
('Phone', '{"brand": "Samsung", "price": 800, "color": "black"}'),
('Tablet', '{"brand": "Apple", "price": 600, "color": "silver"}');

4.2. Создание GIN-индекса

CREATE INDEX idx_products_attributes ON products USING GIN (attributes);

4.3. Запросы с JSONB

-- Поиск по ключу и значению
SELECT * FROM products WHERE attributes @> '{"brand": "Apple"}';

-- Поиск по нескольким полям
SELECT * FROM products 
WHERE attributes @> '{"brand": "Apple", "color": "silver"}';

-- Поиск по вложенным полям
SELECT * FROM products 
WHERE attributes->'specs' @> '{"ram": "16GB"}';

-- Поиск по массиву в JSON
SELECT * FROM products 
WHERE attributes->'tags' @> '["wireless", "bluetooth"]';

4.4. Операторы для JSONB

Оператор	Описание	Пример
`@>`	Содержит	`jsonb @> '{"key": "value"}'`
`<@`	Содержится в	`'{"key": "value"}' <@ jsonb`
`?`	Имеет ключ	`jsonb ? 'key'`
`?	`	Имеет любой ключ
`?&`	Имеет все ключи	`jsonb ?& ARRAY['key1', 'key2']`

5. GIN для полнотекстового поиска

5.1. Создание таблицы

CREATE TABLE documents (
    id BIGSERIAL PRIMARY KEY,
    title VARCHAR(255),
    content TEXT
);

INSERT INTO documents (title, content) VALUES
('PostgreSQL Tutorial', 'Learn PostgreSQL database management'),
('Python Guide', 'Introduction to Python programming'),
('Advanced SQL', 'Advanced SQL queries and optimization');

5.2. Создание GIN-индекса

-- Индекс по tsvector
CREATE INDEX idx_docs_search ON documents 
USING GIN (to_tsvector('english', title || ' ' || content));

5.3. Поиск

-- Поиск по слову
SELECT * FROM documents 
WHERE to_tsvector('english', title || ' ' || content) 
      @@ to_tsquery('english', 'postgresql');

-- Поиск по нескольким словам (И)
SELECT * FROM documents 
WHERE to_tsvector('english', title || ' ' || content) 
      @@ to_tsquery('english', 'database & management');

-- Поиск по нескольким словам (ИЛИ)
SELECT * FROM documents 
WHERE to_tsvector('english', title || ' ' || content) 
      @@ to_tsquery('english', 'python | postgresql');

5.4. Оптимизация с хранимым столбцом

-- Добавить хранимый столбец
ALTER TABLE documents 
ADD COLUMN search_vector tsvector 
GENERATED ALWAYS AS (to_tsvector('english', title || ' ' || content)) STORED;

-- Создать индекс по столбцу
CREATE INDEX idx_docs_search ON documents USING GIN (search_vector);

-- Запрос проще
SELECT * FROM documents WHERE search_vector @@ to_tsquery('english', 'postgresql');

6. Операторские классы GIN

GIN поддерживает разные операторские классы для разных типов данных.

6.1. Для массивов и JSONB

-- По умолчанию
CREATE INDEX idx ON table USING GIN (column);

-- Явно
CREATE INDEX idx ON table USING GIN (column gin_btree_ops);

6.2. Для полнотекстового поиска

CREATE INDEX idx ON table USING GIN (column gin_trgm_ops);

6.3. Trigram для LIKE

-- GIN с триграммами для LIKE и ILIKE
CREATE INDEX idx_users_name ON users USING GIN (name gin_trgm_ops);

-- Запросы
SELECT * FROM users WHERE name LIKE '%john%';
SELECT * FROM users WHERE name ILIKE '%JOHN%';
SELECT * FROM users WHERE name % 'jon';  -- Нечёткое совпадение

7. Производительность GIN

7.1. Сравнение с B-деревом

-- B-дерево НЕ работает для массивов
CREATE INDEX idx_tags_btree ON articles USING BTREE (tags);  -- Ошибка!

-- GIN работает
CREATE INDEX idx_tags_gin ON articles USING GIN (tags);  -- ✅

7.2. Время выполнения

EXPLAIN ANALYZE 
SELECT * FROM articles WHERE tags @> ARRAY['postgresql'];

Без индекса:

Seq Scan on articles
  Filter: (tags @> '{postgresql}'::text[])
  Execution Time: 2.5 ms

С GIN:

Bitmap Heap Scan on articles
  Recheck Cond: (tags @> '{postgresql}'::text[])
  ->  Bitmap Index Scan on idx_tags_gin
        Index Cond: (tags @> '{postgresql}'::text[])
  Execution Time: 0.3 ms

7.3. Размер индекса

GIN-индексы обычно больше B-дерева:

Тип данных	B-дерево	GIN
Массив из 5 элементов	N/A	~3x от данных
JSONB с 10 полями	N/A	~2x от данных
tsvector	N/A	~1.5x от данных

8. Настройка GIN

8.1. fastupdate

-- Включить быстрое обновление (по умолчанию on)
CREATE INDEX idx ON table USING GIN (column) WITH (fastupdate = on);

-- Отключить для стабильной производительности вставки
CREATE INDEX idx ON table USING GIN (column) WITH (fastupdate = off);

fastupdate = on:

Быстрая вставка (буферизация)
Периодическая деградация производительности при сбросе буфера

fastupdate = off:

Стабильная вставка
Медленнее вставка в целом

8.2. gin_pending_list_limit

-- Размер буфера для fastupdate (по умолчанию 4 MB)
SET gin_pending_list_limit = '8MB';

8.3. gin_fuzzy_search_limit

-- Ограничение на количество результатов для нечёткого поиска
SET gin_fuzzy_search_limit = 100;

9. Диагностика GIN

9.1. Размер индекса

SELECT 
    indexname,
    pg_size_pretty(pg_relation_size(indexname::regclass)) as size
FROM pg_indexes
WHERE tablename = 'articles';

9.2. Статистика использования

SELECT 
    indexrelname,
    idx_scan,
    idx_tup_read
FROM pg_stat_user_indexes
WHERE relname = 'articles';

9.3. Детальная статистика GIN

-- Расширение pgstattuple
CREATE EXTENSION IF NOT EXISTS pgstattuple;

SELECT * FROM pgstatginindex('idx_articles_tags');

10. Best practices

✅ Делайте

Используйте GIN для массивов, JSONB, полнотекстового поиска
Создавайте хранимые столбцы для tsvector
Используйте gin_trgm_ops для LIKE с подстрокой
Настраивайте fastupdate для вашей нагрузки
Регулярно выполняйте VACUUM для GIN

❌ Не делайте

Не используйте GIN для точных совпадений (=) — B-дерево лучше
Не используйте GIN для диапазонных запросов
Не игнорируйте размер GIN-индексов
Не забывайте про gin_pending_list_limit при fastupdate
Не создавайте GIN без анализа запросов

11. Практические примеры

11.1. Поиск товаров по фильтрам

CREATE TABLE products (
    id BIGSERIAL PRIMARY KEY,
    name VARCHAR(255),
    filters JSONB  -- {"brand": "Apple", "color": "red", "size": "L"}
);

CREATE INDEX idx_products_filters ON products USING GIN (filters);

-- Поиск по нескольким фильтрам
SELECT * FROM products 
WHERE filters @> '{"brand": "Apple", "color": "red"}';

11.2. Система тегов

CREATE TABLE posts (
    id BIGSERIAL PRIMARY KEY,
    title VARCHAR(255),
    tags TEXT[]
);

CREATE INDEX idx_posts_tags ON posts USING GIN (tags);

-- Поиск постов с определёнными тегами
SELECT * FROM posts WHERE tags @> ARRAY['postgresql'];

-- Поиск постов с любым из тегов
SELECT * FROM posts WHERE tags && ARRAY['postgresql', 'python'];

11.3. Полнотекстовый поиск

CREATE TABLE articles (
    id BIGSERIAL PRIMARY KEY,
    title VARCHAR(255),
    content TEXT,
    search_vector tsvector 
        GENERATED ALWAYS AS (to_tsvector('russian', title || ' ' || content)) STORED
);

CREATE INDEX idx_articles_search ON articles USING GIN (search_vector);

-- Поиск с ранжированием
SELECT 
    id, 
    title,
    ts_rank(search_vector, query) as rank
FROM articles, to_tsquery('russian', 'база & данных') query
WHERE search_vector @@ query
ORDER BY rank DESC
LIMIT 10;

12. Что дальше?

GiST — для геоданных и диапазонов
SP-GiST — для трие и пространственного разбиения
BRIN — для очень больших таблиц

Ключевые выводы

GIN — инвертированный индекс — «ключ → список строк»
Для массивов, JSONB, полнотекстового поиска — не для скалярных значений
Операторы @>, <@, &&, ? — основные для GIN
fastupdate для быстрой вставки — но следите за размером буфера
gin_trgm_ops для LIKE с подстрокой — альтернатива полнотекстовому поиску

Проверьте свои знания

Вопросы ещё не добавлены

Вопросы для этой подтемы ещё не добавлены.

Далее: GiST: кастомные типы данных

Сценарий

Пример

Массивы

Поиск статей по тегам: WHERE 'postgresql' = ANY(tags)

JSONB

Поиск по полям JSON: WHERE data->>'status' = 'active'

Полнотекстовый поиск

Поиск документов по словам: WHERE text @@ to_tsquery('postgres')

tsvector

Векторизованный текст для полнотекстового поиска

┌─────────────────────────────────────────┐ │ Posting Tree │ ├─────────────────────────────────────────┤ │ Key: 'hello' → [TID1, TID2, TID3] │ │ Key: 'world' → [TID1, TID5] │ │ Key: 'foo' → [TID2, TID4] │ │ Key: 'bar' → [TID2] │ └─────────────────────────────────────────┘

Оператор

Описание

Пример

=

Точное совпадение

tags = ARRAY['a', 'b']

@>

Содержит

tags @> ARRAY['postgresql']

<@

Содержится в

ARRAY['postgresql'] <@ tags

&&

Пересекается

tags && ARRAY['python', 'sql']

ANY()

Любой элемент

'postgresql' = ANY(tags)

Оператор

Описание

Пример

@>

Содержит

jsonb @> '{"key": "value"}'

<@

Содержится в

'{"key": "value"}' <@ jsonb

?

Имеет ключ

jsonb ? 'key'

Имеет любой ключ

?&

Имеет все ключи

jsonb ?& ARRAY['key1', 'key2']

Тип данных

B-дерево

GIN

Массив из 5 элементов

N/A

~3x от данных

JSONB с 10 полями

N/A

~2x от данных

tsvector

N/A

~1.5x от данных