Подходит ли платформа для начинающих без опыта работы?

Да, курсы разбиты по уровням: Junior, Middle, Senior. Начинающие могут стартовать с базовых тем Python, Docker и алгоритмов и постепенно двигаться к более сложным темам.

Как быстро можно подготовиться к собеседованию на позицию Junior разработчика?

При занятиях 1–2 часа в день — от 2 до 4 недель на основные темы. Платформа анализирует слабые места по результатам квизов и строит персональный план подготовки.

Какие технологии охватывает платформа?

Python, FastAPI, Django, Docker, алгоритмы и структуры данных, Agile/Scrum, SQL, CI/CD, системный дизайн, код-ревью и более 50 других тем для разработчиков.

Платформа бесплатная?

Большинство учебных материалов и квизов доступны бесплатно после регистрации. Регистрация занимает менее минуты.

Как платформа помогает найти работу программистом?

Платформа даёт фундаментальные знания, которые проверяют на технических собеседованиях: алгоритмы, архитектура, фреймворки. Мок-интервью имитирует реальное собеседование. Система прогресса показывает, какие темы нужно подтянуть перед собеседованием.

spgist_index

SP-GiST для специализированных структур

Space-Partitioned GiST для деревьев, трие и данных с дискретным разбиением.

SP-GiST для специализированных структур

SP-GiST — это индекс для данных, которые можно разбить на непересекающиеся подпространства. Трие, quad-деревья, kd-деревья — всё это SP-GiST.

1. Что такое SP-GiST

SP-GiST (Space-Partitioned GiST) — это индекс, основанный на разделении пространства данных на непересекающиеся области.

Ключевая идея

В отличие от GiST, где области могут пересекаться (bounding box), в SP-GiST каждое значение принадлежит только одному подпространству.

GiST: области могут пересекаться
┌──────────┐    ┌──────────┐
│  Box 1   │────│  Box 2   │  ← Пересечение!
└──────────┘    └──────────┘

SP-GiST: непересекающиеся области
┌──────┬──────┬──────┐
│ Area 1 │ Area 2 │ Area 3 │  ← Нет пересечений
└──────┴──────┴──────┘

Типичные сценарии использования

Сценарий	Структура	Пример
Префиксный поиск	Трие (prefix tree)	`WHERE text LIKE 'abc%'`
Поиск по IP-адресам	Radix tree	`WHERE inet << '192.168.0.0/16'`
2D-точки	Quad-tree	`WHERE point <@ box`
KD-дерево	k-dimensional tree	Поиск ближайших в многомерном пространстве
Фонетический поиск	Soundex-trie	`WHERE name ~ 'smith'`

2. Как работает SP-GiST

2.1. Структура дерева

                    ┌─────────────┐
                    │    ROOT     │
                    │  (разбиение │
                    │   по первой │
                    │   букве)    │
                    └──────┬──────┘
                           │
         ┌─────────────────┼─────────────────┐
         │                 │                 │
    ┌────▼────┐       ┌────▼────┐       ┌────▼────┐
    │   'A'   │       │   'B'   │       │   'C'   │  ← Узлы первого
    │ (дальше │       │ (дальше │       │ (дальше │    уровня
    │  по 2-й │       │  по 2-й │       │  по 2-й │
    │  букве) │       │  букве) │       │  букве) │
    └────┬────┘       └────┬────┘       └────┬────┘
         │                 │                 │
    ┌────┴────┐       ┌────┴────┐       ┌────┴────┐
    ▼         ▼       ▼         ▼       ▼         ▼
 ┌──────┐ ┌──────┐ ┌──────┐ ┌──────┐ ┌──────┐ ┌──────┐
 │ 'AA' │ │ 'AB' │ │ 'BA' │ │ 'BB' │ │ 'CA' │ │ 'CB' │  ← Узлы второго
 └──────┘ └──────┘ └──────┘ └──────┘ └──────┘ └──────┘    уровня

2.2. Четыре метода SP-GiST

Для поддержки типа данных нужно определить 4 метода:

Метод	Описание
Consistent	Проверяет, удовлетворяет ли элемент условию
Choose	Выбирает поддерево для вставки или разбиения
Picksplit	Разделяет узел на непересекающиеся подпространства
Compress	Сжимает данные (может возвращать NULL для хранения без сжатия)

2.3. Поиск в SP-GiST

SELECT * FROM words WHERE word LIKE 'abc%';

Начинаем с корня
Выбираем ветвь 'a' → 'b' → 'c'
Спускаемся только по одной ветви
В листовых узлах — точная проверка

Преимущество: посещаем только нужные ветви, не пересекающиеся области.

3. SP-GiST для префиксного поиска (Трие)

3.1. Создание таблицы

CREATE TABLE words (
    id BIGSERIAL PRIMARY KEY,
    word VARCHAR(255)
);

INSERT INTO words (word) VALUES
('apple'),
('application'),
('apply'),
('banana'),
('band'),
('bandana');

3.2. Создание SP-GiST-индекса

CREATE INDEX idx_words_word ON words USING SPGIST (word);

3.3. Запросы

-- Префиксный поиск
SELECT * FROM words WHERE word LIKE 'app%';
-- Найдёт: apple, application, apply

-- Префикс с оператором ~
SELECT * FROM words WHERE word ~ '^app';

-- Точное совпадение
SELECT * FROM words WHERE word = 'apple';

-- Начинaется с любого из префиксов
SELECT * FROM words WHERE word <@ ANY(ARRAY['app', 'ban']);

3.4. Производительность

EXPLAIN ANALYZE 
SELECT * FROM words WHERE word LIKE 'app%';

С SP-GiST:

Index Scan using idx_words_word on words
  Index Cond: (word ~>=~ 'app' AND word ~<~ 'apq')
  Execution Time: 0.2 ms

С B-деревом:

Index Scan using idx_words_btree on words
  Index Cond: ((word >= 'app'::text) AND (word < 'apq'::text))
  Execution Time: 0.3 ms

С Seq Scan:

Seq Scan on words
  Filter: (word ~~ 'app%'::text)
  Execution Time: 1.5 ms

4. SP-GiST для IP-адресов

4.1. Создание таблицы

CREATE TABLE ip_addresses (
    id BIGSERIAL PRIMARY KEY,
    ip INET
);

INSERT INTO ip_addresses (ip) VALUES
('192.168.1.1'),
('192.168.1.100'),
('10.0.0.1'),
('172.16.0.1');

4.2. Создание SP-GiST-индекса

CREATE INDEX idx_ips_ip ON ip_addresses USING SPGIST (ip);

4.3. Запросы

-- Поиск по подсети (<< — содержится в)
SELECT * FROM ip_addresses 
WHERE ip << '192.168.0.0/16'::inet;

-- Поиск по точному IP
SELECT * FROM ip_addresses WHERE ip = '192.168.1.1';

-- Поиск по диапазону
SELECT * FROM ip_addresses 
WHERE ip >>= '192.168.1.0/24'::inet;  -- Содержит подсеть

4.4. Операторы для INET

Оператор	Описание	Пример
`<<`	Содержится в подсети	`ip << '192.168.0.0/16'`
`>>=`	Содержит подсеть	`'192.168.0.0/16' >>= ip`
`=`	Точное совпадение	`ip = '192.168.1.1'`
`<`, `>`	Сравнение	`ip < '192.168.2.0'`

5. SP-GiST для 2D-точек (Quad-tree)

5.1. Создание таблицы

CREATE TABLE locations (
    id BIGSERIAL PRIMARY KEY,
    point POINT
);

INSERT INTO locations (point) VALUES
('(1, 1)'),
('(1, 2)'),
('(2, 1)'),
('(2, 2)'),
('(10, 10)'),
('(11, 11)');

5.2. Создание SP-GiST-индекса

CREATE INDEX idx_locations_point ON locations USING SPGIST (point);

5.3. Запросы

-- Поиск в прямоугольнике
SELECT * FROM locations 
WHERE point <@ BOX('(0, 0), (3, 3)');

-- Поиск в круге (через расстояние)
SELECT * FROM locations 
WHERE point <-> POINT '(2, 2)' < 2;

-- Ближайшие точки (KNN)
SELECT * FROM locations 
ORDER BY point <-> POINT '(0, 0)'
LIMIT 5;

5.4. Quad-tree в действии

Пространство разбивается на 4 квадранта:

┌──────────────┬──────────────┐
│   Q1 (x<0,   │   Q2 (x>=0,  │
│    y>=0)     │    y>=0)     │
├──────────────┼──────────────┤
│   Q3 (x<0,   │   Q4 (x>=0,  │
│    y<0)      │    y<0)      │
└──────────────┴──────────────┘

Каждый квадрант может быть разбит ещё на 4 и так далее.

6. SP-GiST для KD-дерева

6.1. Многомерные данные

CREATE TABLE products (
    id BIGSERIAL PRIMARY KEY,
    name VARCHAR(255),
    price NUMERIC,
    weight NUMERIC,
    rating NUMERIC
);

-- KD-дерево по трём измерениям
CREATE INDEX idx_products_kd ON products 
USING SPGIST ((price, weight, rating));

6.2. Запросы

-- Поиск в многомерном диапазоне
SELECT * FROM products 
WHERE (price, weight, rating) <@ 
      (100, 5, 4.5)::box3d;

-- Ближайшие соседи в многомерном пространстве
SELECT * FROM products 
ORDER BY (price, weight, rating) <-> (50, 2, 4.0)
LIMIT 10;

7. Производительность SP-GiST

7.1. Сравнение с B-деревом для префиксов

-- Таблица с 1 млн слов
CREATE TABLE big_words (
    id BIGSERIAL,
    word VARCHAR(255)
);

-- Индексы
CREATE INDEX idx_btree ON big_words USING BTREE (word);
CREATE INDEX idx_spgist ON big_words USING SPGIST (word);

-- Префиксный поиск
EXPLAIN ANALYZE 
SELECT * FROM big_words WHERE word LIKE 'test%';

Результаты:

Индекс	Время
SP-GiST	0.5 ms
B-дерево	0.6 ms
Seq Scan	50 ms

Вывод: SP-GiST и B-дерево сопоставимы для префиксов.

7.2. Сравнение для IP-адресов

-- B-дерево НЕ поддерживает оператор <<
CREATE INDEX idx_btree ON ip_addresses USING BTREE (ip);

-- Запрос с << не использует B-дерево
SELECT * FROM ip_addresses WHERE ip << '192.168.0.0/16';
-- Seq Scan!

-- SP-GiST использует индекс
SELECT * FROM ip_addresses WHERE ip << '192.168.0.0/16';
-- Index Scan!

7.3. Размер индекса

Тип данных	SP-GiST размер
text (трие)	~1.5x от данных
inet	~1.2x от данных
point	~2x от данных

8. Ограничения SP-GiST

8.1. Не поддерживает ORDER BY

-- SP-GiST не может использоваться для сортировки
SELECT * FROM words ORDER BY word;  -- Требуется отдельная сортировка

-- B-дерево может:
SELECT * FROM words ORDER BY word;  -- Индекс используется длясортировки

8.2. Не поддерживает диапазонные операторы

-- Для text SP-GiST не поддерживает <, >, BETWEEN
SELECT * FROM words WHERE word BETWEEN 'apple' AND 'banana';
-- B-дерево лучше для диапазонных запросов

8.3. Не поддерживает NULL

-- SP-GiST не индексирует NULL значения
INSERT INTO words (word) VALUES (NULL);  -- Не в индексе

9. Диагностика SP-GiST

9.1. Размер индекса

SELECT 
    indexname,
    pg_size_pretty(pg_relation_size(indexname::regclass)) as size
FROM pg_indexes
WHERE tablename = 'words';

9.2. Статистика использования

SELECT 
    indexrelname,
    idx_scan,
    idx_tup_read
FROM pg_stat_user_indexes
WHERE relname = 'words';

9.3. Детальная статистика

-- Расширение pgstattuple
CREATE EXTENSION IF NOT EXISTS pgstattuple;

-- Для SP-GiST статистика ограничена
SELECT * FROM pgstatindex('idx_words_word');

10. Best practices

✅ Делайте

Используйте SP-GiST для префиксного поиска текста
Используйте SP-GiST для IP-адресов и подсетей
Используйте SP-GiST для 2D/3D точек (quad-tree, kd-tree)
Сравнивайте с B-деревом для префиксных запросов
Проверяйте, что данные можно разбить на непересекающиеся области

❌ Не делайте

Не используйте SP-GiST для диапазонных запросов (<, >, BETWEEN)
Не используйте SP-GiST для сортировки (ORDER BY)
Не используйте SP-GiST для скалярных типов с = — B-дерево или Hash лучше
Не ожидайте поддержку NULL в SP-GiST
Не создавайте SP-GiST без анализа поддерживаемых операторов

11. Практические примеры

11.1. Автодополнение слов

CREATE TABLE dictionary (
    id BIGSERIAL PRIMARY KEY,
    word VARCHAR(255) NOT NULL,
    frequency INTEGER
);

CREATE INDEX idx_dictionary_word ON dictionary USING SPGIST (word);

-- Автодополнение
SELECT word, frequency 
FROM dictionary 
WHERE word LIKE 'прогр%'
ORDER BY frequency DESC
LIMIT 10;

11.2. Фильтрация по IP

CREATE TABLE access_log (
    id BIGSERIAL PRIMARY KEY,
    ip INET NOT NULL,
    accessed_at TIMESTAMP
);

CREATE INDEX idx_access_log_ip ON access_log USING SPGIST (ip);

-- Логи из определённой подсети
SELECT * FROM access_log 
WHERE ip << '192.168.1.0/24'::inet
ORDER BY accessed_at DESC
LIMIT 100;

11.3. Гео-поиск точек

CREATE TABLE taxis (
    id BIGSERIAL PRIMARY KEY,
    location POINT NOT NULL,
    driver_name VARCHAR(255)
);

CREATE INDEX idx_taxis_location ON taxis USING SPGIST (location);

-- Такси в районе
SELECT * FROM taxis 
WHERE location <@ BOX('(0, 0), (5, 5)');

-- Ближайшие такси
SELECT * FROM taxis 
ORDER BY location <-> POINT '(2.5, 2.5)'
LIMIT 5;

12. Сравнение с другими индексами

Характеристика	SP-GiST	GiST	GIN	B-дерево
Префиксный поиск	✅ Отлично	⚠️ Хорошо	❌ Нет	✅ Хорошо
IP-адреса	✅ Отлично	⚠️ Требует расширения	❌ Нет	❌ Нет
2D/3D точки	✅ Хорошо	✅ Отлично	❌ Нет	❌ Нет
Диапазоны	❌ Нет	✅ Отлично	⚠️ Частично	✅ Отлично
Сортировка	❌ Нет	⚠️ Частично	❌ Нет	✅ Отлично
NULL значения	❌ Нет	✅ Да	✅ Да	✅ Да

13. Что дальше?

BRIN — для очень больших таблиц с естественным порядком
GiST — для геоданных и диапазонов
Мониторинг и отладка — диагностика проблем

Ключевые выводы

SP-GiST для непересекающихся областей — трие, quad-tree, kd-tree
Префиксный поиск текста — основная специализация
IP-адреса и подсети — нативная поддержка через inet
Не поддерживает сортировку — используйте B-дерево для ORDER BY
NULL не индексируются — ограничение типа индекса

Проверьте свои знания

Вопросы ещё не добавлены

Вопросы для этой подтемы ещё не добавлены.

Далее: BRIN для TB-таблиц

GiST: области могут пересекаться ┌──────────┐ ┌──────────┐ │ Box 1 │────│ Box 2 │ ← Пересечение! └──────────┘ └──────────┘ SP-GiST: непересекающиеся области ┌──────┬──────┬──────┐ │ Area 1 │ Area 2 │ Area 3 │ ← Нет пересечений └──────┴──────┴──────┘

Сценарий

Структура

Пример

Префиксный поиск

Трие (prefix tree)

WHERE text LIKE 'abc%'

Поиск по IP-адресам

Radix tree

WHERE inet << '192.168.0.0/16'

2D-точки

Quad-tree

WHERE point <@ box

KD-дерево

k-dimensional tree

Поиск ближайших в многомерном пространстве

Фонетический поиск

Soundex-trie

WHERE name ~ 'smith'

┌─────────────┐ │ ROOT │ │ (разбиение │ │ по первой │ │ букве) │ └──────┬──────┘ │ ┌─────────────────┼─────────────────┐ │ │ │ ┌────▼────┐ ┌────▼────┐ ┌────▼────┐ │ 'A' │ │ 'B' │ │ 'C' │ ← Узлы первого │ (дальше │ │ (дальше │ │ (дальше │ уровня │ по 2-й │ │ по 2-й │ │ по 2-й │ │ букве) │ │ букве) │ │ букве) │ └────┬────┘ └────┬────┘ └────┬────┘ │ │ │ ┌────┴────┐ ┌────┴────┐ ┌────┴────┐ ▼ ▼ ▼ ▼ ▼ ▼ ┌──────┐ ┌──────┐ ┌──────┐ ┌──────┐ ┌──────┐ ┌──────┐ │ 'AA' │ │ 'AB' │ │ 'BA' │ │ 'BB' │ │ 'CA' │ │ 'CB' │ ← Узлы второго └──────┘ └──────┘ └──────┘ └──────┘ └──────┘ └──────┘ уровня

Метод

Описание

Consistent

Проверяет, удовлетворяет ли элемент условию

Choose

Выбирает поддерево для вставки или разбиения

Picksplit

Разделяет узел на непересекающиеся подпространства

Compress

Сжимает данные (может возвращать NULL для хранения без сжатия)

Оператор

Описание

Пример

<<

Содержится в подсети

ip << '192.168.0.0/16'

>>=

Содержит подсеть

'192.168.0.0/16' >>= ip

=

Точное совпадение

ip = '192.168.1.1'

<, >

Сравнение

ip < '192.168.2.0'

Пространство разбивается на 4 квадранта: ┌──────────────┬──────────────┐ │ Q1 (x<0, │ Q2 (x>=0, │ │ y>=0) │ y>=0) │ ├──────────────┼──────────────┤ │ Q3 (x<0, │ Q4 (x>=0, │ │ y<0) │ y<0) │ └──────────────┴──────────────┘ Каждый квадрант может быть разбит ещё на 4 и так далее.

Индекс

Время

SP-GiST

0.5 ms

B-дерево

0.6 ms

Seq Scan

50 ms

Тип данных

SP-GiST размер

text (трие)

~1.5x от данных

inet

~1.2x от данных

point

~2x от данных

Характеристика

SP-GiST

GiST

GIN

B-дерево

Префиксный поиск

✅ Отлично

⚠️ Хорошо

❌ Нет

✅ Хорошо

IP-адреса

✅ Отлично

⚠️ Требует расширения

❌ Нет

2D/3D точки

✅ Хорошо

✅ Отлично

❌ Нет

Диапазоны

❌ Нет

✅ Отлично

⚠️ Частично

✅ Отлично

Сортировка

❌ Нет

⚠️ Частично

❌ Нет

✅ Отлично

NULL значения

❌ Нет

✅ Да