Практический курс по векторному поиску для Python-разработчиков. Вы пройдёте путь от первого эмбеддинга до production-системы с RAG, гибридным поиском и масштабированием. Каждая тема — это рабочая задача с пошаговым решением, примерами кода и разбором типичных ошибок. В конце курса вы создадите поисковик по документации или RAG-бота.
Пишем первый рабочий пример векторного поиска сразу — без глубокой теории. Вы увидите результат за 15 минут и поймёте, зачем всё это нужно.
Учимся генерировать эмбеддинги для текста: выбор модели, пакетная обработка, кэширование. Много кода, минимум теории.
Cosine, Euclidean, Dot Product — разбираем на примерах, какая метрика для какой задачи подходит. Практические тесты и сравнения.
Начинаем работать с FAISS: создание индекса, добавление векторов, поиск. Простые примеры для понимания базовых принципов.
Продвинутые индексы FAISS для больших данных: HNSW для скорости, IVF для экономии памяти. Сохранение, загрузка, метаданные.
Работаем с Chroma — самой простой векторной базой данных. Фильтрация по метаданным, персистентность, клиент-серверный режим.
Qdrant для production-систем: REST API, сложные фильтры, асинхронный клиент, масштабирование. Развёртывание в Docker.
Комбинируем семантический поиск с keyword-поиском. BM25, Reciprocal Rank Fusion, практические примеры улучшения точности.
Создаём RAG-систему: поиск контекста в векторной базе + генерация ответа через LLM. Интеграция с OpenAI GPT.
Кэширование запросов, балансировка нагрузки, логирование метрик, обработка ошибок. Практики для надёжных систем.
Создаём полноценный поисковик по документации с нуля: сбор данных, индексация, поиск, гибридный поиск, деплой.