Полный курс по созданию Retrieval-Augmented Generation (RAG) систем на Python. Вы узнаете, как построить интеллектуальную систему ответов на вопросы, используя собственные документы. Курс охватывает: векторные представления текста (embeddings), векторные базы данных, стратегии разделения текста, загрузку различных форматов документов, стратегии поиска и retrieval, интеграцию с LLM, создание эффективных промптов, оценку качества и развёртывание в продакшене. Подходит для разработчиков с базовым знанием Python, которые хотят освоить практическое применение LLM и RAG-архитектуры.
Часть уроков закрыта. Разблокируйте курс за 15 000 кредитов, чтобы открыть все материалы.
Что такое RAG, зачем он нужен и как работает архитектура retrieval-augmented generation
Embeddings: как превратить текст в числа, модели для создания эмбеддингов и работа с ними
Обзор векторных баз данных: Chroma, FAISS, Qdrant — хранение и поиск векторов
Chunking: как правильно разбивать документы на фрагменты для эффективного поиска
Чтение PDF, DOCX, TXT, CSV и других форматов документов для RAG-системы
Retrieval: семантический поиск, гибридный поиск, reranking и оптимизация выдачи
Подключение LLM: OpenAI, Anthropic, локальные модели через OpenRouter и Ollama
Prompt engineering для RAG: шаблоны, контекст, инструкции и борьба с галлюцинациями
Метрики оценки: relevance, faithfulness, answer relevancy, RAGAS фреймворк
Развёртывание RAG-системы: API, кэширование, мониторинг, масштабирование и best practices