Подходит ли платформа для начинающих без опыта работы?

Да, курсы разбиты по уровням: Junior, Middle, Senior. Начинающие могут стартовать с базовых тем Python, Docker и алгоритмов и постепенно двигаться к более сложным темам.

Как быстро можно подготовиться к собеседованию на позицию Junior разработчика?

При занятиях 1–2 часа в день — от 2 до 4 недель на основные темы. Платформа анализирует слабые места по результатам квизов и строит персональный план подготовки.

Какие технологии охватывает платформа?

Python, FastAPI, Django, Docker, алгоритмы и структуры данных, Agile/Scrum, SQL, CI/CD, системный дизайн, код-ревью и более 50 других тем для разработчиков.

Платформа бесплатная?

Большинство учебных материалов и квизов доступны бесплатно после регистрации. Регистрация занимает менее минуты.

Как платформа помогает найти работу программистом?

Платформа даёт фундаментальные знания, которые проверяют на технических собеседованиях: алгоритмы, архитектура, фреймворки. Мок-интервью имитирует реальное собеседование. Система прогресса показывает, какие темы нужно подтянуть перед собеседованием.

intro

Быстрый старт: векторный поиск за 15 минут

Пишем первый рабочий пример векторного поиска сразу — без глубокой теории. Вы увидите результат за 15 минут и поймёте, зачем всё это нужно.

Быстрый старт: векторный поиск за 15 минут

Пишем первый рабочий векторный поиск сразу — без глубокой теории. Вы увидите результат за 15 минут.

Что вы сделаете в этой теме

За следующие 15 минут вы:

Установите необходимые библиотеки
Создадите эмбеддинги для нескольких документов
Построите простой индекс
Выполните поиск по смыслу (не по ключевым словам!)

Шаг 1: Установка зависимостей

Откройте терминал и установите две библиотеки:

pip install sentence-transformers faiss-cpu

sentence-transformers — создаёт эмбеддинги (векторные представления текста)
faiss-cpu — библиотека для быстрого векторного поиска от Meta

Шаг 2: Первый код — поиск за 5 строк

Создайте файл search.py и вставьте код:

from sentence_transformers import SentenceTransformer
import faiss
import numpy as np

# 1. Документы для поиска
documents = [
    "Python — язык программирования общего назначения",
    "Питон — это змея из семейства удавов",
    "Django — веб-фреймворк на Python для быстрой разработки",
    "Flask — микрофреймворк для создания веб-приложений",
    "FastAPI — современный фреймворк для создания API"
]

# 2. Загружаем модель для эмбеддингов
model = SentenceTransformer('all-MiniLM-L6-v2')

# 3. Создаём эмбеддинги для документов
embeddings = model.encode(documents)
print(f"Форма эмбеддингов: {embeddings.shape}")  # (5, 384)

# 4. Создаём индекс FAISS (косинусное сходство)
dimension = embeddings.shape[1]
index = faiss.IndexFlatIP(dimension)  # Inner Product
faiss.normalize_L2(embeddings)  # Нормализуем для косинусного сходства
index.add(embeddings)

# 5. Поиск по запросу
query = "веб-разработка на Python"
query_embedding = model.encode([query])
faiss.normalize_L2(query_embedding)

distances, indices = index.search(query_embedding, k=2)

print(f"\nЗапрос: {query}")
print(f"Найдено документов: {indices[0]}")
print(f"Сходство: {distances[0]}")
print("\nРезультаты:")
for idx, score in zip(indices[0], distances[0]):
    print(f"  [{score:.3f}] {documents[idx]}")

Запустите:

python search.py

Ожидаемый вывод:

Форма эмбеддингов: (5, 384)

Запрос: веб-разработка на Python
Найдено документов: [2 4]
Сходство: [0.823 0.756]

Результаты:
  [0.823] Django — веб-фреймворк на Python для быстрой разработки
  [0.756] FastAPI — современный фреймворк для создания API

Что произошло?

┌─────────────┐     ┌──────────────┐     ┌─────────────┐     ┌──────────────┐
│  Документы  │ ──→ │   Модель     │ ──→ │    FAISS    │ ──→ │  Результаты  │
│   (текст)   │     │  Embedding   │     │   (индекс)  │     │   поиска     │
└─────────────┘     └──────────────┘     └─────────────┘     └──────────────┘

Документы → 5 текстов для поиска
Модель → превратила тексты в векторы (384 числа каждый)
FAISS → сохранил векторы в индекс для быстрого поиска
Результаты → нашёл 2 наиболее похожих документа

Ключевая идея: семантический поиск

Обратите внимание: в запросе "веб-разработка на Python" нет слова "Django", но система нашла его!

Почему? Потому что модель понимает смысл:

"веб-разработка" ≈ "веб-фреймворк"
"Python" упоминается в обоих документах

Традиционный поиск (по ключевым словам) не нашёл бы Django — там нет слова "веб-разработка". Векторный поиск находит документы по смыслу.

Шаг 3: Добавим вывод исходного запроса

Модифицируем код, чтобы видеть, что именно ищем:

# Добавьте после строки с query:
print(f"Исходный запрос: {query}")
print(f"Эмбеддинг (первые 10 чисел): {query_embedding[0][:10]}")

Вы увидите, что запрос тоже превратился в вектор чисел.

Шаг 4: Поиграйте с запросами

Попробуйте разные запросы в коде:

# Попробуйте эти запросы:
test_queries = [
    "змея удав",           # Найдёт питона
    "фреймворк для API",   # Найдёт FastAPI
    "быстрая веб-разработка",  # Найдёт Django
    "маленький фреймворк", # Найдёт Flask
]

for query in test_queries:
    query_embedding = model.encode([query])
    faiss.normalize_L2(query_embedding)
    distances, indices = index.search(query_embedding, k=1)
    
    print(f"\nЗапрос: {query}")
    print(f"→ {documents[indices[0][0]]}")

Шаг 5: Добавим больше документов

Чем больше документов, тем интереснее поиск. Расширьте список:

documents = [
    "Python — язык программирования общего назначения",
    "Питон — это змея из семейства удавов",
    "Django — веб-фреймворк на Python для быстрой разработки",
    "Flask — микрофреймворк для создания веб-приложений",
    "FastAPI — современный фреймворк для создания API",
    "NumPy — библиотека для научных вычислений",
    "Pandas — инструмент для анализа данных",
    "Matplotlib — библиотека для визуализации данных",
    "Scikit-learn — машинное обучение на Python",
    "TensorFlow — фреймворк для глубокого обучения"
]

# Пересоздайте эмбеддинги и индекс с новыми документами
embeddings = model.encode(documents)
# ... остальной код

Теперь попробуйте запросы:

"анализ данных" → найдёт Pandas
"графики и диаграммы" → найдёт Matplotlib
"нейронные сети" → найдёт TensorFlow

Что если поиск не работает?

Ошибка: `ModuleNotFoundError: No module named 'sentence_transformers'`

Решение:

pip install sentence-transformers

Ошибка: `ModuleNotFoundError: No module named 'faiss'`

Решение:

pip install faiss-cpu

Ошибка: модель долго загружается

Нормально. При первой загрузке модель скачивается (~100 МБ). Последующие запуски будут быстрыми.

Результаты кажутся странными

Возможные причины:

Мало документов — добавьте ещё
Модель не понимает контекст — попробуйте другой запрос
Низкое сходство (< 0.5) — документы действительно не похожи

Эксперимент: сравним с keyword-поиском

Давайте напишем простой поиск по ключевым словам и сравним:

def keyword_search(query, documents, k=2):
    """Поиск по вхождению слов."""
    query_words = set(query.lower().split())
    
    scores = []
    for i, doc in enumerate(documents):
        doc_words = set(doc.lower().split())
        # Количество общих слов
        overlap = len(query_words & doc_words)
        scores.append((i, overlap))
    
    # Сортировка по убыванию
    scores.sort(key=lambda x: x[1], reverse=True)
    return scores[:k]

# Сравнение
query = "веб-фреймворк Python"

print("Keyword поиск:")
for idx, score in keyword_search(query, documents):
    print(f"  [{score}] {documents[idx]}")

print("\nВекторный поиск:")
query_embedding = model.encode([query])
faiss.normalize_L2(query_embedding)
distances, indices = index.search(query_embedding, k=2)
for idx, score in zip(indices[0], distances[0]):
    print(f"  [{score:.3f}] {documents[idx]}")

Вы увидите разницу:

Keyword найдёт только документы со словами "веб", "фреймворк", "Python"
Векторный найдёт документы по смыслу, даже если слов нет

Чеклист: вы поняли основы

Вы установили sentence-transformers и faiss-cpu
Вы запустили код и увидели результаты поиска
Вы попробовали разные запросы
Вы добавили больше документов
Вы сравнили с keyword-поиском

Что дальше

Теперь вы видели, как работает векторный поиск в действии. В следующих темах вы узнаете:

Как работают эмбеддинги — почему семантически близкие тексты имеют близкие векторы
Как выбирать модель — какие модели бывают, чем отличаются
Как строить индекс — для миллионов документов
Как использовать в продакшене — кэширование, масштабирование

Типичные ошибки новичков

1. Сравнение эмбеддингов от разных моделей

# ❌ НЕЛЬЗЯ
model1 = SentenceTransformer('all-MiniLM-L6-v2')
model2 = SentenceTransformer('all-mpnet-base-v2')

emb1 = model1.encode("текст")
emb2 = model2.encode("текст")
# Эти векторы несовместимы!

Правило: Используйте одну модель для всех эмбеддингов в проекте.

2. Забывают нормализовать для косинусного сходства

# ❌ Без нормализации
index = faiss.IndexFlatIP(dimension)
index.add(embeddings)  # Неправильные результаты!

# ✅ С нормализацией
faiss.normalize_L2(embeddings)
index.add(embeddings)

3. Поиск без нормализации запроса

# ❌
query_embedding = model.encode([query])
distances, indices = index.search(query_embedding, k=2)

# ✅
query_embedding = model.encode([query])
faiss.normalize_L2(query_embedding)  # Важно!
distances, indices = index.search(query_embedding, k=2)

Ключевые выводы

Векторный поиск находит документы по смыслу, а не по точным совпадениям слов
Эмбеддинги — векторные представления текста, которые сохраняет семантику
FAISS — быстрая библиотека для векторного поиска
Нормализация важна для косинусного сходства
5 строк кода достаточно для рабочего прототипа

Домашнее задание

Создайте файл my_search.py с 10+ документами на вашу тему (работа, хобби, учёба)
Попробуйте 5+ разных запросов
Запишите, какие результаты вас удивили
Поделитесь с коллегой — объясните, как это работает

Готовы к следующей теме? Открывайте first_embeddings — узнаете, как работают эмбеддинги изнутри!

Проверьте свои знания

Вопросы ещё не добавлены

Вопросы для этой подтемы ещё не добавлены.

Форма эмбеддингов: (5, 384) Запрос: веб-разработка на Python Найдено документов: [2 4] Сходство: [0.823 0.756] Результаты: [0.823] Django — веб-фреймворк на Python для быстрой разработки [0.756] FastAPI — современный фреймворк для создания API

┌─────────────┐ ┌──────────────┐ ┌─────────────┐ ┌──────────────┐ │ Документы │ ──→ │ Модель │ ──→ │ FAISS │ ──→ │ Результаты │ │ (текст) │ │ Embedding │ │ (индекс) │ │ поиска │ └─────────────┘ └──────────────┘ └─────────────┘ └──────────────┘

Быстрый старт: векторный поиск за 15 минут

Быстрый старт: векторный поиск за 15 минут

Что вы сделаете в этой теме

Шаг 1: Установка зависимостей

Шаг 2: Первый код — поиск за 5 строк

Что произошло?

Ключевая идея: семантический поиск

Шаг 3: Добавим вывод исходного запроса

Шаг 4: Поиграйте с запросами

Шаг 5: Добавим больше документов

Что если поиск не работает?

Ошибка: ModuleNotFoundError: No module named 'sentence_transformers'

Ошибка: ModuleNotFoundError: No module named 'faiss'

Ошибка: модель долго загружается

Результаты кажутся странными

Эксперимент: сравним с keyword-поиском

Чеклист: вы поняли основы

Что дальше

Типичные ошибки новичков

1. Сравнение эмбеддингов от разных моделей

2. Забывают нормализовать для косинусного сходства

3. Поиск без нормализации запроса

Ключевые выводы

Домашнее задание

Проверьте свои знания

Быстрый старт: векторный поиск за 15 минут

Быстрый старт: векторный поиск за 15 минут

Что вы сделаете в этой теме

Шаг 1: Установка зависимостей

Шаг 2: Первый код — поиск за 5 строк

Что произошло?

Ключевая идея: семантический поиск

Шаг 3: Добавим вывод исходного запроса

Шаг 4: Поиграйте с запросами

Шаг 5: Добавим больше документов

Что если поиск не работает?

Ошибка: ModuleNotFoundError: No module named 'sentence_transformers'

Ошибка: ModuleNotFoundError: No module named 'faiss'

Ошибка: модель долго загружается

Результаты кажутся странными

Эксперимент: сравним с keyword-поиском

Чеклист: вы поняли основы

Что дальше

Типичные ошибки новичков

1. Сравнение эмбеддингов от разных моделей

2. Забывают нормализовать для косинусного сходства

3. Поиск без нормализации запроса

Ключевые выводы

Домашнее задание

Проверьте свои знания

Ошибка: `ModuleNotFoundError: No module named 'sentence_transformers'`

Ошибка: `ModuleNotFoundError: No module named 'faiss'`

Ошибка: `ModuleNotFoundError: No module named 'sentence_transformers'`

Ошибка: `ModuleNotFoundError: No module named 'faiss'`