Embedding модели

Embedding модели — ключевой компонент MCP-серверов для семантического поиска. Они преобразуют текст в числовые векторы, позволяя находить похожие по смыслу документы.

Зачем нужны Embedding модели?

MCP-серверы используют технологию RAG (Retrieval-Augmented Generation):

  1. Индексация: Справка, метаданные и код преобразуются в векторы

  2. Поиск: При запросе ищутся наиболее похожие по смыслу документы

  3. Контекст: Найденные документы передаются ИИ как контекст

Качество embedding модели напрямую влияет на качество поиска.

Варианты конфигурации

Вариант
Качество
Скорость
Требования
Рекомендация

LM Studio + Qwen

⭐⭐⭐⭐⭐

⭐⭐⭐⭐⭐

GPU 4+ ГБ

Рекомендуется

CPU режим

⭐⭐⭐

⭐⭐⭐

Только CPU

Без GPU

Какой вариант выбрать?

┌─────────────────────────────────────┐
│  Есть видеокарта NVIDIA с 4+ ГБ?   │
└───────────────┬─────────────────────┘

        ┌───────┴───────┐
        │               │
       Да              Нет
        │               │
        ▼               ▼
┌───────────────┐ ┌────────────────┐
│  LM Studio    │ │   CPU режим    │
│  + Qwen       │ │  (e5-small)    │
└───────────────┘ └────────────────┘

Автоматическое определение размерности

MCP-серверы автоматически определяют размерность векторов при запуске:

  1. При старте тестируется выбранная модель

  2. Определяется размерность embedding

  3. Если размерность изменилась — индекс пересоздаётся автоматически

circle-exclamation

Сравнение моделей

По качеству (для русского языка)

  1. Qwen3-Embedding-8B — максимальное качество

  2. Qwen3-Embedding-4B — отличное качество

  3. multilingual-e5-large — высокое качество

  4. multilingual-e5-base — хорошее качество

  5. multilingual-e5-small — приемлемое качество

По скорости

  1. multilingual-e5-small — самая быстрая

  2. Qwen3-Embedding-4B (GPU) — очень быстрая

  3. multilingual-e5-base — средняя

  4. Qwen3-Embedding-8B (GPU) — быстрая

  5. multilingual-e5-large — медленная

Рекомендуемые конфигурации

Для Production (есть GPU)

LM Studio + Qwen3-Embedding-4B

Для Development (нет GPU)

Встроенная модель e5-base

Минимальные требования

Встроенная модель e5-small

Содержание раздела

circle-exclamation

Last updated