Выбор модели

Детальное сравнение вариантов embedding моделей для MCP-серверов.

Сводная таблица

Модель

Размерность

Качество

Скорость

Требования

Офлайн

Qwen3-Embedding-4B (LM Studio)

2560

⭐⭐⭐⭐⭐

GPU 4 ГБ

✅

Qwen3-Embedding-8B (LM Studio)

~4096

⭐⭐⭐⭐⭐

⭐⭐⭐⭐

GPU 8 ГБ

✅

multilingual-e5-large (CPU)

1024

⭐⭐⭐⭐⭐

⭐⭐

4 ГБ RAM

✅

multilingual-e5-base (CPU)

768

⭐⭐⭐⭐

⭐⭐⭐

2 ГБ RAM

✅

multilingual-e5-small (CPU)

384

⭐⭐⭐

⭐⭐⭐⭐⭐

1 ГБ RAM

✅

Для GPU-ускорения рекомендуется использовать LM Studio. Это самый простой способ получить высокую производительность без сложной настройки CUDA в Docker-контейнерах.

Рекомендации по сценариям

Сценарий 1: Есть NVIDIA GPU (4+ ГБ)

Рекомендация: LM Studio + Qwen3-Embedding-4B

OPENAI_API_BASE=http://host.docker.internal:1234/v1
OPENAI_API_KEY=lm-studio
OPENAI_MODEL=Qwen3-Embedding-4B

Плюсы:

Лучшее качество поиска
Быстрая индексация (минуты)
Отличная поддержка русского языка

Сценарий 2: Есть NVIDIA GPU (8+ ГБ)

Рекомендация: LM Studio + Qwen3-Embedding-8B

OPENAI_API_BASE=http://host.docker.internal:1234/v1
OPENAI_API_KEY=lm-studio
OPENAI_MODEL=Qwen3-Embedding-8B

Плюсы:

Максимальное качество
Ещё лучше понимает контекст

Сценарий 3: Нет GPU, но есть время

Рекомендация: CPU + multilingual-e5-base

EMBEDDING_MODEL=intfloat/multilingual-e5-base

Плюсы:

Не требует GPU
Хороший баланс качество/скорость
Полностью офлайн

Сценарий 4: Нет GPU, нужна скорость

Рекомендация: CPU + multilingual-e5-small

EMBEDDING_MODEL=intfloat/multilingual-e5-small

Плюсы:

Самая быстрая на CPU
Минимальные требования
Приемлемое качество

Качество поиска

Что влияет на качество

Размерность вектора — больше = точнее, но медленнее
Обучение модели — Qwen обучен на русском языке
Квантизация — Q8 лучше Q4

Смена модели

При смене embedding модели требуется полная переиндексация всех данных.

Процесс смены модели

Остановите контейнер
Измените переменные окружения
Установите RESET_DATABASE=true
Запустите контейнер
Дождитесь переиндексации
Измените RESET_DATABASE=false для следующих запусков

Пример

# Остановить контейнер
docker stop 1c_help_mcp

# Удалить старый контейнер
docker rm 1c_help_mcp

# Запустить с новой моделью и переиндексацией
docker run -d -p 8003:8003 `
  --name 1c_help_mcp `
  -e LICENSE_KEY=YOUR_LICENSE_KEY `
  -e RESET_DATABASE=true `
  -e OPENAI_API_BASE=http://host.docker.internal:1234/v1 `
  -e OPENAI_API_KEY=lm-studio `
  -e OPENAI_MODEL=Qwen3-Embedding-8B `
  -v "C:/Program Files/1cv8/8.3.23.1997/bin:/1c_docs" `
  -v "E:/bases/mcp_docs:/app/chroma_db" `
  comol/1c_help_mcp:latest

Автоматическое определение размерности

MCP-серверы автоматически:

Тестируют embedding модель при запуске
Определяют размерность вектора
Сравнивают с существующим индексом
Пересоздают индекс если размерность изменилась

Логи при смене модели

INFO - Testing embedding API with model: Qwen3-Embedding-8B
INFO - ✓ Embedding dimension: 4096
INFO - Found existing vector index with dimension: 2560
WARNING - ⚠️ DIMENSION MISMATCH DETECTED!
INFO - 🔄 Rebuilding vector index with correct dimensions...
INFO - ✓ Vector index created successfully!

Итоговые рекомендации

Ваша ситуация

Рекомендуемая модель

GPU 4+ ГБ, хотите лучшее качество

LM Studio + Qwen3-Embedding-4B

GPU 8+ ГБ, нужно максимальное качество

LM Studio + Qwen3-Embedding-8B

Нет GPU, важно качество

CPU + multilingual-e5-base

Нет GPU, важна скорость

CPU + multilingual-e5-small

Для пользователей из России: CPU-модели скачиваются с huggingface.co, который может быть заблокирован. Используйте VPN для первоначального скачивания или выберите LM Studio, где модели скачиваются через встроенный интерфейс приложения.

PreviousCPU режим NextMCP серверы

Last updated 1 month ago

hashtagСводная таблица

hashtagРекомендации по сценариям

hashtagСценарий 1: Есть NVIDIA GPU (4+ ГБ)

hashtagСценарий 2: Есть NVIDIA GPU (8+ ГБ)

hashtagСценарий 3: Нет GPU, но есть время

hashtagСценарий 4: Нет GPU, нужна скорость

hashtagКачество поиска

hashtagЧто влияет на качество

hashtagСмена модели

hashtagПроцесс смены модели

hashtagПример

hashtagАвтоматическое определение размерности

hashtagЛоги при смене модели

hashtagИтоговые рекомендации

Сводная таблица

Рекомендации по сценариям

Сценарий 1: Есть NVIDIA GPU (4+ ГБ)

Сценарий 2: Есть NVIDIA GPU (8+ ГБ)

Сценарий 3: Нет GPU, но есть время

Сценарий 4: Нет GPU, нужна скорость

Качество поиска

Что влияет на качество

Смена модели

Процесс смены модели

Пример

Автоматическое определение размерности

Логи при смене модели

Итоговые рекомендации