LM Studio (рекомендуется)

LM Studio — это приложение для локального запуска LLM и embedding моделей с OpenAI-совместимым API.

Почему LM Studio?

Высокое качество — модели Qwen3-Embedding дают отличные результаты для русского языка
GPU ускорение — использует видеокарту для быстрой работы
OpenAI API — совместим с MCP-серверами без изменений
Бесплатно — полностью бесплатное приложение
Локально — все данные остаются на вашем компьютере

Требования

Windows 10/11 (64-bit)
NVIDIA GPU с 4+ ГБ VRAM (для Qwen3-Embedding-4B)
8+ ГБ VRAM (для Qwen3-Embedding-8B)
16+ ГБ RAM

Установка LM Studio

Шаг 1: Скачивание

Перейдите на lmstudio.ai
Скачайте версию для Windows
Установите приложение

Шаг 2: Первый запуск

Запустите LM Studio
Приложение проверит вашу систему
Дождитесь завершения инициализации

Загрузка embedding модели

Шаг 1: Поиск модели

Откройте вкладку Search (или нажмите Ctrl+F)
В поиске введите: Qwen3-Embedding
Найдите модель Qwen/Qwen3-Embedding-4B-GGUF

Шаг 2: Выбор квантизации

Вариант

Размер

VRAM

Качество

Q8_0

~4.5 ГБ

~5 ГБ

Лучшее

Q6_K

~3.5 ГБ

~4 ГБ

Отличное

Q4_K_M

~2.5 ГБ

~3 ГБ

Хорошее

Рекомендуется Q8_0 или Q6_K для лучшего качества embedding.

Шаг 3: Загрузка

Нажмите Download рядом с выбранной квантизацией
Дождитесь завершения загрузки (несколько минут)

Запуск локального сервера

Шаг 1: Загрузка модели

Перейдите на вкладку Local Server (иконка сервера слева)
В выпадающем списке выберите загруженную модель Qwen3-Embedding
Нажмите Load Model

Шаг 2: Запуск сервера

Убедитесь, что модель загружена (статус "Model loaded")
Нажмите Start Server
Сервер запустится на порту 1234

Шаг 3: Проверка

Сервер должен показывать:

Status: Running
Port: 1234
URL: http://localhost:1234

Настройка MCP-серверов

Переменные окружения

Для подключения MCP-серверов к LM Studio используйте:

OPENAI_API_BASE=http://host.docker.internal:1234/v1
OPENAI_API_KEY=lm-studio
OPENAI_MODEL=Qwen3-Embedding-4B

Упрощённая настройка: Если LM Studio запущен локально на порту 1234 (по умолчанию), параметры OPENAI_API_BASE и OPENAI_API_KEY можно не указывать — MCP-серверы подключатся к LM Studio автоматически.

host.docker.internal — специальный адрес для доступа из Docker-контейнера к хост-машине Windows.

Пример команды Docker (упрощённый)

Если LM Studio запущен локально, достаточно указать только модель:

docker run -d -p 8003:8003 `
  --name 1c_help_mcp `
  -e LICENSE_KEY=YOUR_LICENSE_KEY `
  -e RESET_DATABASE=false `
  -e OPENAI_MODEL=Qwen3-Embedding-4B `
  -v "C:/Program Files/1cv8/8.3.23.1997/bin:/1c_docs" `
  -v "E:/bases/mcp_docs:/app/chroma_db" `
  comol/1c_help_mcp:latest

Путь E:/bases/mcp_docs — это пример. Используйте любой удобный путь для хранения индексов.

Пример команды Docker (полный)

Если нужно явно указать параметры подключения к LM Studio:

docker run -d -p 8003:8003 `
  --name 1c_help_mcp `
  -e LICENSE_KEY=YOUR_LICENSE_KEY `
  -e RESET_DATABASE=false `
  -e OPENAI_API_BASE=http://host.docker.internal:1234/v1 `
  -e OPENAI_API_KEY=lm-studio `
  -e OPENAI_MODEL=Qwen3-Embedding-4B `
  -v "C:/Program Files/1cv8/8.3.23.1997/bin:/1c_docs" `
  -v "E:/bases/mcp_docs:/app/chroma_db" `
  comol/1c_help_mcp:latest

Проверка работы

Тест API из PowerShell

# Тест embedding endpoint
$body = @{
    input = "Тестовый текст для embedding"
    model = "Qwen3-Embedding-4B"
} | ConvertTo-Json

Invoke-RestMethod -Uri "http://localhost:1234/v1/embeddings" `
    -Method Post `
    -Headers @{"Content-Type"="application/json"} `
    -Body $body

Проверка из Docker

docker run --rm curlimages/curl:latest `
    curl -s http://host.docker.internal:1234/v1/models

Оптимизация производительности

Настройки LM Studio

GPU Layers: Установите максимум (все слои на GPU)
Context Length: 512 достаточно для embedding
Batch Size: Увеличьте до 32-64 для быстрой индексации

Автозапуск

Создание задачи в планировщике

Откройте Планировщик заданий (Task Scheduler)
Создайте новую задачу
Триггер: При входе в систему
Действие: Запустить LM Studio.exe

LM Studio должен быть запущен до запуска MCP-серверов, иначе индексация завершится с ошибкой.

Устранение проблем

LM Studio не видит GPU

Обновите драйверы NVIDIA
Установите CUDA Toolkit
Перезапустите компьютер

Ошибка "Out of memory"

Используйте модель с меньшей квантизацией (Q4_K_M)
Закройте другие приложения
Уменьшите Context Length

MCP-сервер не подключается

Убедитесь, что LM Studio Server запущен
Проверьте, что порт 1234 не занят
Проверьте URL: http://host.docker.internal:1234/v1

PreviousEmbedding модели NextCPU режим

Last updated 1 month ago

hashtagПочему LM Studio?

hashtagТребования

hashtagУстановка LM Studio

hashtagШаг 1: Скачивание

hashtagШаг 2: Первый запуск

hashtagЗагрузка embedding модели

hashtagШаг 1: Поиск модели

hashtagШаг 2: Выбор квантизации

hashtagШаг 3: Загрузка

hashtagЗапуск локального сервера

hashtagШаг 1: Загрузка модели

hashtagШаг 2: Запуск сервера

hashtagШаг 3: Проверка

hashtagНастройка MCP-серверов

hashtagПеременные окружения

hashtagПример команды Docker (упрощённый)

hashtagПример команды Docker (полный)

hashtagПроверка работы

hashtagТест API из PowerShell

hashtagПроверка из Docker

hashtagОптимизация производительности

hashtagНастройки LM Studio

hashtagРекомендации

hashtagАвтозапуск

hashtagСоздание задачи в планировщике

hashtagУстранение проблем

hashtagLM Studio не видит GPU

hashtagОшибка "Out of memory"

hashtagMCP-сервер не подключается

Почему LM Studio?

Требования

Установка LM Studio

Шаг 1: Скачивание

Шаг 2: Первый запуск

Загрузка embedding модели

Шаг 1: Поиск модели

Шаг 2: Выбор квантизации

Шаг 3: Загрузка

Запуск локального сервера

Шаг 1: Загрузка модели

Шаг 2: Запуск сервера

Шаг 3: Проверка

Настройка MCP-серверов

Переменные окружения

Пример команды Docker (упрощённый)

Пример команды Docker (полный)

Проверка работы

Тест API из PowerShell

Проверка из Docker

Оптимизация производительности

Настройки LM Studio

Рекомендации

Автозапуск

Создание задачи в планировщике

Устранение проблем

LM Studio не видит GPU

Ошибка "Out of memory"

MCP-сервер не подключается