Выгрузка в векторную БД

Обработка APA_ВыгрузкаВВекторнуюБД предназначена для выгрузки данных в векторную базу данных для использования в RAG.

Назначение

RAG (Retrieval-Augmented Generation) позволяет агентам использовать внутренние базы знаний:

  • Документация компании

  • Регламенты и инструкции

  • Базы знаний

  • Справочные данные

Принцип работы RAG

Интерфейс обработки

Реквизиты обработки

Реквизит
Тип
Описание

АдресБД

Строка

URL векторной базы данных

Коллекция

Строка

Имя коллекции в БД

СвойКод

Строка

Код запроса для выбора данных

ОчиститьКоллекцию

Булево

Удалить существующие данные

Выгрузка данных

Шаг 1: Настройка подключения

Укажите адрес векторной БД:

БД
Пример адреса

Chroma

http://localhost:8000

Milvus

http://localhost:19530

Pinecone

https://xxx.pinecone.io

Qdrant

http://localhost:6333

Шаг 2: Выбор коллекции

Укажите имя коллекции:

  • company_docs — документация компании

  • regulations — регламенты

  • faq — часто задаваемые вопросы

Шаг 3: Определение источника данных

Напишите запрос для выбора данных:

Шаг 4: Выгрузка

Нажмите "Выгрузить" и дождитесь завершения.

Примеры запросов

Выгрузка справочника

Выгрузка документов

Выгрузка регистра

Использование в агентах

Создание инструмента RAG

  1. Создайте инструмент "Поиск в базе знаний"

  2. В коде инструмента вызовите модуль APA_RAG:

Пример диалога с RAG

Поддерживаемые векторные БД

База данных
Описание
URL

Chroma

Простая, open-source

chromadb.com

Milvus

Масштабируемая

milvus.io

Pinecone

Облачная

pinecone.io

Qdrant

Высокопроизводительная

qdrant.tech

Weaviate

С AI-интеграциями

weaviate.io

Рекомендации

Подготовка данных

  • Очищайте текст от HTML-тегов и спецсимволов

  • Разбивайте длинные документы на фрагменты

  • Добавляйте метаданные (категория, дата, автор)

Размер фрагментов

Тип документа
Рекомендуемый размер

FAQ

200-500 символов

Инструкции

500-1000 символов

Регламенты

1000-2000 символов

Обновление данных

  • Настройте регулярную выгрузку

  • Используйте инкрементальное обновление

  • Очищайте устаревшие данные

Устранение проблем

Ошибка подключения к БД

  1. Проверьте URL базы данных

  2. Убедитесь, что БД запущена

  3. Проверьте firewall

Медленная выгрузка

  1. Уменьшите объём данных

  2. Оптимизируйте запрос

  3. Увеличьте ресурсы сервера БД

Плохое качество поиска

  1. Улучшите качество текстов

  2. Настройте параметры эмбеддингов

  3. Увеличьте количество возвращаемых результатов

Далее

Экспорт/импорт агентовchevron-right

Last updated