RAG: как задавать вопросы нейросети по своим документам

RAG (Retrieval-Augmented Generation) — это технология, которая позволяет нейросети отвечать на вопросы по вашим собственным документам: договорам, инструкциям, прайс-листам, базам знаний, статьям. Вы загружаете файлы в коллекцию, а модель при ответе опирается на их содержимое, а не на общие знания из интернета.

Как это работает: документы разбиваются на фрагменты и сохраняются в векторной базе. Когда вы задаёте вопрос, система находит самые релевантные фрагменты и передаёт их модели вместе с вопросом. В результате ответы точные, со ссылкой на ваши данные, и модель значительно реже «выдумывает» факты.

Управление коллекциями — на странице RAG-коллекции. Вход через Telegram — бесплатно и занимает несколько секунд.

Шаг 1. Создайте коллекцию

Откройте страницу RAG-коллекции и нажмите «Создать». Коллекция — это тематическое хранилище документов: например, «Договоры», «База знаний поддержки» или «Документация продукта». Коллекций может быть несколько — под разные темы.

Шаг 2. Загрузите документы

В коллекцию можно добавлять данные двумя способами:

Файлы

Форматы: .txt, .pdf, .xls, .xlsx, .csv, .docx, .html. Размер — до 50 МБ на документ.

URL веб-страницы

Укажите адрес страницы — сервис сам скачает и проиндексирует её содержимое.

После загрузки документ обрабатывается и индексируется — это может занять некоторое время. Статус каждого документа виден в таблице коллекции.

Шаг 3. Задавайте вопросы в чате

Откройте чат

Перейдите на страницу чата в обычном режиме «Чат».

Выберите коллекцию

В настройках чата есть выпадающий список «Коллекция RAG» — выберите нужную. Рядом с названием модели появится пометка «RAG».

Спрашивайте

Задавайте вопросы как обычно: «Какой срок оплаты по договору с ООО Ромашка?», «Как настроить интеграцию из инструкции?» — модель ответит по содержимому документов.

Шаг 4 (опционально). Подключите Telegram или Slack

Любую коллекцию можно подключить к собственному Telegram-боту или Slack-каналу — кнопки «Telegram» и «Slack» есть в карточке коллекции. После подключения ваш бот будет отвечать на вопросы по документам прямо в мессенджере: удобно для поддержки клиентов или внутренней базы знаний команды.

Для чего применяют RAG

Поддержка клиентов

Загрузите FAQ, инструкции и регламенты — подключите коллекцию к Telegram-боту, и он будет отвечать клиентам по вашей базе знаний 24/7.

Внутренняя база знаний

Онбординг-документы, процессы, политики компании. Новый сотрудник спрашивает в чате вместо того, чтобы дёргать коллег.

Работа с договорами

Загрузите пакет договоров и спрашивайте: сроки, суммы, ответственность сторон — без ручного поиска по страницам.

Документация продукта

Техническая документация и API-справочники: модель отвечает разработчикам и пользователям точно по докам, а не «по памяти».

Как получить точные ответы: лучшие практики

Одна тема — одна коллекция

Не сваливайте договоры, инструкции и маркетинг в одну кучу: чем однороднее коллекция, тем точнее поиск.

Загружайте текстовые документы

PDF со сканами без текстового слоя проиндексировать не получится — нужен документ с выделяемым текстом.

Задавайте конкретные вопросы

«Какой гарантийный срок у модели X?» сработает лучше, чем «расскажи про гарантии».

Обновляйте документы

При изменении исходника удалите старый документ и загрузите новый — иначе модель будет отвечать по устаревшим данным.

Проверяйте критичные ответы

RAG резко снижает «галлюцинации», но для юридически значимых решений сверяйтесь с первоисточником.

Типичные ошибки

Вопросы не по документам

С выбранной коллекцией модель сфокусирована на ваших данных. Для общих вопросов очистите поле «Коллекция RAG».

Ожидание мгновенной индексации

Большие документы обрабатываются не моментально — дождитесь, пока документ появится в коллекции со статусом готовности.

Сканы и картинки вместо текста

Из изображения текст не извлечётся. Конвертируйте сканы через OCR перед загрузкой.

Сколько это стоит

Создание коллекций бесплатно; для загрузки документов нужен положительный баланс. Вопросы с RAG оплачиваются как обычные сообщения в чате — по тарифу выбранной языковой модели. Найденные фрагменты документов добавляются к запросу и увеличивают объём входных токенов, поэтому ответ по документам стоит немного дороже обычного.

Совет: совмещайте RAG с ассистентами — задайте роль («Ты — специалист техподдержки, отвечай кратко и по делу») и подключите коллекцию с документацией: получится готовый корпоративный помощник.

Создать первую коллекцию

Читать также: GPT бесплатно Следующая страница гайда: Вайбкодинг