GPT Chat — нейросеть без VPN в Беларуси и России

RAG: как задавать вопросы нейросети по своим документам

RAG (Retrieval-Augmented Generation) — это технология, которая позволяет нейросети отвечать на вопросы по вашим собственным документам: договорам, инструкциям, прайс-листам, базам знаний, статьям. Вы загружаете файлы в коллекцию, а модель при ответе опирается на их содержимое, а не на общие знания из интернета.

Как это работает: документы разбиваются на фрагменты и сохраняются в векторной базе. Когда вы задаёте вопрос, система находит самые релевантные фрагменты и передаёт их модели вместе с вопросом. В результате ответы точные, со ссылкой на ваши данные, и модель значительно реже «выдумывает» факты.

Шаг 1. Создайте коллекцию

Откройте страницу RAG-коллекции и нажмите «Создать». Коллекция — это тематическое хранилище документов: например, «Договоры», «База знаний поддержки» или «Документация продукта». Коллекций может быть несколько — под разные темы.

Шаг 2. Загрузите документы

В коллекцию можно добавлять данные двумя способами:

Файлы
Форматы: .txt, .pdf, .xls, .xlsx, .csv, .docx, .html. Размер — до 50 МБ на документ.
URL веб-страницы
Укажите адрес страницы — сервис сам скачает и проиндексирует её содержимое.

После загрузки документ обрабатывается и индексируется — это может занять некоторое время. Статус каждого документа виден в таблице коллекции.

Шаг 3. Задавайте вопросы в чате

Откройте чат
Перейдите на страницу чата в обычном режиме «Чат».
Выберите коллекцию
В настройках чата есть выпадающий список «Коллекция RAG» — выберите нужную. Рядом с названием модели появится пометка «RAG».
Спрашивайте
Задавайте вопросы как обычно: «Какой срок оплаты по договору с ООО Ромашка?», «Как настроить интеграцию из инструкции?» — модель ответит по содержимому документов.

Шаг 4 (опционально). Подключите Telegram или Slack

Любую коллекцию можно подключить к собственному Telegram-боту или Slack-каналу — кнопки «Telegram» и «Slack» есть в карточке коллекции. После подключения ваш бот будет отвечать на вопросы по документам прямо в мессенджере: удобно для поддержки клиентов или внутренней базы знаний команды.

Для чего применяют RAG

Поддержка клиентов

Загрузите FAQ, инструкции и регламенты — подключите коллекцию к Telegram-боту, и он будет отвечать клиентам по вашей базе знаний 24/7.

Внутренняя база знаний

Онбординг-документы, процессы, политики компании. Новый сотрудник спрашивает в чате вместо того, чтобы дёргать коллег.

Работа с договорами

Загрузите пакет договоров и спрашивайте: сроки, суммы, ответственность сторон — без ручного поиска по страницам.

Документация продукта

Техническая документация и API-справочники: модель отвечает разработчикам и пользователям точно по докам, а не «по памяти».

Как получить точные ответы: лучшие практики

Одна тема — одна коллекция
Не сваливайте договоры, инструкции и маркетинг в одну кучу: чем однороднее коллекция, тем точнее поиск.
Загружайте текстовые документы
PDF со сканами без текстового слоя проиндексировать не получится — нужен документ с выделяемым текстом.
Задавайте конкретные вопросы
«Какой гарантийный срок у модели X?» сработает лучше, чем «расскажи про гарантии».
Обновляйте документы
При изменении исходника удалите старый документ и загрузите новый — иначе модель будет отвечать по устаревшим данным.
Проверяйте критичные ответы
RAG резко снижает «галлюцинации», но для юридически значимых решений сверяйтесь с первоисточником.

Типичные ошибки

Вопросы не по документам
С выбранной коллекцией модель сфокусирована на ваших данных. Для общих вопросов очистите поле «Коллекция RAG».
Ожидание мгновенной индексации
Большие документы обрабатываются не моментально — дождитесь, пока документ появится в коллекции со статусом готовности.
Сканы и картинки вместо текста
Из изображения текст не извлечётся. Конвертируйте сканы через OCR перед загрузкой.

Сколько это стоит

Создание коллекций бесплатно; для загрузки документов нужен положительный баланс. Вопросы с RAG оплачиваются как обычные сообщения в чате — по тарифу выбранной языковой модели. Найденные фрагменты документов добавляются к запросу и увеличивают объём входных токенов, поэтому ответ по документам стоит немного дороже обычного.