Сотрудник тратит полчаса, чтобы найти в папке с договорами нужный пункт: какой срок оплаты у этого клиента, есть ли там штраф за просрочку, до какого числа действует соглашение. Бот для поиска по базе договоров отвечает на такой вопрос за секунды и даёт ссылку на конкретный документ. Под капотом — связка языковой модели и подхода RAG: модель ищет по смыслу и отвечает строго из ваших файлов.

Что это даёт

TL;DR

Бот для поиска по базе договоров — это чат, который отвечает на вопросы по вашим документам своими словами и со ссылкой на источник. Он находит нужный пункт по смыслу, а по точному совпадению слов, и сводит данные из десятка договоров в один ответ. Строят его на связке языковой модели и RAG, чтобы бот отвечал из ваших файлов, а из общих знаний интернета.

В компаниях, где договоров накопились сотни, поиск превращается в боль. Менеджер помнит, что нужное условие где-то есть, открывает папку и листает файлы по одному. Юрист отвлекается на вопрос «а что у нас по этому клиенту со штрафами», хотя ответ лежит в подписанном договоре. Время уходит на механический поиск вместо работы, а часть ответов теряется, потому что человек попросту устал листать.

Бот закрывает именно этот разрыв. Вы спрашиваете обычными словами: «какой срок оплаты в договоре с этим поставщиком» — и получаете ответ с цитатой из документа и ссылкой на файл. Поиск идёт по смыслу: бот понимает, что «штраф за просрочку», «пеня» и «неустойка» — про одно и то же, даже когда в самом договоре стоит третье слово. Обычный текстовый поиск по слову так провалится, а смысловой находит нужное.

Сильная сторона тут в сведении данных из многих документов сразу. Вопрос «у каких клиентов договор заканчивается в этом квартале» бот закрывает одним ответом, пройдя по всей базе. Менеджеру больше нужно открывать каждый файл и сверять даты руками. Бот собирает картину из десятков договоров и подаёт её списком со ссылками на источники.

  • Ответ на вопрос по договору с цитатой и ссылкой на конкретный файл
  • Смысловой поиск: бот понимает синонимы и формулировки, а ищет по точному слову
  • Сведение данных из многих договоров: сроки, штрафы, условия по списку клиентов
  • Быстрый доступ для менеджеров без отвлечения юриста на типовые вопросы

Как он устроен

Под капотом работает связка из двух частей. Сначала система разбивает ваши договоры на куски и переводит их в векторные представления — это позволяет искать по смыслу, а по буквам. Когда приходит вопрос, бот находит самые подходящие куски документов и отдаёт их языковой модели вместе с вопросом. Модель формулирует ответ строго из этих кусков и добавляет ссылку на источник. Этот подход и называют RAG.

  1. Соберите договоры в одно место и приведите к читаемому виду: текст, а сканы-картинки
  2. Система разбивает документы на куски и строит по ним поисковый индекс
  3. Сотрудник задаёт боту вопрос обычными словами в привычном мессенджере
  4. Бот находит подходящие куски договоров и отдаёт их модели вместе с вопросом
  5. Модель формулирует ответ из найденных кусков и прикладывает ссылку на файл
  6. Сотрудник проверяет ответ по ссылке и при спорном пункте открывает оригинал
// Почему важна ссылка на источник

Ответ без ссылки на документ доверять опасно. Правильно построенный бот всегда показывает, из какого договора и какого пункта взят ответ. Сотрудник одним кликом проверяет первоисточник, и спорный случай решается за секунды. Ссылка на источник — это и есть встроенный контроль качества ответа.

Чем строить

Объём базы определяет сложность решения. Для пары десятков договоров иногда хватает загрузки файлов прямо в чат с сильной моделью — она отвечает по вложенным документам без отдельной системы. Когда договоров сотни и ими пользуется команда, нужен полноценный RAG-бот с индексом и доступом из мессенджера. Браться за тяжёлую систему ради тридцати файлов — пустая трата бюджета.

Объём базыЧем закрытьКогда усложнять
До 30 договоровЗагрузка файлов в чат с сильной модельюКогда документов сотни и поиск идёт ежедневно
Сотни документов, одна командаRAG-бот с индексом и доступом из мессенджераКогда базой пользуются разные отделы с правами
Регулярное пополнениеАвтоматическая загрузка новых договоров в индексКогда договоры добавляются каждый день через n8n
Чувствительные данныеЛокальное решение внутри вашего контураКогда условия сделок выходить за периметр компании

Российский бизнес упирается в два вопроса: доступ к зарубежным моделям и чувствительность данных. Договоры — это коммерческая тайна, и отдавать их во внешний сервис стоит осознанно. Когда данные особенно чувствительны, бота строят на локальном решении, которое работает внутри вашего контура и выпускает документы наружу. Конкретный выбор зависит от объёма базы и требований к данным — это тема разбора процессов.

Стоимость зависит от масштаба. Загрузка десятка договоров в чат укладывается в подписку за десятки долларов в месяц, точную цифру сверьте на сайте сервиса. Полноценный RAG-бот с индексом, доступом из мессенджера и регулярным пополнением — это разработка под заказ, и её стоимость считают под вашу базу. Окупается такой бот тем, что менеджеры и юристы перестают листать папки руками.

Границы инструмента

Модель ошибается уверенно. Даже при поиске по вашим файлам она способна пересказать пункт неточно, склеить условия из двух разных договоров или дать ответ, которого в документе вовсе отсутствовало. Это свойство языковых моделей называют галлюцинациями. RAG снижает риск, потому что модель отвечает из конкретных кусков, а из головы, но обнуляет его. Поэтому ответ по важному условию сверяют с оригиналом.

// Где человек остаётся главным

Решение по сделке, спор с контрагентом, толкование сложного пункта — это зона юриста и менеджера. Бот ускоряет поиск и подаёт ответ со ссылкой, а ответственность за решение по договору держит человек. Бот находит и показывает, решает команда по проверенному первоисточнику.

Полезно сразу договориться, какие вопросы закрывает бот без перепроверки, а какие требуют открыть оригинал. Справочный вопрос вроде срока действия или контактов по договору сотрудник принимает по ответу бота со ссылкой. Спорное условие, основание для штрафа, пункт под судебный спор юрист читает в самом документе. Эта граница защищает компанию от уверенной ошибки модели на важном решении.

  • Справочные вопросы: сроки, контакты, общие условия — принимают по ответу со ссылкой
  • Спорные пункты: штрафы, основания расторжения — читают в оригинале документа
  • Решения по сделке: бот подаёт данные, решение остаётся за юристом и менеджером
  • Чувствительные данные: базу договоров держат через корректный доступ или локально

Главная защита от ошибок — ссылка на источник в каждом ответе и проверка важных пунктов по оригиналу. Когда бот всегда показывает, откуда взял ответ, сотрудник за секунду убеждается в точности и набирает доверие. Полезно держать человека, который при старте просматривает спорные ответы и докручивает базу: убирает дубли договоров, добавляет недостающие документы. Так бот отвечает точнее каждую неделю, а команда работает с ним спокойно.

Куда двигаться

Когда бот по договорам работает и экономит время, базу расширяют: добавляют приложения, дополнительные соглашения, переписку по сделкам. Дальше тот же подход переносят на другие документы компании — регламенты, инструкции, техническую документацию. Так в компании появляется единая точка, где сотрудник спрашивает обычными словами и получает ответ со ссылкой вместо ручного поиска по папкам.

Заодно команда понимает, как устроен поиск по смыслу, и формулирует вопросы боту точнее. Поначалу запросы получаются расплывчатыми, дальше сотрудники привыкают спрашивать конкретно и быстро получают нужное. Этот навык остаётся с компанией: когда выходят новые версии моделей, база и устройство бота сохраняются, а отвечать он начинает ещё точнее.

Сложность здесь в подготовке базы и в настройке так, чтобы бот всегда давал ссылку на источник и склеивал данные из разных договоров. Самый частый провал — компания вываливает в бота кашу из дублей и устаревших файлов, получает путаные ответы и решает, что инструмент бесполезен. На разборе процессов мы смотрим на вашу реальную базу договоров и собираем бота так, чтобы он отвечал по делу и со ссылкой.

● Discovery · 1 час · бесплатно

Расскажите, сколько у вас договоров и какие вопросы по ним задают чаще всего, и я покажу, как собрать бота для поиска по вашей базе. Записаться на бесплатный часовой созвон-разбор можно через раздел с программами.

Прийти на Discovery →

Частые вопросы

Чем бот по договорам отличается от обычного поиска по файлам?
Обычный поиск ищет по точному совпадению слов и проваливается на синонимах. Бот ищет по смыслу: он понимает, что «штраф», «пеня» и «неустойка» про одно и то же, и находит нужный пункт даже при другой формулировке в тексте. Плюс он сводит данные из многих договоров в один ответ со ссылкой.
Откуда бот берёт ответы и можно ли им доверять?
Правильно построенный бот отвечает строго из ваших договоров по технологии RAG и прикладывает ссылку на конкретный файл и пункт. Доверять стоит с проверкой: модель ошибается уверенно, поэтому важные условия сверяют с оригиналом по ссылке. Справочные вопросы принимают по ответу бота.
Безопасно ли загружать договоры компании в такого бота?
Договоры — коммерческая тайна, поэтому базу строят через корректный доступ к модели, а при особо чувствительных данных на локальном решении внутри вашего контура. В этом случае документы выходят за периметр компании. Конкретный выбор зависит от объёма базы и требований к данным.
Сколько договоров нужно, чтобы такой бот имел смысл?
Для пары десятков договоров хватает загрузки файлов прямо в чат с сильной моделью. Полноценный RAG-бот с индексом и доступом из мессенджера оправдан, когда документов сотни и базой пользуется команда. Чем больше база и чаще поиск, тем заметнее отдача от бота.
Где сотрудники задают вопросы боту?
Бота подключают к привычному мессенджеру или к внутреннему чату, чтобы сотрудник спрашивал там, где уже работает. Менеджер пишет вопрос обычными словами и получает ответ со ссылкой на договор, без отдельного интерфейса и обучения. Доступ настраивают по правам отделов.
Может ли бот ошибиться в ответе по договору?
Может. Даже при поиске по вашим файлам модель способна пересказать пункт неточно или склеить условия из двух договоров. RAG снижает риск, потому что ответ идёт из конкретных кусков документа, но обнуляет его. Поэтому каждый ответ снабжают ссылкой, а важные пункты сверяют с оригиналом.