Запрос «дообучите модель под нашу компанию» почти всегда означает другое: бизнесу нужно, чтобы нейросеть отвечала в вашем стиле и знала ваши документы. В девяти случаях из десяти это решается промптами и базой знаний за десятки тысяч рублей, а настоящий fine-tuning российской модели обходится в сотни тысяч и нужен редко. Разберём, из чего складывается цена и за что вы реально платите.
Из чего цена
Цена зависит от того, что вам нужно на самом деле. Стиль и знание ваших документов достигаются промптами и базой знаний за десятки тысяч рублей. Полноценное дообучение весов российской модели стоит сотни тысяч и оправдано лишь при узкой задаче с большим объёмом размеченных данных. Большинство компаний платит за второе, хотя им хватает первого.
В работе с владельцами бизнеса я постоянно слышу одну формулировку: «дообучите нейросеть под нашу компанию». За ней скрываются три разные задачи с разной ценой, и подрядчики этим пользуются. Одни продают дорогой fine-tuning там, где хватило бы настройки за неделю. Другие называют дообучением обычную загрузку документов и берут как за серьёзный проект.
Сначала стоит понять, что именно вы хотите получить. Если речь о том, чтобы модель говорила вашим голосом и держала тон бренда, это решается системным промптом. Если нужно, чтобы она отвечала по вашим регламентам, договорам и базе знаний, это RAG — поиск по документам перед ответом. И только если у вас есть тысячи примеров «вопрос-правильный ответ» в узкой области, имеет смысл трогать сами веса модели.
- Тон и стиль ответов: системный промпт, десятки тысяч рублей за настройку
- Знание ваших документов: база знаний на RAG, от десятков до сотен тысяч в зависимости от объёма
- Узкая повторяющаяся задача с разметкой: дообучение весов, от сотен тысяч рублей плюс инфраструктура
- Конфиденциальные данные на своём контуре: локальная модель, добавляет стоимость серверов
Три уровня настройки
Полезно разложить варианты по возрастанию цены и сложности. Большинство компаний останавливается на втором уровне и закрывает им весь круг задач: поддержка, документы, типовые ответы клиентам. До третьего уровня доходят единицы, у кого есть и данные, и узкая повторяющаяся задача, где общая модель ошибается слишком часто.
| Уровень | Что это | Порядок цены | Когда нужен |
|---|---|---|---|
| Промпт | Системная инструкция: тон, роль, правила ответа | Десятки тысяч ₽ | Стиль и формат ответов |
| База знаний (RAG) | Модель ищет ответ в ваших документах перед ответом | От десятков до сотен тысяч ₽ | Регламенты, договоры, инструкции |
| Fine-tuning | Дообучение весов модели на размеченных примерах | От сотен тысяч ₽ плюс инфра | Узкая задача, тысячи примеров |
Российские модели вроде GigaChat и YandexGPT дают API для первых двух уровней почти сразу: вы платите за запросы и за хранение базы знаний. Цена держится в рамках десятков тысяч рублей в месяц для одного отдела, точные тарифы сверяйте на сайтах сервисов — они меняются. Доступ к fine-tuning у российских провайдеров ограничен и оформляется отдельным проектом, поэтому именно здесь цена прыгает в сотни тысяч.
Когда подрядчик говорит «дообучим под вас» и называет цену в сотни тысяч за две недели, уточните, что именно он трогает: системный промпт, базу знаний или веса модели. Если веса — попросите показать датасет и метрики. Если промпт и базу — это работа за десятки тысяч, и вы переплачиваете в разы.
Скрытые расходы
Цена настройки — лишь часть сметы. Дальше идут расходы, о которых на старте редко говорят, а они растягиваются на месяцы. Главный из них — подготовка данных. Чтобы база знаний работала, документы надо собрать, почистить от устаревших версий и привести к единому виду. Эта работа съедает больше времени, чем сама техническая настройка, и считать её стоит отдельно.
- Сбор и чистка документов: убрать дубли, устаревшие регламенты, противоречия между версиями
- Настройка и тестирование: прогнать реальные вопросы, сверить ответы с экспертом, поправить промпт
- Подписка на модель: плата за запросы к API, растёт с числом пользователей и объёмом текста
- Сопровождение: обновление базы при изменении регламентов, иначе модель отвечает по старому
- Обучение команды: чтобы сотрудники задавали вопросы правильно и проверяли ответы
Отдельная статья — поддержка во времени. Регламенты компании меняются, выходят новые версии модели, добавляются документы. Без сопровождения база знаний устаревает за пару месяцев, и модель начинает отвечать по отменённым правилам. Заложите эту строку сразу: разовый проект без поддержки превращается в мёртвый инструмент к концу квартала.
Опишите, что именно вы хотите получить от нейросети, и я скажу, нужен ли вам fine-tuning вообще или хватит настройки за неделю. Разберём это на бесплатном часовом созвоне.
Когда дообучать веса
Настоящее дообучение весов оправдано в узком наборе случаев, и стоит честно признать: большинству компаний оно избыточно. Веса трогают, когда задача предельно узкая, повторяется тысячи раз и общая модель ошибается на ней слишком дорого. Например, классификация специфических обращений по внутренней схеме, которой нигде в обучающих данных модели взяться было неоткуда.
Для такого проекта нужны три вещи разом: тысячи примеров «вход-правильный выход», размеченных вашими экспертами; инженер, который умеет дообучать модель и мерить качество; и инфраструктура для обучения и хранения весов. Любой из трёх пунктов в дефиците сразу поднимает цену и сроки. Если хоть одного нет, дешевле и быстрее обойтись базой знаний с хорошим промптом.
Соберите 50 типовых вопросов и прогоните их через обычную модель с вашими документами в контексте. Если ответы устраивают на 45 из 50 — fine-tuning вам излишен, дорабатывайте промпт и базу. Если модель стабильно валит специфику, которой нет в открытых данных, тогда есть смысл считать дообучение весов.
Как считать бюджет
Разумный порядок — начать с дешёвого уровня и подниматься выше только при доказанной нужде. Возьмите один процесс, настройте промпт и базу знаний на российской модели, прогоните на реальных задачах пару недель. Эти расходы измеряются десятками тысяч рублей, и вы быстро увидите, хватает ли результата или модель упирается в потолок.
Если результат устраивает, вы сэкономили сотни тысяч и месяцы. Если модель стабильно ошибается на узкой специфике, у вас уже есть данные и понимание задачи — и разговор о fine-tuning идёт предметно, с цифрами. Этот путь снизу вверх защищает бюджет лучше любого торга по смете.
- Шаг 1: промпт и база знаний на GigaChat или YandexGPT — десятки тысяч ₽, две недели проверки
- Шаг 2: если упёрлись в потолок — считаете объём данных и стоимость разметки
- Шаг 3: fine-tuning только при наличии данных, инженера и инфраструктуры
- На каждом шаге закладывайте сопровождение — иначе инструмент устареет
Главная ошибка, которую я вижу у российских компаний, — заказать сразу дорогое дообучение под обещание «нейросеть станет вашим экспертом». В девяти случаях из десяти вы платите за то, что давала бы настройка за неделю. На разборе процессов мы вместе смотрим вашу задачу и считаем, какой уровень закроет её с запасом, а какой будет переплатой.