Запрос «дообучите модель под нашу компанию» почти всегда означает другое: бизнесу нужно, чтобы нейросеть отвечала в вашем стиле и знала ваши документы. В девяти случаях из десяти это решается промптами и базой знаний за десятки тысяч рублей, а настоящий fine-tuning российской модели обходится в сотни тысяч и нужен редко. Разберём, из чего складывается цена и за что вы реально платите.

Из чего цена

TL;DR

Цена зависит от того, что вам нужно на самом деле. Стиль и знание ваших документов достигаются промптами и базой знаний за десятки тысяч рублей. Полноценное дообучение весов российской модели стоит сотни тысяч и оправдано лишь при узкой задаче с большим объёмом размеченных данных. Большинство компаний платит за второе, хотя им хватает первого.

В работе с владельцами бизнеса я постоянно слышу одну формулировку: «дообучите нейросеть под нашу компанию». За ней скрываются три разные задачи с разной ценой, и подрядчики этим пользуются. Одни продают дорогой fine-tuning там, где хватило бы настройки за неделю. Другие называют дообучением обычную загрузку документов и берут как за серьёзный проект.

Сначала стоит понять, что именно вы хотите получить. Если речь о том, чтобы модель говорила вашим голосом и держала тон бренда, это решается системным промптом. Если нужно, чтобы она отвечала по вашим регламентам, договорам и базе знаний, это RAG — поиск по документам перед ответом. И только если у вас есть тысячи примеров «вопрос-правильный ответ» в узкой области, имеет смысл трогать сами веса модели.

  • Тон и стиль ответов: системный промпт, десятки тысяч рублей за настройку
  • Знание ваших документов: база знаний на RAG, от десятков до сотен тысяч в зависимости от объёма
  • Узкая повторяющаяся задача с разметкой: дообучение весов, от сотен тысяч рублей плюс инфраструктура
  • Конфиденциальные данные на своём контуре: локальная модель, добавляет стоимость серверов

Три уровня настройки

Полезно разложить варианты по возрастанию цены и сложности. Большинство компаний останавливается на втором уровне и закрывает им весь круг задач: поддержка, документы, типовые ответы клиентам. До третьего уровня доходят единицы, у кого есть и данные, и узкая повторяющаяся задача, где общая модель ошибается слишком часто.

УровеньЧто этоПорядок ценыКогда нужен
ПромптСистемная инструкция: тон, роль, правила ответаДесятки тысяч ₽Стиль и формат ответов
База знаний (RAG)Модель ищет ответ в ваших документах перед ответомОт десятков до сотен тысяч ₽Регламенты, договоры, инструкции
Fine-tuningДообучение весов модели на размеченных примерахОт сотен тысяч ₽ плюс инфраУзкая задача, тысячи примеров

Российские модели вроде GigaChat и YandexGPT дают API для первых двух уровней почти сразу: вы платите за запросы и за хранение базы знаний. Цена держится в рамках десятков тысяч рублей в месяц для одного отдела, точные тарифы сверяйте на сайтах сервисов — они меняются. Доступ к fine-tuning у российских провайдеров ограничен и оформляется отдельным проектом, поэтому именно здесь цена прыгает в сотни тысяч.

// Частая подмена понятий

Когда подрядчик говорит «дообучим под вас» и называет цену в сотни тысяч за две недели, уточните, что именно он трогает: системный промпт, базу знаний или веса модели. Если веса — попросите показать датасет и метрики. Если промпт и базу — это работа за десятки тысяч, и вы переплачиваете в разы.

Скрытые расходы

Цена настройки — лишь часть сметы. Дальше идут расходы, о которых на старте редко говорят, а они растягиваются на месяцы. Главный из них — подготовка данных. Чтобы база знаний работала, документы надо собрать, почистить от устаревших версий и привести к единому виду. Эта работа съедает больше времени, чем сама техническая настройка, и считать её стоит отдельно.

  1. Сбор и чистка документов: убрать дубли, устаревшие регламенты, противоречия между версиями
  2. Настройка и тестирование: прогнать реальные вопросы, сверить ответы с экспертом, поправить промпт
  3. Подписка на модель: плата за запросы к API, растёт с числом пользователей и объёмом текста
  4. Сопровождение: обновление базы при изменении регламентов, иначе модель отвечает по старому
  5. Обучение команды: чтобы сотрудники задавали вопросы правильно и проверяли ответы

Отдельная статья — поддержка во времени. Регламенты компании меняются, выходят новые версии модели, добавляются документы. Без сопровождения база знаний устаревает за пару месяцев, и модель начинает отвечать по отменённым правилам. Заложите эту строку сразу: разовый проект без поддержки превращается в мёртвый инструмент к концу квартала.

● Discovery · 1 час · бесплатно

Опишите, что именно вы хотите получить от нейросети, и я скажу, нужен ли вам fine-tuning вообще или хватит настройки за неделю. Разберём это на бесплатном часовом созвоне.

Прийти на Discovery →

Когда дообучать веса

Настоящее дообучение весов оправдано в узком наборе случаев, и стоит честно признать: большинству компаний оно избыточно. Веса трогают, когда задача предельно узкая, повторяется тысячи раз и общая модель ошибается на ней слишком дорого. Например, классификация специфических обращений по внутренней схеме, которой нигде в обучающих данных модели взяться было неоткуда.

Для такого проекта нужны три вещи разом: тысячи примеров «вход-правильный выход», размеченных вашими экспертами; инженер, который умеет дообучать модель и мерить качество; и инфраструктура для обучения и хранения весов. Любой из трёх пунктов в дефиците сразу поднимает цену и сроки. Если хоть одного нет, дешевле и быстрее обойтись базой знаний с хорошим промптом.

// Простой тест на необходимость

Соберите 50 типовых вопросов и прогоните их через обычную модель с вашими документами в контексте. Если ответы устраивают на 45 из 50 — fine-tuning вам излишен, дорабатывайте промпт и базу. Если модель стабильно валит специфику, которой нет в открытых данных, тогда есть смысл считать дообучение весов.

Как считать бюджет

Разумный порядок — начать с дешёвого уровня и подниматься выше только при доказанной нужде. Возьмите один процесс, настройте промпт и базу знаний на российской модели, прогоните на реальных задачах пару недель. Эти расходы измеряются десятками тысяч рублей, и вы быстро увидите, хватает ли результата или модель упирается в потолок.

Если результат устраивает, вы сэкономили сотни тысяч и месяцы. Если модель стабильно ошибается на узкой специфике, у вас уже есть данные и понимание задачи — и разговор о fine-tuning идёт предметно, с цифрами. Этот путь снизу вверх защищает бюджет лучше любого торга по смете.

  • Шаг 1: промпт и база знаний на GigaChat или YandexGPT — десятки тысяч ₽, две недели проверки
  • Шаг 2: если упёрлись в потолок — считаете объём данных и стоимость разметки
  • Шаг 3: fine-tuning только при наличии данных, инженера и инфраструктуры
  • На каждом шаге закладывайте сопровождение — иначе инструмент устареет

Главная ошибка, которую я вижу у российских компаний, — заказать сразу дорогое дообучение под обещание «нейросеть станет вашим экспертом». В девяти случаях из десяти вы платите за то, что давала бы настройка за неделю. На разборе процессов мы вместе смотрим вашу задачу и считаем, какой уровень закроет её с запасом, а какой будет переплатой.

Частые вопросы

Чем дообучение нейросети отличается от настройки промптом?
Настройка промптом задаёт модели роль, тон и правила ответа — это работа за десятки тысяч рублей. Дообучение меняет сами веса модели на размеченных примерах и стоит сотни тысяч плюс инфраструктура. Большинству компаний хватает промпта и базы знаний, до изменения весов доходят единицы.
Сколько стоит дообучить российскую нейросеть под компанию?
Зависит от уровня. Настройка тона и базы знаний на GigaChat или YandexGPT держится в десятках тысяч рублей. Полноценное дообучение весов начинается от сотен тысяч и требует размеченных данных, инженера и инфраструктуры. Точные тарифы провайдеров сверяйте на их сайтах, они меняются.
Когда стоит дообучать веса модели, а когда хватит базы знаний?
Веса трогают при узкой повторяющейся задаче с тысячами размеченных примеров, где общая модель ошибается дорого. Простой тест: прогоните 50 типовых вопросов через модель с вашими документами. Устраивает 45 из 50 — берите базу знаний, дообучение весов будет переплатой.
Какие скрытые расходы есть кроме настройки модели?
Главный — подготовка данных: сбор и чистка документов съедают больше времени, чем техническая настройка. Дальше идут подписка на API, сопровождение при изменении регламентов и обучение команды. Без сопровождения база знаний устаревает за пару месяцев, и модель отвечает по отменённым правилам.
Подойдёт ли российская модель вместо зарубежной для дообучения?
GigaChat и YandexGPT закрывают первые два уровня — промпт и базу знаний — через API почти сразу. Для конфиденциальных данных это плюс: они работают в российском контуре. Доступ к дообучению весов у российских провайдеров ограничен и оформляется отдельным проектом, отсюда и скачок цены.
С чего начать, чтобы понять реальный бюджет?
Начните снизу: настройте промпт и базу знаний на российской модели для одного процесса и прогоните две недели на реальных задачах. Расходы — десятки тысяч рублей. Если результат устраивает, вы сэкономили сотни тысяч. Если модель упёрлась в потолок, разговор о дообучении пойдёт предметно.