Скрытые расходы на внедрение ИИ, о которых молчит стартовая смета
Стартовая смета на внедрение ИИ показывает половину картины, потому что главные деньги всплывают уже после запуска: расход на запросы при росте нагрузки, поддержка, дообучение под изменившиеся данные, интеграции и обучение команды. Самая скользкая строка — расход через цену за токен, которая на тесте выглядит копеечной, хотя на боевой нагрузке превращается в заметный счёт.
Короткий ответ: где прячутся деньги
В работе с фаундерами я часто вижу одну и ту же историю. Человек получает аккуратную смету на запуск, утверждает её и считает, что бюджет на ИИ закрыт, хотя через пару месяцев приходит счёт за расход на запросы, потом отдельная строка за поддержку, затем команда просит время на дообучение связки под новые данные. Все эти деньги существовали изначально, просто стартовый документ показывал лишь точку старта вместо полной траектории проекта.
Спокойный взгляд на бюджет ИИ выглядит иначе. Внедрение делится на разовую часть, которую видно сразу, и продолжающуюся часть, которая живёт месяцами после запуска. Первую легко посчитать, вторую легко прозевать, и именно во второй прячутся суммы, способные испортить фаундеру настроение. Дальше я разложу обе части по полкам, чтобы вы держали их в голове ещё на этапе разговора с подрядчиком.
Шесть статей скрытых расходов
Большинство неприятных сумм укладываются в шесть повторяющихся статей. Я свёл их в таблицу с пометкой, когда статья всплывает и что двигает её вверх, чтобы вы заранее понимали, на что смотреть в договоре с подрядчиком.
| Статья | Когда всплывает | Что двигает вверх |
|---|---|---|
| Расход на запросы (токены) | При росте нагрузки после запуска | Длинные тексты, частые обращения, тяжёлые модели, история диалога в каждом запросе |
| Поддержка и мониторинг | Постоянно, со своим ритмом | Изменения в смежных системах, обновления провайдеров, проверка качества ответов |
| Дообучение под новые данные | Когда данные или процессы меняются | Скорость, с которой устаревают данные, и требование к точности ответов |
| Интеграции, которые вскрылись позже | В первый-второй месяц работы | Закрытые и самописные системы, сценарии, упущенные на старте |
| Обучение команды | Сразу после запуска и дальше | Зрелость людей, текучка, число сотрудников, которые работают со связкой |
| Человек в контуре | Постоянно для ответственных задач | Цена ошибки: расчёты и документы клиентам требуют проверки людьми |
Расход на запросы считается через цену за токен: провайдер берёт плату за объём текста, который вы отправляете и получаете обратно. Сам инференс (работа модели над каждым запросом) стоит тем дороже, чем длиннее текст и чем тяжелее выбранная модель. Часть этого расхода снимает кэширование промптов, когда повторяющаяся часть запроса считается один раз и дальше переиспользуется. Когда вы прикидываете бюджет, считайте расход сразу на боевой объём вместо тестового.
Поддержка и мониторинг — вторая по незаметности статья. Смежные системы живут своей жизнью: поставщик обновляет API, в CRM меняется поле, поток входящих данных слегка смещается, и связка начинает отвечать хуже. Кто-то должен это заметить, разобраться и починить, поэтому поддержка превращается в постоянный ритм со своей ценой. Связка без присмотра деградирует тихо, и фаундер узнаёт о проблеме от недовольных клиентов раньше, чем из отчёта.
Дообучение, интеграции и человек в контуре
Три статьи заслуживают отдельного разбора, потому что фаундеры путают их с разовой настройкой на старте. На деле каждая из них живёт дальше запуска и возвращается счётом снова и снова.
- Дообучение под изменившиеся данные. Связку настраивают под текущее состояние бизнеса, и это состояние меняется: появляются новые продукты, правила, формулировки. Через время ответы начинают отставать от реальности, и связку приходится подстраивать. Иногда хватает обновления подсказок, иногда нужна полноценная процедура дообучения модели под свежие данные.
- Интеграции, которые вскрылись позже. На старте подрядчик связывает очевидные системы, и через месяц вылезает упущенный сценарий: ещё одна база, выгрузка для бухгалтерии, отдельный канал заявок. Каждая такая связка с закрытым или самописным обменом становится мини-проектом со своей ценой.
- Человек в контуре. Для задач с высокой ценой ошибки нужен сотрудник, который проверяет ответы модели прежде, чем они уйдут клиенту. Этот возврат вложений легко переоценить, если забыть про зарплату проверяющего: его время — тоже постоянная строка расхода, пока задача остаётся ответственной.
Дообучение под новые данные люди недооценивают чаще всего, потому что на запуске связка работает отлично и кажется готовой навсегда. Реальность спокойнее: модель училась на снимке вашего бизнеса в один конкретный момент, и чем быстрее меняется этот бизнес, тем быстрее ответы расходятся с происходящим в реальности. Компания с устойчивыми процессами подстраивает связку редко; компания, которая ежемесячно меняет ассортимент и правила, держит дообучение постоянной статьёй бюджета.
Человек в контуре заслуживает отдельной честности, потому что про него молчат охотнее всего. Подрядчику выгоднее показать картину, где связка работает сама и заменяет сотрудников целиком, хотя для ответственных задач это редко правда. Расчёт для клиента, юридический документ, медицинский или финансовый ответ требуют, чтобы живой человек проверял результат перед отправкой. Эта проверка экономит на катастрофах, и держать её в бюджете честнее, чем притворяться, что модель безошибочна.
Стартовая смета отвечает на вопрос «сколько стоит запустить». Скрытые расходы отвечают на вопрос «сколько стоит держать это живым». Считать нужно оба, иначе бюджет порвётся через месяц.
Как ведут себя скрытые расходы по типам задач
Точные суммы тут были бы выдумкой: расход зависит от вашей нагрузки, данных и требований к качеству, и честную цифру даст лишь аудит вашего случая. Зато характер скрытых расходов по типам задач предсказуем. Чем глубже связка вошла в ежедневную работу команды и чем выше цена ошибки, тем тяжелее продолжающаяся часть бюджета.
| Тип задачи | Главная скрытая статья | Поведение расхода |
|---|---|---|
| Помощник для черновиков | Расход на запросы | Растёт вместе с числом обращений, поддержка минимальна |
| Поиск по документам и базе знаний | Дообучение под новые данные | Подстройка каждый раз, когда обновляется база документов |
| Связка с рабочей системой (CRM, почта) | Поддержка и интеграции | Чинится при каждом изменении в смежной системе |
| Сквозная автоматизация через несколько систем | Поддержка и мониторинг | Самая тяжёлая продолжающаяся статья, нужен постоянный присмотр |
| Задачи с высокой ценой ошибки | Человек в контуре | Постоянная зарплата проверяющего поверх расхода на запросы |
Логика простая: дешёвый помощник для черновиков почти весь скрытый бюджет тратит на расход по запросам, и эта строка растёт плавно вместе с использованием. Сквозная автоматизация через несколько систем переносит тяжесть на поддержку, потому что у неё много точек, где смежная система способна сломать связку. А задачи с высокой ценой ошибки добавляют поверх всего зарплату человека, который страхует модель.
Как пройти скрытые расходы осознанно
Скрытые расходы перестают быть скрытыми, как только вы спрашиваете о них вслух до подписания договора. Дальше — порядок шагов, который вытаскивает продолжающуюся часть бюджета на свет ещё на берегу.
- Попросите подрядчика расписать смету на две части: разовый запуск и ежемесячная продолжающаяся часть. Если вторую часть мнутся показывать, это тревожный сигнал.
- Прикиньте расход на запросы сразу на боевой объём: возьмите ожидаемое число обращений в день и умножьте на него цену запроса, оставив тестовые десятки в стороне.
- Заложите поддержку и мониторинг отдельной строкой на несколько месяцев вперёд, потому что связка без присмотра тихо деградирует.
- Спросите, как устроено дообучение, когда у вас меняются данные: кто за это отвечает и как часто это понадобится при вашей скорости изменений.
- Для ответственных задач сразу согласуйте человека в контуре и заложите его время в бюджет, чтобы проверка результата была частью процесса.
- Запланируйте обучение команды как часть проекта: связка без людей, которые ей владеют, превращается в дорогой мёртвый актив.
Лучший способ убрать сюрпризы — начать с узкого пилота на одной задаче. Маленький запуск показывает реальный расход на запросы, реальный объём поддержки и реальную пользу прежде, чем вы вложитесь в большое внедрение. На обучающих программах в нашей практике мы как раз разбираем, как читать смету подрядчика и где в ней спрятана продолжающаяся часть, чтобы фаундер торговался с открытыми глазами.
Частые вопросы
Какие расходы на ИИ всплывают уже после запуска?
Чаще всего это шесть статей: расход на запросы при росте нагрузки, поддержка и мониторинг связки, дообучение под изменившиеся данные, интеграции, которые вскрылись позже, обучение команды и работа человека в контуре для ответственных задач. Стартовая смета покрывает запуск, поэтому эти статьи стоит просить расписать отдельной строкой заранее.
Почему расход на токены растёт после запуска?
На тесте обращений мало, поэтому расход выглядит копеечным. Когда связку подключают к реальному потоку, число обращений вырастает в тысячи, и цена за токен умножается на этот объём. Дополнительно расход двигают длинные тексты, тяжёлые модели и история диалога, которую модель перечитывает в каждом запросе. Считайте бюджет сразу на боевой объём.
Зачем нужно дообучение, если связка уже работает?
Связку настраивают под состояние бизнеса в конкретный момент, и это состояние меняется: появляются новые продукты, правила и формулировки. Со временем ответы начинают отставать от реальности. Иногда хватает обновления подсказок, иногда нужна полноценная процедура дообучения модели под свежие данные. Чем быстрее меняются ваши данные, тем чаще понадобится подстройка.
Что такое человек в контуре и почему за него надо платить?
Это сотрудник, который проверяет ответы модели прежде, чем они уйдут клиенту. Для задач с высокой ценой ошибки — расчётов, юридических и финансовых документов — такая проверка обязательна, потому что одна ошибка обходится дороже зарплаты проверяющего. Его время остаётся постоянной строкой расхода, пока задача ответственная, и честная смета держит эту строку открыто.
Как заранее увидеть скрытые расходы в договоре с подрядчиком?
Попросите расписать смету на две части: разовый запуск и ежемесячная продолжающаяся часть с поддержкой, мониторингом и расходом на запросы. Спросите, кто отвечает за дообучение при изменении данных и как заложен человек в контуре для ответственных задач. Если подрядчик мнётся показывать продолжающуюся часть, это тревожный сигнал.
Можно ли назвать точные цифры скрытых расходов?
Точные суммы зависят от вашей нагрузки, состояния данных и требований к качеству, поэтому честную цифру даст только аудит вашего случая. Тарифы провайдеров тоже меняются — их стоит сверить на сайте провайдера. Предсказать можно характер расхода: какая статья станет главной болью для вашего типа задачи и как она поведёт себя при росте нагрузки.
Разберём вашу ситуацию на Discovery-созвоне
Один час, бесплатно. Покажем, какие задачи в вашем случае отдать ИИ, а какие оставить людям.
Записаться на Discovery →