GigaChat — это российская языковая модель от Сбера, и для бизнеса у неё два весомых плюса: оплата в рублях по договору и серверы внутри страны. Владельца волнует конкретика: сколько это стоит, как считается и когда отечественная модель выгоднее зарубежной. Разберём, из чего складывается цена в рублях, чем версии отличаются по деньгам и где GigaChat закрывает задачу дешевле других.

Как считается цена

TL;DR

GigaChat берёт плату за токены — кусочки текста на входе и выходе модели. Чем длиннее запросы и ответы, тем больше токенов и выше счёт. Цена в рублях зависит от версии: лёгкая дешевле, старшая дороже и умнее. Для бизнеса доступен договор с оплатой в рублях и закрывающими документами, что снимает головную боль с зарубежными картами.

Платят в GigaChat за объём работы модели, а за подписку, и считается он в токенах. Токен — это кусочек текста, примерно слог или короткое слово. Запрос и ответ вместе складываются в число токенов, и за это число вы платите. Поэтому короткие чёткие запросы обходятся дешевле длинных простыней: вы платите ровно за то, что прогнали через модель. Удобство такой модели оплаты в том, что счёт растёт строго по реальному использованию: пустой месяц — пустой счёт, без фиксированного платежа за место, которое простаивает.

Для предпринимателя это значит, что счёт зависит от вашего сценария, а от абстрактного тарифа. Бот, который отвечает на короткие вопросы клиентов, стоит копейки за обращение. Разбор длинных документов или генерация больших текстов жрёт токены заметно быстрее. Прежде чем считать бюджет, прикиньте, какие по длине запросы у вас в работе и сколько их в день.

  • Оплата за токены входа и выхода, а за подписку или место
  • Лёгкие версии дешевле за токен, старшие дороже и сообразительнее
  • Договор с оплатой в рублях и закрывающими документами для юрлица
  • Бесплатный лимит на старте, чтобы протестировать без вложений

Версии и цены

GigaChat выходит в нескольких версиях, и они различаются ценой за токен и сообразительностью. Лёгкая модель дешёвая и быстрая, годится для типовых ответов и простой сортировки. Старшая стоит дороже за токен, но лучше держит длинный контекст, аккуратнее с фактами и сложными формулировками. Точные цифры по тарифам сверяйте на сайте сервиса — они меняются.

ВерсияСильная сторонаГде применять
ЛёгкаяДешёвый токен, высокая скоростьТиповые ответы клиентам, сортировка заявок
СтаршаяДлинный контекст, точнее с фактамиРазбор документов, сложные тексты
Под задачи с картинкамиПонимает изображения вместе с текстомРаспознавание сканов и фото документов

Разумный подход — комбинировать версии под шаги процесса. Простую сортировку входящих отдают лёгкой модели, а финальный разбор сложного документа — старшей. Так вы платите дорого только там, где это действительно нужно, а массовый поток гоняете по дешёвому тарифу. Это та же логика, что и с людьми: рутину делает стажёр, ответственное — старший специалист.

// Главная экономия на токенах

Самый частый перерасход — длинный системный промпт, который гоняется с каждым запросом. Вы платите за него снова и снова на каждом обращении клиента. Подрежьте инструкцию до сути, и счёт за месяц упадёт ощутимо без потери качества ответов. Второй приём — обрезать историю диалога до нужного минимума: тащить весь разговор целиком в каждый запрос дорого и чаще всего излишне для типовых ответов.

Оплата в рублях

Главное преимущество GigaChat для российской компании — оплата в рублях по договору. Зарубежные модели упираются в карту, которая блокируется, и в посредников с наценкой. Тут вы заключаете договор с юрлицом, платите рублями со счёта и получаете закрывающие документы для бухгалтерии. Для компании, которой важна белая отчётность, это снимает целый пласт проблем.

  1. Зарегистрируйтесь и протестируйте задачу на бесплатном стартовом лимите
  2. Посчитайте средний размер запроса и ответа в вашем сценарии
  3. Прикиньте число обращений в день и умножьте на размер запроса
  4. Подберите версию: лёгкую на массовый поток, старшую на сложные шаги
  5. Заключите договор на оплату в рублях, если объёмы переросли бесплатный лимит
  6. Следите за счётом первый месяц и режьте лишние токены в промптах

Серверы GigaChat внутри страны — второй довод для тех, кто работает с чувствительными данными. Когда через модель идут персональные данные клиентов или коммерческая тайна, держать обработку на зарубежных серверах рискованно по закону и по здравому смыслу. Отечественное решение тут закрывает вопрос, хотя финальную ответственность за данные всё равно несёте вы. Для компании, которая собирает персональные данные клиентов и обязана хранить их на территории страны, это иногда решающий фактор: даже более умная зарубежная модель отпадает сама собой, и выбор сужается до отечественных вариантов. В этом случае вопрос цены вторичен — первичен сам факт легального хранения.

Когда выгоднее

GigaChat выигрывает в трёх случаях: нужна оплата в рублях по договору, данные чувствительные и должны остаться в стране, тексты целиком на русском. На русскоязычных задачах отечественная модель часто звучит естественнее зарубежной и реже спотыкается на падежах и канцелярите. Для бота поддержки или разбора русских документов это весомый аргумент.

Зарубежная модель берёт верх там, где задача сложная и требует максимальной сообразительности: тонкий анализ, код, длинные цепочки рассуждений. Поэтому выбор редко бывает «или-или». Часто разумнее держать обе: рутину и русские тексты гоняет GigaChat за рубли, сложные разовые задачи — зарубежная модель через корректный доступ. Какая комбинация дешевле именно у вас, зависит от ваших сценариев.

Частый провал — владелец выбирает модель по громкому имени, а под свою задачу. Платит за старшую зарубежную версию там, где хватило бы лёгкого GigaChat за копейки, и удивляется счёту. Начинать стоит с честного описания: какие задачи, на каком языке, насколько чувствительны данные. Из этого описания и вытекает выбор, а из рейтингов и громких имён. Рейтинг измеряет среднюю сообразительность на чужих задачах, а ваш счёт определяет ваш сценарий: язык текстов, длина запросов, требования к данным и поток обращений в день.

● Discovery · 1 час · бесплатно

Опишите свои задачи и данные, и я на бесплатном часовом разборе посчитаю, во сколько обойдётся GigaChat в рублях под ваш сценарий и где зарубежная модель выйдет дешевле или умнее.

Прийти на Discovery →

Границы модели

GigaChat, как любая языковая модель, ошибается уверенно. Он способен выдать факт, которого нет, сослаться на несуществующий пункт договора, придумать цифру. Это свойство называют галлюцинациями, и оно остаётся у всех версий, отечественных и зарубежных одинаково. Поэтому всё, что уходит клиенту или в документ как факт, проходит проверку человеком перед отправкой.

Защита тут стандартная: узкая задача, ответ строго из вашего документа и человек в контуре на чувствительных шагах. Модель готовит черновик, сотрудник правит и отправляет. Так дешёвая отечественная модель работает надёжно и в рамках бюджета, а репутацией за её уверенные выдумки вы платите. Граница ответственности всегда остаётся на вашей команде, а на сервисе. Это стоит проговорить с сотрудниками заранее: модель — инструмент, а сменщик, который отвечает за слова. Тогда экономия на токенах оборачивается реальной выгодой, а скрытыми издержками на разбор жалоб от клиентов, которым модель наобещала лишнего.

Частые вопросы

Как устроена оплата GigaChat в рублях?
GigaChat берёт плату за токены — кусочки текста на входе и выходе модели, а за подписку. Для юрлица доступен договор с оплатой в рублях со счёта и закрывающими документами для бухгалтерии. Это снимает проблему зарубежных карт и посредников с наценкой.
Сколько стоит GigaChat для небольшой компании?
Счёт зависит от вашего сценария, а от тарифа: бот на короткие вопросы клиентов стоит копейки за обращение, разбор длинных документов жрёт токены быстрее. На старте есть бесплатный лимит для теста. Точные цифры по версиям сверяйте на сайте сервиса — они меняются.
Чем версии GigaChat отличаются по цене?
Лёгкая модель дешёвая за токен и быстрая, годится для типовых ответов и сортировки. Старшая дороже, но лучше держит длинный контекст и аккуратнее с фактами. Разумно комбинировать: массовый поток на лёгкой версии, сложные шаги на старшей, чтобы платить дорого только там, где нужно.
Когда GigaChat выгоднее зарубежной модели?
Когда нужна оплата в рублях по договору, данные чувствительные и должны остаться в стране, а тексты целиком на русском. На русскоязычных задачах отечественная модель звучит естественнее и реже спотыкается. Сложные разовые задачи иногда дешевле отдать зарубежной модели — часто держат обе.
Как снизить счёт за GigaChat?
Подрежьте длинный системный промпт до сути: он гоняется с каждым запросом, и вы платите за него на каждом обращении. Отдавайте массовый поток лёгкой версии, а старшую берегите для сложных шагов. Короткие чёткие запросы обходятся дешевле длинных простыней.
Можно ли доверить GigaChat ответы клиентам без проверки?
Только при жёстких рамках. GigaChat ошибается уверенно и выдаёт галлюцинации, как любая модель. Он отвечает строго из вашего документа, а на чувствительных шагах держат человека в контуре: модель готовит черновик, сотрудник правит и отправляет. Финальная ответственность остаётся на вашей команде.