GigaChat API от Сбера продаётся по токенам: вы платите за объём текста, который модель прочитала и сгенерировала, а за факт подключения. Для компании это означает счёт, который растёт вместе с нагрузкой и легко прогнозируется. Под капотом это российская языковая модель с доступом через корпоративный договор, что снимает часть вопросов с оплатой и хранением данных внутри страны.

Главное о тарифах

TL;DR

GigaChat считает деньги по токенам — кускам текста на входе и выходе модели. Чем длиннее запрос и ответ, тем выше расход. Для компаний доступ оформляется через юридическое лицо, оплата идёт в рублях, а данные остаются в российском контуре. Версии моделей различаются по цене и качеству: лёгкая дешевле и быстрее, старшая дороже и умнее. Бюджет считайте от своих сценариев, а от ценника на сайте.

Когда руководитель спрашивает про тарифы GigaChat, он ждёт прайс-лист. Логика устроена иначе: вы платите за токены. Токен — это кусочек текста, примерно слово или часть слова. Модель берёт деньги и за то, что прочитала в вашем запросе, и за то, что написала в ответе. Длинный документ на входе и развёрнутый ответ на выходе стоят дороже короткой реплики.

Для компании это удобно тем, что счёт прозрачен и масштабируется. Сто обращений сотрудников в день дают предсказуемый расход токенов, который легко умножить на цену и заложить в бюджет. Резких сюрпризов здесь меньше, чем кажется на старте, если вы понимаете, сколько текста проходит через модель.

Точные цены за тысячу токенов и состав пакетов держите на странице GigaChat у Сбера. Тарифы и набор версий меняются, и любая сумма из статьи устареет. Здесь разбираем логику, по которой формируется счёт, чтобы вы прикинули бюджет под свою нагрузку самостоятельно.

Версии и цена

GigaChat выходит в нескольких версиях, и компания выбирает между ними по балансу цены и качества. Лёгкая версия дешевле и быстрее, она годится для массовых типовых задач: классификация заявок, короткие ответы, разметка. Старшая версия дороже и точнее, её берут под сложные тексты, анализ документов и задачи, где ошибка стоит дорого.

ВерсияПод какие задачиЛогика выбора
ЛёгкаяМассовые типовые запросы, классификация, короткие ответыДешевле и быстрее, годится для большого потока простых задач
БазоваяПоддержка клиентов, черновики писем, сводкиБаланс цены и качества для повседневной работы компании
СтаршаяАнализ документов, сложные тексты, ответственные решенияДороже, но точнее там, где ошибка обходится дорого
ЭмбеддингиПоиск по базе знаний, похожие документыОтдельная модель для векторного поиска, тариф считают отдельно

Разумная архитектура смешивает версии. Поток простых обращений отдают лёгкой модели, а сложные случаи маршрутизируют на старшую. Так вы держите среднюю стоимость запроса низкой, теряя качество там, где оно действительно нужно. Это снижает счёт заметно сильнее, чем выбор самого дешёвого тарифа на всё подряд.

Отдельная статья — модель эмбеддингов для поиска по базе знаний. Если вы строите ассистента, который отвечает по вашим документам, каждый документ один раз превращается в вектор, а каждый запрос пользователя — в ещё один вектор для поиска похожих кусков. Это дешёвая операция по сравнению с генерацией ответа, но при большой базе она набегает. Закладывайте её в бюджет отдельной строкой, чтобы счёт за поиск стал сюрпризом на фоне основного расхода.

// Где прячется расход

Длинный системный промпт, который вы подставляете в каждый запрос, оплачивается каждый раз заново. Сократите постоянный контекст до нужного минимума — и расход токенов на массовых задачах упадёт без потери качества ответов.

Как подключиться

Для компании доступ к GigaChat API оформляется через юридическое лицо в экосистеме Сбера. Это даёт оплату в рублях по договору, закрывающие документы для бухгалтерии и хранение данных внутри российского контура. Для бизнеса, который опасается зарубежных платежей и вопросов с данными, такой путь снимает сразу несколько головных болей.

  1. Зарегистрируйте проект в личном кабинете Studio от Сбера под вашим юридическим лицом
  2. Получите ключ авторизации для доступа к API и сохраните его в защищённом месте
  3. Выберите версию модели под основную задачу: лёгкую для потока, старшую для сложного
  4. Соберите тестовый запрос и проверьте ответ на десятке реальных примеров из вашей работы
  5. Прикиньте средний размер запроса и ответа в токенах, умножьте на дневную нагрузку
  6. Подключите оплату по договору и заложите расход с запасом процентов двадцать на рост

Технически подключение похоже на работу с любым другим API языковой модели: вы отправляете запрос с контекстом и промптом, получаете ответ и платите за токены в обе стороны. Если в команде есть человек, который собирал интеграции, он справится за день. Если такого человека нет, разумно начать с готового интерфейса и подключать API позже, когда сценарий доказал отдачу.

  • Доступ через юрлицо: оплата в рублях, закрывающие документы, договор
  • Данные остаются в российском контуре — плюс для чувствительных сценариев
  • Ключ авторизации храните в защищённом месте, а в коде открытым текстом
  • Лимиты по частоте запросов сверяйте в документации до запуска нагрузки

Когда выбирать GigaChat

Российская модель уместна там, где важны оплата в рублях, документы для бухгалтерии и хранение данных внутри страны. Это банки, государственный сектор, компании с чувствительной информацией клиентов и любой бизнес, которому проще работать по договору с российским поставщиком. В этих сценариях GigaChat снимает регуляторные и платёжные вопросы, которые с зарубежными моделями решаются сложнее.

Зарубежные модели часто сильнее на сложных рассуждениях и работе с кодом, и для отдельных задач разрыв заметен. Поэтому выбор сводится к балансу: что для вас критичнее — максимальное качество на сложных задачах или удобство оплаты и хранения данных в российском контуре. Многие компании держат оба инструмента и распределяют задачи между ними по чувствительности.

Гибридная схема на практике выглядит так. Внутренние документы с персональными данными и коммерческой тайной идут только в GigaChat через корпоративный контур. Публичные тексты — посты, описания, переводы открытых материалов — уходят туда, где качество выше под конкретную задачу. Граница проходит по чувствительности данных, а по бренду модели. Такой подход даёт компании и регуляторную чистоту на важном, и силу лучшей модели на остальном, без переплаты за всё подряд.

// Главный критерий выбора

Спросите себя, проходят ли через модель персональные данные клиентов или коммерческая тайна. Если да, российский контур и оплата по договору перевешивают разницу в качестве. Если задача про публичные тексты, выбирайте по силе модели.

Расчёт бюджета

Прикинуть месячный расход можно заранее, ещё до подключения оплаты. Возьмите типовой запрос вашего сценария, оцените его длину в токенах вместе с ответом, умножьте на число обращений в месяц и на цену за тысячу токенов с сайта. Сложите по всем сценариям — получите бюджет, под который подбираете пакет с небольшим запасом.

Главная мысль остаётся прежней: GigaChat стоит ровно столько, сколько текста проходит через модель. Длинные постоянные промпты и развёрнутые ответы на массовых задачах раздувают счёт, а аккуратная архитектура с разделением задач по версиям удерживает его в разумных рамках. Считайте бюджет от своих сценариев — и тариф окупится, а станет скрытым расходом.

Самый частый промах — подключить старшую модель на всё подряд и удивиться счёту. Поток простых обращений переплачивает за качество, которое ему лишнее. Разделите задачи по версиям с самого начала, и средняя стоимость запроса упадёт без ущерба для важных сценариев.

● Discovery · 1 час · бесплатно

Расскажите, какие задачи вы хотите закрыть моделью и какие данные через неё проходят, и я помогу выбрать между российской и зарубежной моделью и прикинуть бюджет. Разбор занимает один час и бесплатен.

Прийти на Discovery →

Частые вопросы

Как устроены тарифы GigaChat API для компаний?
GigaChat считает деньги по токенам — кускам текста на входе и выходе модели. Вы платите и за то, что модель прочитала в запросе, и за то, что написала в ответе. Длинный запрос и развёрнутый ответ стоят дороже короткой реплики. Точные цены за тысячу токенов держите на сайте Сбера.
Чем версии GigaChat отличаются по цене?
Лёгкая версия дешевле и быстрее, она годится для массовых типовых задач. Старшая версия дороже и точнее, её берут под сложные тексты и ответственные решения. Разумная архитектура смешивает версии: поток простых обращений на лёгкую модель, сложные случаи на старшую.
Как компании подключить GigaChat API?
Доступ оформляется через юридическое лицо в экосистеме Сбера: вы регистрируете проект, получаете ключ авторизации, выбираете версию модели и подключаете оплату по договору. Это даёт оплату в рублях, закрывающие документы и хранение данных внутри российского контура.
Когда GigaChat уместнее зарубежной модели?
Российская модель уместна там, где важны оплата в рублях, документы для бухгалтерии и хранение данных внутри страны: банки, государственный сектор, чувствительная информация клиентов. Зарубежные модели часто сильнее на сложных задачах, поэтому многие держат оба инструмента.
Как сократить расход на GigaChat API?
Сократите постоянный системный промпт до нужного минимума — он оплачивается в каждом запросе заново. Разделите задачи по версиям: поток простых обращений на лёгкую модель, сложные на старшую. Так средняя стоимость запроса падает без потери качества там, где оно нужно.
Как заранее посчитать бюджет на GigaChat?
Возьмите типовой запрос вашего сценария, оцените его длину в токенах вместе с ответом, умножьте на число обращений в месяц и на цену за тысячу токенов. Сложите по всем сценариям и добавьте запас процентов двадцать на рост — получите месячный бюджет с заделом.