● Метрика / Уровень: базовый / Q2 · 2026 / 45 из 93

Cost per token.

стоимость токена у провайдеров LLM

Короткий
ответ ↳

Cost per token — это стоимость одного токена у провайдера LLM. В Q2 2026 разброс — от $0.20/1M (Llama) до $75/1M (Claude Opus output). Понимание цены — основа экономики любого LLM-проекта.

01 Цены Q2 2026

Модель	Input/1M	Output/1M
Claude Sonnet 4.5	$3	$15
Claude Opus 4.7	$15	$75
Claude Haiku 4.5	$0.80	$4
GPT-5	$5	$15
GPT-5-mini	$0.50	$1.50
o3	$15	$60
Gemini 2.5 Pro	$1.25	$5
Llama 4 (Together)	$0.20	$0.60

02 Как снижать стоимость

Prompt caching — 10x скидка на повторяющиеся куски.
Роутер: простое — на mini-модель, сложное — на Sonnet/Opus.
Batch API — 50% скидка на не-критичный по латентности.
Локальная Llama для high-volume задач.
Просите модель отвечать коротко — output дороже input в 3-5x.
Distillation в маленькую модель для узкой задачи.

03 TCO LLM-приложения

Не только токены:

Токены (input + output + reasoning).
Embeddings для RAG.
Vector DB (Qdrant / Pinecone).
Observability (Langfuse).
Хостинг приложения.
Поддержка и evals.

// 04 · от практики

Как мы применяем Cost per token в работе с клиентами

В практике «Зинин × Штурбин» мы встраиваем Cost per token в учёт и считаем отдачу — это часть формата стратегический совет. На реальных задачах это Claude $3 / $15, GPT-5 $5 / $15 и подобное. Рядом разбираем Токены — термины в словаре связаны так же, как в работе.

Не консультируем абстрактно: команда уходит с навыком и рабочим процессом, который применяет сама. Посмотреть программы и цены →

// 06

Частые вопросы

01 Что дешевле — Claude или GPT?

Sonnet и GPT-5 сопоставимы. Opus и GPT-5 — Opus дороже. На output Opus в 5x дороже GPT-5.

02 Сколько в среднем тратит middle-проект?

SaaS с 1000 DAU на Claude Haiku — $200-800/мес. На Sonnet — $1500-5000/мес.

Понимаем — учим
работать с Cost per token
внутри команды.

Час бесплатной диагностики: разбираем 2–3 ваших процесса и говорим прямо, где AI окупится за квартал, а где брать рано. Знания остаются у вашей команды.

Discovery call · 1 час @Aleksei_Shturbin