● Метрика / Уровень: базовый / Q2 · 2026 / 45 из 90

Cost per token.

стоимость токена у провайдеров LLM
Короткий
ответ
Cost per token — это стоимость одного токена у провайдера LLM. В Q2 2026 разброс — от $0.20/1M (Llama) до $75/1M (Claude Opus output). Понимание цены — основа экономики любого LLM-проекта.

01 Цены Q2 2026

МодельInput/1MOutput/1M
Claude Sonnet 4.5$3$15
Claude Opus 4.7$15$75
Claude Haiku 4.5$0.80$4
GPT-5$5$15
GPT-5-mini$0.50$1.50
o3$15$60
Gemini 2.5 Pro$1.25$5
Llama 4 (Together)$0.20$0.60

02 Как снижать стоимость

  • Prompt caching — 10x скидка на повторяющиеся куски.
  • Роутер: простое — на mini-модель, сложное — на Sonnet/Opus.
  • Batch API — 50% скидка на не-критичный по латентности.
  • Локальная Llama для high-volume задач.
  • Просите модель отвечать коротко — output дороже input в 3-5x.
  • Distillation в маленькую модель для узкой задачи.

03 TCO LLM-приложения

Не только токены:

  • Токены (input + output + reasoning).
  • Embeddings для RAG.
  • Vector DB (Qdrant / Pinecone).
  • Observability (Langfuse).
  • Хостинг приложения.
  • Поддержка и evals.
// 06

Частые вопросы

01 Что дешевле — Claude или GPT?

Sonnet и GPT-5 сопоставимы. Opus и GPT-5 — Opus дороже. На output Opus в 5x дороже GPT-5.

02 Сколько в среднем тратит middle-проект?

SaaS с 1000 DAU на Claude Haiku — $200-800/мес. На Sonnet — $1500-5000/мес.

Понимаем — учим
работать с Cost per token
внутри команды.

Час бесплатной диагностики: разбираем 2–3 ваших процесса и говорим прямо, где AI окупится за квартал, а где брать рано. Знания остаются у вашей команды.

Готовы поговорить?
@Aleksei_Shturbin Бот →