01 Что это
LLM не работает со словами или буквами — она работает с токенами. Токен — это часто целое короткое слово («the»), часть длинного («обуч-ение»), знак препинания или пробел.
У каждой модели свой токенизатор. Один и тот же текст в Claude и GPT может занять разное число токенов.
02 Сколько стоят
| Модель | Input / 1M | Output / 1M |
|---|---|---|
| Claude Sonnet 4.5 | $3 | $15 |
| Claude Opus 4.7 | $15 | $75 |
| GPT-5 | $5 | $15 |
| Gemini 2.5 Pro | $1.25 | $5 |
| Llama 4 (Together) | $0.20 | $0.60 |
03 Экономика на проде
- Чат-бот: ~3K токенов на сессию × 1000 сессий/день = 3M токенов = $50-100/день на Claude.
- Агент с длинной памятью: 30K токенов × 200 сессий = 6M = $100-200/день.
- Prompt caching снижает повторяющиеся куски в 10x.
- Output дороже input в 3-5x. Просите модель отвечать коротко, если можно.
04 Как считать
- Через
tiktoken(OpenAI) или Anthropic SDK — точное число. - Грубая оценка: русский — слово ≈ 2.5 токена, английский — слово ≈ 1.3 токена.
- 1 страница A4 ≈ 500-700 токенов.