01 Чем отличаются
Обычная LLM отвечает сразу. Reasoning-модель сначала генерирует «внутренний монолог» на 1000-30000 токенов (вы его не видите или видите частично), потом — финальный ответ. Это автоматический chain-of-thought на стероидах.
Обучение reasoning-моделей включает специальный RL-цикл, в котором модель награждается за правильные цепочки рассуждений, а не только за итоговый ответ.
02 Когда брать
- Математика, физика, инженерные расчёты.
- Многошаговые планы агентов (planning).
- Сложный юридический анализ, поиск противоречий.
- Debug сложных багов с длинными stacktrace.
- Стратегические вопросы — «какие риски в плане X».
Не нужны для простой классификации, чат-ботов, перевода, креативного письма — переплата.
03 Reasoning-модели Q2 2026
| Модель | Создатель | Особенность |
|---|---|---|
| o3 | OpenAI | scratchpad скрыт, summary видна |
| Claude Opus 4.7 extended | Anthropic | reasoning trace полностью виден |
| DeepSeek R1 | DeepSeek | open-source, бесплатный |
| Gemini Deep Think | длинный контекст + reasoning |
04 Стоимость и латентность
- Reasoning-токены оплачиваются как output.
- Один сложный запрос — $0.10 - $5 (против $0.01 у обычной LLM).
- Латентность — 10-60 секунд (против 1-5 у обычной).
- Для voice-агентов и real-time UX — не подходят.