01 Что это
Модель не помнит ничего вне текущего запроса. Контекстное окно — это максимальный размер запроса (включая историю, промпт, данные), который влезет.
1M токенов — это примерно 750K слов или 1500 страниц. Можно загрузить весь репозиторий компании.
02 Лимиты в 2026 году
| Модель | Контекст | В страницах |
|---|---|---|
| Claude Sonnet 4.5 | 200K | ~300 |
| Claude Opus 4.7 (1M) | 1M | ~1500 |
| GPT-5 | 256K | ~400 |
| Gemini 2.5 Pro | 1M-2M | ~3000 |
| Llama 4 | 128K | ~200 |
03 Подводные камни
- Lost in the middle. Модель хуже видит инфу из середины очень длинного контекста. Кладите важное в начало или конец.
- Цена. 1M токенов на Claude — ~$3 за один запрос. На массовых вызовах — серьёзный счёт.
- Скорость. Большой контекст → большая задержка (5-30 сек).
- Не альтернатива RAG. 1M помогает, но грамотный поиск всё равно быстрее и дешевле.