01 Как работает
Vector search — быстрый, но грубый (cosine similarity между эмбеддингами). Reranker — медленный, но точный (cross-encoder смотрит запрос и документ одновременно и оценивает релевантность).
Связка «retrieve top-50 → rerank top-5 → LLM» — золотой стандарт в 2026.
02 Когда нужен reranker
- Большая база (10K+ документов) — vector search возвращает много «похожих, но не точно того».
- Точные запросы с конкретным жаргоном.
- Multilingual — reranker лучше понимает кросс-язычные совпадения.
- Когда качество RAG объективно низкое — добавление reranker часто резко помогает.
03 Какие reranker'ы доступны
| Модель | Тип | Особенность |
|---|---|---|
| Cohere Rerank 3 | API | стандарт индустрии |
| BGE Reranker v2 | open-source | бесплатно, on-prem |
| Jina Reranker | API + on-prem | multilingual |
| ColBERT v2 | open-source | исследовательский стандарт |
04 Стоимость
Cohere Rerank — ~$2 за 1K поисков. На объёмах меньше 100K запросов/мес — копейки. Локальный BGE Reranker — бесплатно, но нужен GPU.