01 Какую выбрать
| База | Тип | Когда брать |
|---|---|---|
| pgvector | расширение Postgres | до 1M векторов, бесплатно |
| Qdrant | open-source self-hosted | 1M-100M+ векторов |
| Pinecone | managed cloud | без head боли, дороже |
| Weaviate | open-source | встроенный hybrid search |
| Milvus | open-source enterprise | миллиарды векторов |
| Chroma | local-first | прототипы, dev |
02 Как устроена
Внутри — алгоритмы приближённого поиска ближайших соседей (ANN): HNSW, IVF, FAISS. Они трейд-офят «100% точность» на «99% точность × 100x скорость». Для бизнес-задач — отлично.
03 Подводные камни
- Hybrid search (vector + keyword/BM25) почти всегда лучше pure vector.
- Не забывайте про фильтры permissions на уровне retrieval — пользователь не должен видеть чужие документы.
- Reranker поверх vector search даёт +20-30% качества.
- Размер индекса быстро растёт — план на хранение.
04 Наш стандарт для клиентов
До 500K векторов — pgvector в существующем Postgres. От 500K до 50M — Qdrant self-hosted на Contabo. Выше — Pinecone managed или Qdrant Cloud.