01 Что это
Вы берёте базовую модель (Llama, GPT-4o-mini, Claude Haiku) и продолжаете её обучение на ваших данных — обычно несколько тысяч пар «вход → желаемый выход». Модель меняет веса, начинает отвечать в нужном стиле / по узкому домену.
В отличие от RAG, где знания остаются во внешней базе, fine-tune вшивает их в модель — но как стиль и интуицию, а не как факты.
02 Когда действительно нужен
- Узкий стиль контента, который никак не описать промптом.
- Специфический жаргон (медицинский, юридический), где базовая модель ошибается.
- Классификация на 100+ узких категорий, где few-shot не помещается.
- Снижение латентности — fine-tuned маленькая модель быстрее большой с длинным промптом.
03 Когда не нужен (95% случаев)
04 Стоимость и нюансы
- Подготовка датасета: ₽300K-1.5M в зависимости от объёма и разметки.
- Сам fine-tune: $50-2000 в зависимости от модели и провайдера.
- При смене базовой модели — прогоните заново. Учитывайте в TCO.
- Альтернатива — LoRA: дешевле, быстрее, легче обновлять.