● Методология / Уровень: продвинутый / Q2 · 2026 / 11 из 90

Fine-tuning.

дообучение модели на своих данных
Короткий
ответ
Fine-tuning — это дообучение готовой LLM на ваших данных. Меняет веса модели, чтобы она лучше делала именно вашу задачу. Дорого, требует разметки, устаревает с каждой новой моделью. RAG в 95% случаев лучше.

01 Что это

Вы берёте базовую модель (Llama, GPT-4o-mini, Claude Haiku) и продолжаете её обучение на ваших данных — обычно несколько тысяч пар «вход → желаемый выход». Модель меняет веса, начинает отвечать в нужном стиле / по узкому домену.

В отличие от RAG, где знания остаются во внешней базе, fine-tune вшивает их в модель — но как стиль и интуицию, а не как факты.

02 Когда действительно нужен

  • Узкий стиль контента, который никак не описать промптом.
  • Специфический жаргон (медицинский, юридический), где базовая модель ошибается.
  • Классификация на 100+ узких категорий, где few-shot не помещается.
  • Снижение латентности — fine-tuned маленькая модель быстрее большой с длинным промптом.

03 Когда не нужен (95% случаев)

  • Хотите, чтобы модель знала ваши факты — это RAG, не fine-tune.
  • Хотите изменить стиль — попробуйте сначала few-shot и chain-of-thought.
  • База быстро меняется — fine-tune устареет за неделю.
  • Бюджет ограничен — RAG в 10x дешевле.

04 Стоимость и нюансы

  • Подготовка датасета: ₽300K-1.5M в зависимости от объёма и разметки.
  • Сам fine-tune: $50-2000 в зависимости от модели и провайдера.
  • При смене базовой модели — прогоните заново. Учитывайте в TCO.
  • Альтернатива — LoRA: дешевле, быстрее, легче обновлять.
// 07

Частые вопросы

01 Что делать сначала — RAG или fine-tune?

Всегда RAG. Поднимите MVP за неделю, посмотрите узкие места. Если объективно не справляется на специфическом стиле — добавляйте fine-tune.

02 Сколько данных нужно для fine-tune?

Минимум 500-1000 пар «вход → выход». Идеально — 5-10K. Меньше — модель не научится, больше — упирается в качество разметки.

03 Можно ли fine-tune Claude?

Через Vertex AI (Claude от Google Cloud) — ограниченно. У Anthropic напрямую — нет. Если нужен fine-tune — берите Llama или GPT.

Понимаем — учим
работать с Fine-tuning
внутри команды.

Час бесплатной диагностики: разбираем 2–3 ваших процесса и говорим прямо, где AI окупится за квартал, а где брать рано. Знания остаются у вашей команды.

Готовы поговорить?
@Aleksei_Shturbin Бот →