● Методология / Уровень: продвинутый / Q2 · 2026 / 11 из 93

Fine-tuning.

дообучение модели на своих данных

Короткий
ответ ↳

Fine-tuning — это дообучение готовой LLM на ваших данных. Меняет веса модели, чтобы она лучше делала именно вашу задачу. Дорого, требует разметки, устаревает с каждой новой моделью. RAG в 95% случаев лучше.

01 Что это

Вы берёте базовую модель (Llama, GPT-4o-mini, Claude Haiku) и продолжаете её обучение на ваших данных — обычно несколько тысяч пар «вход → желаемый выход». Модель меняет веса, начинает отвечать в нужном стиле / по узкому домену.

В отличие от RAG, где знания остаются во внешней базе, fine-tune вшивает их в модель — но как стиль и интуицию, а не как факты.

02 Когда действительно нужен

Узкий стиль контента, который никак не описать промптом.
Специфический жаргон (медицинский, юридический), где базовая модель ошибается.
Классификация на 100+ узких категорий, где few-shot не помещается.
Снижение латентности — fine-tuned маленькая модель быстрее большой с длинным промптом.

03 Когда не нужен (95% случаев)

Хотите, чтобы модель знала ваши факты — это RAG, не fine-tune.
Хотите изменить стиль — попробуйте сначала few-shot и chain-of-thought.
База быстро меняется — fine-tune устареет за неделю.
Бюджет ограничен — RAG в 10x дешевле.

04 Стоимость и нюансы

Подготовка датасета: ₽300K-1.5M в зависимости от объёма и разметки.
Сам fine-tune: $50-2000 в зависимости от модели и провайдера.
При смене базовой модели — прогоните заново. Учитывайте в TCO.
Альтернатива — LoRA: дешевле, быстрее, легче обновлять.

// 05 · от практики

Как мы применяем Fine-tuning в работе с клиентами

В практике «Зинин × Штурбин» мы внедряем Fine-tuning в рабочие процессы команды — это часть формата программа для команды. На реальных задачах это узкий стиль контента, доменный жаргон и подобное. Рядом разбираем LoRA — термины в словаре связаны так же, как в работе.

Не консультируем абстрактно: команда уходит с навыком и рабочим процессом, который применяет сама. Посмотреть программы и цены →

// 07

Частые вопросы

01 Что делать сначала — RAG или fine-tune?

Всегда RAG. Поднимите MVP за неделю, посмотрите узкие места. Если объективно не справляется на специфическом стиле — добавляйте fine-tune.

02 Сколько данных нужно для fine-tune?

Минимум 500-1000 пар «вход → выход». Идеально — 5-10K. Меньше — модель не научится, больше — упирается в качество разметки.

03 Можно ли fine-tune Claude?

Через Vertex AI (Claude от Google Cloud) — ограниченно. У Anthropic напрямую — нет. Если нужен fine-tune — берите Llama или GPT.

Понимаем — учим
работать с Fine-tuning
внутри команды.

Час бесплатной диагностики: разбираем 2–3 ваших процесса и говорим прямо, где AI окупится за квартал, а где брать рано. Знания остаются у вашей команды.

Discovery call · 1 час @Aleksei_Shturbin