01 В чём разница
Zero-shot: «Классифицируй этот email как support / sales / spam». Модель отвечает «как умеет», иногда выходит за пределы заданных категорий.
Few-shot: «Вот примеры: Email A → support, Email B → sales, Email C → spam. Теперь классифицируй Email D». Модель видит паттерн, точно следует формату.
Эффект in-context learningЭто эмерджентное свойство больших LLM — учиться по 2-5 примерам в контексте без обновления весов. Появилось у GPT-3 и стало стандартом.
02 Когда применять few-shot
- Конкретный формат вывода. JSON-схема, особая структура — few-shot выводит в формат с первого раза.
- Узкая классификация. 10+ категорий со своим жаргоном.
- Стиль писем. Дайте 2-3 примера ваших старых писем — модель подхватит тон.
- Domain-специфика. Юридический, медицинский, финансовый жаргон.
- Edge cases. Покажите как обрабатывать пограничные случаи.
03 Как выбирать примеры
- Берите типичные кейсы, а не пограничные.
- Разнообразие важнее количества — 3 разных лучше 10 однотипных.
- Включите 1 «edge case» если их часто встречаете.
- Не давайте противоречивые примеры — модель путается.
04 Ограничения
- Примеры съедают токены контекста.
- >10 примеров обычно не улучшают качество — переходите на fine-tune.
- Выбор «правильных» примеров критичен — берите типичные, не пограничные.
- На очень длинных списках few-shot не помогает — нужен retrieval-augmented подход.