01 Почему случаются
LLM обучена предсказывать наиболее вероятный токен. Если в обучающих данных её просили выглядеть уверенной — она выглядит уверенной. Если конкретного факта она не знает — генерирует правдоподобный.
Это не баг, это архитектура. Модель не знает, что она «не знает». Она знает только распределения вероятностей по токенам, и иногда самый вероятный токен — это вранье.
02 Типичные виды
- Выдуманные ссылки. Модель генерирует URL, который выглядит реалистично, но не существует.
- Несуществующие цифры. «По данным McKinsey, 73% компаний...» — данных нет.
- Фантомные API. В сгенерированном коде вызовы функций, которых нет в библиотеке.
- Сочинённые цитаты. «Как говорил Эйнштейн...» — Эйнштейн не говорил.
- Несуществующие судебные дела. Известный кейс — юрист подал в суд презентацию с цитированием выдуманных Claude/GPT прецедентов.
03 Как лечить
- RAG с цитированием. Модель отвечает только по найденным документам и обязана давать ссылку.
- Tool use. Не знаешь — иди в БД / в поиск, не выдумывай.
- Промпт-инструкция. «Если не знаешь — скажи: не знаю».
- Reasoning-модели. Лучше калибруют уверенность.
- Evals. Регулярная проверка на наборе известных вопросов.
- HITL на критичных решениях.
04 В бизнесе
Никакой важный документ, юридический совет, медицинская рекомендация или финансовая транзакция не идут «от голой LLM». Всегда — обвязка из RAG, проверки и человека.