Почему ИИ галлюцинирует и почему после замечания становится хуже

Подготовлено редакцией Malakhov AI

Habr AI·24 мая·3 минРоссияКод

DeepSeek на бессмысленный вопрос о несуществующем файле уверенно назвал конкретный путь — и после возражения пользователя выдал ещё более детальный, но столь же выдуманный ответ. Это не сбой конкретной модели, а системное свойство генеративных LLM.

Кратко

—LLM не хранит факты — она предсказывает статистически вероятные токены, поэтому «не знаю» для неё не существует как состояние.
—После замечания пользователя модель не исправляет ошибку, а генерирует другой текст — паттерн вежливости заставляет согласиться, не понимая, что менять.
—RAG-системы снижают долю галлюцинаций на фактологических вопросах с 30–40% до менее 10%, ограничивая генерацию проверенной базой документов.
—Простой тест на RAG: задайте модели абсолютную бессмыслицу — если она ответила уверенно, перед вами чистая генеративная модель без верификации.
—Полностью устранить галлюцинации токенного подхода невозможно — это не баг реализации, а следствие самого принципа генерации.

Глоссарий · 6 терминов▾

LLM: Large Language Model — большая языковая модель, нейросеть, обученная предсказывать следующий токен в тексте на основе статистических паттернов из обучающей выборки.
Токен: Минимальная единица текста, с которой работает языковая модель: примерно слог, часть слова или целое короткое слово.
Галлюцинация: Уверенный, грамматически корректный, но фактически ложный ответ языковой модели, возникающий из-за отсутствия механизма проверки истинности.
RAG: Retrieval-Augmented Generation — подход, при котором модель перед генерацией ответа ищет релевантный фрагмент в заранее подготовленной базе документов и опирается на него.
Температура генерации: Параметр, управляющий случайностью выбора токенов: высокая температура даёт более разнообразные, но менее предсказуемые и потенциально менее точные ответы.
Верификатор: Вспомогательная модель, которая проверяет ответы основной модели на противоречия известным фактам и отфильтровывает недостоверные результаты.

Роман «Солярис» написал Артур Кларк в 1972 году — именно такой ответ может выдать языковая модель на простой вопрос о классике фантастики. Когда пользователь указывает на ошибку, модель соглашается, благодарит за поправку и повторяет неверный год, добавив для убедительности факт про экранизацию Тарковского. Это не случайность и не недоработка конкретного продукта.

LLM — это не база данных и не поисковик. Внутри модели нет переменной knows_answer = True/False и нет самих обучающих текстов. Есть статистические паттерны: веса, которые определяют, какой токен (фрагмент слова) вероятнее всего следует за предыдущими. Когда модель отвечает на вопрос, она не «вспоминает» факт — она генерирует правдоподобное продолжение текста. Если нужного паттерна в обучающей выборке не было, модель всё равно обязана что-то выдать: она цепляется за ближайшие по контексту имена, даты, термины и складывает из них связный, но ложный ответ.

Подход	Как работает	Уровень галлюцинаций
Чистая генеративная модель	Предсказывает токены по статистическим паттернам	30–40%
RAG-система	Ищет ответ в базе документов, генерирует на основе найденного	менее 10%
Самооценка уверенности	Модель оценивает уверенность; при низком показателе ответ скрывается	снижается
Верификатор	Вторая модель проверяет первую на противоречия фактам	снижается

Почему после замечания становится хуже — отдельный механизм. Здесь работают три фактора одновременно. Первый — паттерн вежливости: современные модели обучены извиняться и переписывать ответ, если пользователь выражает недовольство, но они не понимают, что именно менять. Второй — отсутствие внутреннего компаса истинности: модель видит только новое сообщение и свой предыдущий текст, у неё нет памяти вида «я сказал X, это было неверно, правильно Y». Третий — эффект повышенной температуры генерации: при повторных запросах модели нередко увеличивают случайность выбора токенов, чтобы не повторить тот же ответ. Менее вероятные токены — это более «творческие», но ещё менее достоверные варианты.

После замечания пользователя модель не исправляет ошибку, а генерирует другой текст — паттерн вежливости заставляет согласиться, не понимая, что менять.

Рабочее решение, доступное уже сейчас, — RAG (Retrieval-Augmented Generation). Принцип прост: прежде чем генерировать ответ, модель ищет релевантный фрагмент в заранее подготовленной базе документов. Нашла — генерирует на основе найденного. Не нашла — может честно сообщить «не знаю». Именно так ведёт себя ИИ-ассистент из документации Apache Superset: на бессмысленный вопрос о несуществующем файле «выщ-мыщ-пыщ-дыщ» он ответил отказом, тогда как DeepSeek без RAG уверенно назвал конкретный путь в исходниках. По данным из материала, RAG-системы снижают долю галлюцинаций на фактологических вопросах с 30–40% у чистых генеративных моделей до менее 10%.

Помимо RAG существуют и другие методы снижения галлюцинаций. Самооценка уверенности — когда модель выдаёт не только ответ, но и числовую оценку своей уверенности, и при низком показателе ответ просто не показывается пользователю. Верификатор — отдельная небольшая модель, которая проверяет основную на противоречия известным фактам. Все эти подходы снижают проблему, но не устраняют её полностью: пока в основе лежит токенная генерация, вероятность ошибки остаётся ненулевой.

Практический способ проверить, с чем вы имеете дело: задайте модели заведомо бессмысленный вопрос — о несуществующем объекте или явлении. Если модель уверенно ответила — перед вами чистая генеративная система без верификации по базе. Если отказалась или честно призналась в незнании — скорее всего, RAG. Это не гарантия точности базы знаний, но исключает целый класс выдуманных ответов.

Разобраться глубже

Как внедрить ИИ в бизнес в 2026 году: пошаговый план для руководителя

Практический гайд для руководителя: как выбрать первый проект с ИИ, подготовить данные, посчитать экономику и довести пилот до рабочего процесса.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ

По теме

Почти 90 стартапов стали единорогами в 2026 году — больше половины связаны с ИИ

Продолжить по разделам

Почему ИИ галлюцинирует и почему после замечания становится хуже

Кратко

Читать дальше

Яндекс: креативность — главный навык разработчика в эпоху ИИ

Wildberries запустила ИИ-примерку ювелирных украшений в мобильном приложении

Почти 90 стартапов стали единорогами в 2026 году — больше половины связаны с ИИ