Галлюцинации и устаревшие данные: когда нейросети ошибаются увереннее всего

Подготовлено редакцией Malakhov AI

Habr AI·16 июн.·2 минРоссияКод

Claude, GPT и другие языковые модели не имеют встроенного механизма проверки собственных ответов — и выдают выдуманные цитаты, несуществующие ссылки и характеристики годичной давности с той же интонацией, что и достоверные факты. Именно уверенный тон делает такие ошибки особенно опасными в рабочих задачах.

Кратко

—Языковая модель предсказывает следующее слово, а не извлекает факты из базы данных — отсюда правдоподобные, но ложные ответы.
—Галлюцинации — выдуманные цитаты, статьи и характеристики — модель выдаёт тем же уверенным тоном, что и верную информацию.
—Дата окончания обучения — жёсткая граница: всё, что произошло после неё, для модели не существует, и она додумывает детали.
—Арифметика у LLM хромает чаще, чем принято считать: числа и расчёты стоит проверять вручную.
—Практический тест — задать модели вопрос из области, в которой вы сами разбираетесь, и оценить точность ответа.

Глоссарий · 4 термина▾

Галлюцинации: Ошибки языковой модели, при которых она уверенно сообщает выдуманные факты: несуществующие источники, цитаты, характеристики продуктов.
Дата отсечения (knowledge cutoff): Момент, после которого новые данные не поступали в модель при обучении; всё произошедшее позже модели неизвестно.
LLM: Large Language Model — большая языковая модель; нейросеть, обученная на текстах и предсказывающая следующий токен в последовательности.
Токен: Минимальная единица текста, с которой работает языковая модель: примерно слово или его часть.

Языковые модели устроены иначе, чем принято думать. В их основе лежит не база знаний и не поисковый индекс, а механизм предсказания следующего слова: каждый токен в ответе выбирается как наиболее вероятный на основе огромного массива текстов, на которых модель обучалась. Это означает, что связный и грамматически правильный ответ модель способна сгенерировать даже тогда, когда нужных данных у неё нет — она просто достроит текст до правдоподобного вида.

Отсюда вырастает главная проблема, которую в отрасли называют галлюцинациями. Модель может сослаться на научную статью, которой не существует, привести цитату, которую никто не произносил, или описать характеристики видеокарты, которую никто не выпускал. Проверить такую ссылку несложно — она просто никуда не ведёт. Сложнее с фактами, которые выглядят достаточно правдоподобно, чтобы не вызвать подозрений: перепутанные даты, слегка искажённые цифры, смешанные характеристики двух разных продуктов.

Второй источник ошибок — дата отсечения обучающих данных. У каждой модели есть момент, после которого новые данные в неё не поступали. Всё, что произошло позже, для модели попросту не существует. Если спросить её о новом смартфоне или свежей видеокарте в формате «расскажи про X», а не «существует ли X», модель воспримет уверенную формулировку вопроса как сигнал, что продукт существует, и начнёт его описывать — смешивая реальные характеристики предыдущих поколений со слухами и домыслами. Именно устаревшие данные на практике подводят чаще, чем классические галлюцинации, потому что ответ выглядит почти верным.

Отдельная зона риска — арифметика. Языковые модели не вычисляют числа в математическом смысле: они предсказывают, какая цифра должна стоять следующей. Для простых примеров это работает, для сложных расчётов — нет. Числа в ответах стоит перепроверять вручную, особенно если они используются в финансовых или технических решениях.

Практика работы с моделями сводится к нескольким привычкам. Любой важный факт — цитату, характеристику, цену — нужно сверять с первоисточником или хотя бы просить модель дать ссылку и проверять, существует ли она. Уверенный тон ответа не несёт никакой информации о его достоверности: модель звучит одинаково убедительно и когда права, и когда ошибается. Полезный приём — задать вопрос из области, в которой вы сами хорошо разбираетесь, и посмотреть, как модель держится на знакомой территории. Это даёт ориентир для оценки её надёжности в незнакомых темах.

Всё это не означает, что от языковых моделей нет пользы. Они экономят время на черновиках, поиске идей и рутинных задачах. Но отношение к ним должно быть как к исполнительному помощнику, за которым нужно проверять результат, а не как к справочнику, которому можно верить на слово. Ключевое отличие от человека в том, что модель никогда не скажет «я не уверен» — и понять, знает ли она что-то на самом деле, предстоит самому пользователю.

Разобраться глубже

Как внедрить ИИ в бизнес в 2026 году: пошаговый план для руководителя

Практический гайд для руководителя: как выбрать первый проект с ИИ, подготовить данные, посчитать экономику и довести пилот до рабочего процесса.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ

По теме

Червь для Microsoft Copilot распространяется через скрытый текст в документах Word

Продолжить по разделам

Галлюцинации и устаревшие данные: когда нейросети ошибаются увереннее всего

Кратко

Читать дальше

7 месяцев вайбкодинга: один разработчик, семь проектов и 3 тысячи пользователей

«Мои слова должны быть моими»: Хэнк Грин о нездоровом использовании ИИ

Червь для Microsoft Copilot распространяется через скрытый текст в документах Word