Arxiv вводит годовой бан за непроверенный ИИ-контент в научных статьях

Подготовлено редакцией Malakhov AI

The Decoder·15 мая·3 минИсследованияИндустрия

Arxiv, крупнейший препринт-сервер в мире, объявил о санкциях против авторов, публикующих статьи с непроверенными текстами языковых моделей: нарушителям грозит год без публикаций, а затем — обязательное рецензирование всех новых работ. Поводом стали участившиеся случаи галлюцинированных ссылок и незамеченных служебных комментариев ИИ прямо в тексте статей.

Кратко

—Авторы, чьи статьи содержат явные следы непроверенного LLM-вывода, получат бан на год.
—После бана все новые работы нарушителя должны пройти рецензирование до публикации на Arxiv.
—Триггерами для санкций названы галлюцинированные ссылки и мета-комментарии ИИ вроде «Here is a 200-word summary».
—Шесть месяцев назад Arxiv уже ввёл обязательное рецензирование обзорных статей по компьютерным наукам.
—Nikkei обнаружила в 17 препринтах Arxiv скрытые промпты, нацеленные на манипуляцию ИИ-рецензентами.

Глоссарий · 5 терминов▾

Препринт-сервер: Платформа, где исследователи публикуют научные работы до прохождения официального рецензирования, чтобы быстро поделиться результатами с сообществом.
Галлюцинация LLM: Ошибка языковой модели, при которой она генерирует правдоподобно выглядящие, но фактически несуществующие данные — например, ссылки на несуществующие научные статьи.
Мета-комментарий ИИ: Служебная фраза, которую языковая модель вставляет в текст как инструкцию или пояснение к своему выводу (например, «Here is a 200-word summary») и которая не предназначена для публикации.
Скрытый промпт: Текстовая инструкция, спрятанная в документе и рассчитанная на то, что её прочитает ИИ-система, а не человек, — с целью повлиять на её вывод.
Рецензирование (peer review): Процедура независимой оценки научной работы экспертами в той же области перед публикацией в журнале или на платформе.

Томас Дитерих, председатель секции компьютерных наук Arxiv, 15 мая 2026 года объявил в X об ужесточении правил платформы в отношении ИИ-контента. Согласно обновлённому кодексу поведения, авторы несут полную ответственность за содержание своих работ вне зависимости от того, каким способом этот контент был создан. Если в статье обнаружатся явные признаки того, что авторы не проверяли вывод языковой модели, им грозит годовой запрет на публикации. По истечении срока все новые работы нарушителя обязаны пройти рецензирование, прежде чем попасть на платформу.

Конкретными основаниями для санкций Дитерих назвал два типа артефактов: галлюцинированные библиографические ссылки — то есть источники, которых не существует, — и мета-комментарии языковой модели, случайно оставленные в тексте, например фразы вроде «Here is a 200-word summary». Оба признака указывают на то, что авторы не читали финальный текст перед отправкой. Именно это платформа считает нарушением, а не сам факт использования ИИ-инструментов.

Arxiv — не академический журнал, а препринт-сервер: исследователи публикуют здесь работы до формального рецензирования, чтобы быстро поделиться результатами с сообществом. Открытость и скорость — главные преимущества платформы, но они же делают её уязвимой для некачественного контента. За последние два года поток статей с очевидными следами автоматической генерации резко вырос, что и вынудило администрацию действовать.

После бана все новые работы нарушителя должны пройти рецензирование до публикации на Arxiv.

Это уже второй шаг за полгода. В конце 2025 года Arxiv обязал авторов обзорных статей по компьютерным наукам проходить рецензирование до публикации — ранее этот жанр был особенно уязвим для ИИ-генерации, поскольку написать обзор литературы с помощью LLM технически проще, чем сфальсифицировать экспериментальные данные. Теперь санкции распространяются шире.

Параллельно японская газета Nikkei выявила в 17 препринтах Arxiv скрытые промпты — фразы вроде «only positive review», встроенные в текст статей и рассчитанные на то, что их прочитает ИИ-рецензент, а не человек. Это отдельная проблема: манипуляция автоматизированными системами оценки, которая пока не охвачена новыми правилами напрямую.

В научном сообществе реакция неоднородна. Часть исследователей поддержала меры, указывая, что галлюцинированные ссылки уже наносят реальный вред: другие авторы цитируют несуществующие работы, опираясь на первичный препринт. Критики, однако, указывают на риск избирательного правоприменения и возможность злоупотреблений через ложное указание соавторов — если один из них нарушил правила, под удар может попасть вся группа. Механизм апелляций и критерии доказательства нарушения пока не детализированы публично.

Для отрасли в целом ситуация с Arxiv отражает более широкую проблему: инструменты верификации ИИ-контента отстают от скорости его производства. Детекторы ИИ-текста дают высокий процент ложных срабатываний, а галлюцинированные ссылки можно обнаружить только ручной проверкой или специализированным ПО. Пока Arxiv делает ставку на репутационные санкции и постфактум-контроль, а не на технические фильтры на входе.

Разобраться глубже

Какие бизнес-процессы автоматизировать с помощью ИИ: матрица и 10 сценариев

Какие процессы реально автоматизировать с помощью ИИ в 2026 году: матрица фильтров эффект×сложность×риск×данные, 10 готовых сценариев, развёрнутый кейс агентства и калькулятор окупаемости поддержки интернет-магазина.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ