Томас Дитерих, председатель секции компьютерных наук Arxiv, 15 мая 2026 года объявил в X об ужесточении правил платформы в отношении ИИ-контента. Согласно обновлённому кодексу поведения, авторы несут полную ответственность за содержание своих работ вне зависимости от того, каким способом этот контент был создан. Если в статье обнаружатся явные признаки того, что авторы не проверяли вывод языковой модели, им грозит годовой запрет на публикации. По истечении срока все новые работы нарушителя обязаны пройти рецензирование, прежде чем попасть на платформу.
Конкретными основаниями для санкций Дитерих назвал два типа артефактов: галлюцинированные библиографические ссылки — то есть источники, которых не существует, — и мета-комментарии языковой модели, случайно оставленные в тексте, например фразы вроде «Here is a 200-word summary». Оба признака указывают на то, что авторы не читали финальный текст перед отправкой. Именно это платформа считает нарушением, а не сам факт использования ИИ-инструментов.
Arxiv — не академический журнал, а препринт-сервер: исследователи публикуют здесь работы до формального рецензирования, чтобы быстро поделиться результатами с сообществом. Открытость и скорость — главные преимущества платформы, но они же делают её уязвимой для некачественного контента. За последние два года поток статей с очевидными следами автоматической генерации резко вырос, что и вынудило администрацию действовать.
После бана все новые работы нарушителя должны пройти рецензирование до публикации на Arxiv.
Это уже второй шаг за полгода. В конце 2025 года Arxiv обязал авторов обзорных статей по компьютерным наукам проходить рецензирование до публикации — ранее этот жанр был особенно уязвим для ИИ-генерации, поскольку написать обзор литературы с помощью LLM технически проще, чем сфальсифицировать экспериментальные данные. Теперь санкции распространяются шире.
Параллельно японская газета Nikkei выявила в 17 препринтах Arxiv скрытые промпты — фразы вроде «only positive review», встроенные в текст статей и рассчитанные на то, что их прочитает ИИ-рецензент, а не человек. Это отдельная проблема: манипуляция автоматизированными системами оценки, которая пока не охвачена новыми правилами напрямую.
В научном сообществе реакция неоднородна. Часть исследователей поддержала меры, указывая, что галлюцинированные ссылки уже наносят реальный вред: другие авторы цитируют несуществующие работы, опираясь на первичный препринт. Критики, однако, указывают на риск избирательного правоприменения и возможность злоупотреблений через ложное указание соавторов — если один из них нарушил правила, под удар может попасть вся группа. Механизм апелляций и критерии доказательства нарушения пока не детализированы публично.
Для отрасли в целом ситуация с Arxiv отражает более широкую проблему: инструменты верификации ИИ-контента отстают от скорости его производства. Детекторы ИИ-текста дают высокий процент ложных срабатываний, а галлюцинированные ссылки можно обнаружить только ручной проверкой или специализированным ПО. Пока Arxiv делает ставку на репутационные санкции и постфактум-контроль, а не на технические фильтры на входе.


