ArXiv будет банить авторов за некорректное использование ИИ в научных статьях

Подготовлено редакцией Malakhov AI

The Verge AI·15 мая·2 минИндустрия

ArXiv вводит годовой бан для исследователей, чьи препринты содержат необработанный вывод языковых моделей — например, галлюцинированные ссылки или служебные комментарии ИИ вроде «заполните таблицу реальными данными».

Кратко

—Годовой бан грозит авторам, если в статье найдены «неопровержимые свидетельства» того, что вывод LLM не проверялся.
—После бана все последующие публикации на ArXiv потребуют предварительного принятия в рецензируемом журнале или конференции.
—Примеры нарушений: галлюцинированные ссылки и мета-комментарии ИИ, оставленные в тексте статьи.
—Решение о бане принимается в два этапа: сначала модератор фиксирует нарушение, затем председатель секции его подтверждает.
—Авторы вправе обжаловать решение о бане — это предусмотрено новой процедурой.

Глоссарий · 5 терминов▾

Препринт: Научная статья, размещённая в открытом доступе до прохождения официального рецензирования.
LLM: Large Language Model — большая языковая модель, тип нейросети, обученной генерировать текст на основе входного запроса.
Галлюцинация: Вывод языковой модели, который выглядит достоверно, но содержит выдуманные факты — например, несуществующие научные работы с реалистичными названиями и авторами.
Мета-комментарий LLM: Служебная фраза, которую языковая модель добавляет к своему ответу — например, предложение отредактировать текст или указание заполнить данные вручную.
Рецензирование (peer review): Процедура проверки научной статьи независимыми экспертами в той же области перед публикацией в журнале или на конференции.

ArXiv — крупнейший репозиторий научных препринтов, где ежегодно размещаются сотни тысяч работ по физике, математике, информатике и смежным дисциплинам. Платформа не является рецензируемым журналом: авторы публикуют статьи до официальной проверки, чтобы быстро поделиться результатами с сообществом. Именно эта открытость сделала ArXiv уязвимым для потока слабо проверенных материалов, сгенерированных с помощью LLM.

Председатель секции компьютерных наук Томас Дитерих объявил в X, что платформа ужесточает санкции. Если препринт содержит «неопровержимые свидетельства» того, что авторы не проверяли вывод языковой модели, все подписавшие статью получат годовой бан. После его истечения любые новые публикации на ArXiv потребуют предварительного принятия в рецензируемом издании или на конференции. Под неопровержимыми свидетельствами понимаются два типа артефактов: галлюцинированные библиографические ссылки на несуществующие работы и мета-комментарии самой модели — например, фразы вроде «вот краткое изложение на 200 слов, хотите что-то изменить?» или «данные в таблице иллюстративные, подставьте реальные числа из ваших экспериментов».

Процедура применения санкций двухступенчатая: сначала модератор документирует нарушение, затем председатель секции подтверждает решение. Авторы могут подать апелляцию. Дитерих подчеркнул, что политика касается исключительно случаев с неопровержимыми доказательствами — платформа не намерена преследовать за само использование ИИ-инструментов.

После бана все последующие публикации на ArXiv потребуют предварительного принятия в рецензируемом журнале или конференции.

STKS511_AI_SLOP_C · Источник: The Verge AI

Это не первый шаг ArXiv против низкокачественного контента. В прошлом году платформа ограничила публикацию обзорных статей и позиционных материалов по компьютерным наукам: теперь они принимаются только при наличии рецензии и факта принятия на конференции или в журнале. Тогда ArXiv объяснил решение тем, что языковые модели сделали производство подобных текстов тривиальным, а большинство поступающих обзоров представляют собой «не более чем аннотированные библиографии без содержательного обсуждения открытых исследовательских вопросов».

Проблема шире одной платформы. Рост числа статей с галлюцинированными ссылками фиксируют и рецензируемые журналы: несуществующие источники проходят через редакционный фильтр, если рецензенты не проверяют каждую ссылку вручную. ArXiv, работающий без обязательной рецензии, оказался особенно уязвим. Новые санкции переносят ответственность туда, где она и должна быть: на авторов, которые подписывают статью и тем самым удостоверяют её содержание — вне зависимости от того, каким инструментом текст был создан.

Разобраться глубже

Как внедрить ИИ в бизнес в 2026 году: пошаговый план для руководителя

Практический гайд для руководителя: как выбрать первый проект с ИИ, подготовить данные, посчитать экономику и довести пилот до рабочего процесса.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ

По теме

Ford пришлось вернуть 350 инженеров после провала замены на ИИ

Продолжить по разделам

ArXiv будет банить авторов за некорректное использование ИИ в научных статьях

Кратко

Читать дальше

OpenAI представила GPT-5.6: три модели, снижение цен и контроль безопасности

OpenAI наняла экс-главу Uber India для развития индийского рынка

Ford пришлось вернуть 350 инженеров после провала замены на ИИ