Фальшивые ссылки в биомедицинских статьях: рост в 12 раз за два года

The Decoder·8 часов назад·3 минИсследованияИндустрия

Аудит 2,47 млн биомедицинских публикаций из архива PubMed Central выявил 4 046 сфабрикованных ссылок в 2 810 статьях — и с середины 2024 года их частота выросла более чем в 12 раз. Особую угрозу представляют обзорные статьи, которые служат основой клинических рекомендаций.

Кратко

—Из 97,1 млн проверенных ссылок 4 046 оказались несуществующими — их заголовки не нашлись ни в одной из четырёх крупных баз данных.
—Частота фальшивых ссылок выросла с 4 на 10 000 статей в начале 2023 года до 56,9 на 10 000 в начале 2026-го.
—Обзорные статьи поражены на 57% чаще других типов публикаций — именно они лежат в основе клинических протоколов.
—98,4% затронутых статей на момент аудита не получили никакой реакции от издателей.
—Исследователи предлагают четыре меры: автоматическую проверку ссылок до рецензирования, метаданные целостности, ретроспективный скрининг и отдельную категорию в базах нарушений.

Глоссарий · 6 терминов▾

PubMed Central: Открытый архив полнотекстовых биомедицинских и биологических научных статей, поддерживаемый Национальной медицинской библиотекой США.
Галлюцинация ИИ: Явление, при котором языковая модель уверенно генерирует несуществующие факты, ссылки или данные, внешне неотличимые от достоверных.
LLM: Large Language Model — большая языковая модель, тип нейросети, обученной на огромных текстовых корпусах и способной генерировать связный текст.
Фабрика статей: Организованная схема производства и продажи научных публикаций, в которых данные, авторство или ссылки частично или полностью фальсифицированы.
CiteAudit: Open-source инструмент для автоматической проверки корректности и существования научных ссылок в рукописях.
Обзорная статья: Тип научной публикации, систематизирующий и анализирующий результаты множества первичных исследований по определённой теме; часто служит основой для клинических рекомендаций.

Команда под руководством Максима Топаза из Колумбийского университета опубликовала в The Lancet крупнейший на сегодня анализ цитирования в биомедицинской литературе. Учёные проверили 97,1 млн ссылок из 2,47 млн статей, размещённых в открытом архиве PubMed Central с января 2023 по февраль 2026 года. Ссылка признавалась сфабрикованной, если её заголовок не обнаруживался ни в одной из четырёх баз: PubMed, Crossref, OpenAlex и Google Scholar. Итог — 4 046 несуществующих ссылок в 2 810 статьях.

Динамика красноречива. На протяжении всего 2023 года показатель держался на уровне около 4 фальшивых ссылок на 10 000 статей. С середины 2024 года кривая резко пошла вверх: к концу 2025-го — 51,3 на 10 000, в первые семь недель 2026-го — уже 56,9. Рост более чем двенадцатикратный. Авторы указывают на очевидную корреляцию с массовым распространением языковых моделей вроде ChatGPT, которые вошли в широкий обиход в конце 2022 года. Поскольку путь статьи от подачи до публикации занимает 100–200 дней, ИИ-сгенерированный текст начал появляться в PubMed Central в заметных объёмах именно с середины 2024-го. Исследователи, впрочем, не исключают и других факторов — активизации «фабрик статей» или изменений в практике индексирования.

Период	Фальшивых ссылок на 10 000 статей
2023 год (весь год)	~4
Конец 2025 года	51,3
Январь–февраль 2026 года	56,9

Что делает проблему особенно опасной — фальшивые ссылки практически неотличимы от настоящих. Они соответствуют теме статьи, оформлены по стандартам, указывают реальных учёных и правдоподобные годы публикации. В одной урологической статье 18 из 30 проверенных ссылок оказались несуществующими — при этом все точно соответствовали узкой хирургической теме. Исследователи также зафиксировали паттерны, характерные для координированной деятельности «фабрик статей»: два автора фигурировали в одиннадцати статьях одного хирургического журнала с 15 сфабрикованными ссылками на темы CRISPR-диагностики и микробиома кишечника.

Частота фальшивых ссылок выросла с 4 на 10 000 статей в начале 2023 года до 56,9 на 10 000 в начале 2026-го.

From summer 2024, there was a rapid increase in hallucinated references in the papers examined. Image: The Lancet · Источник: The Decoder

Особую тревогу вызывает то, что сильнее всего пострадали обзорные статьи — их показатель фабрикации на 57% выше, чем у других типов публикаций. Именно обзоры служат фундаментом клинических рекомендаций. Если в такой статье часть источников несуществующая, вся доказательная цепочка, на которой строятся решения о лечении пациентов, оказывается скомпрометированной. При этом на момент аудита 98,4% затронутых статей не получили никакой реакции от издателей.

Научное сообщество начало адаптироваться, но ответ остаётся несистемным. Arxiv ужесточил санкции за непроверенный вывод LLM в рукописях, включая галлюцинированные источники, угрожая авторам годовым баном. Анализ принятых статей NeurIPS 2025 показал, что даже ведущие ИИ-конференции не могут надёжно выявлять сфабрикованные цитаты. Среди инструментов противодействия — CiteAudit, open-source система автоматической проверки ссылок, хотя она же наглядно демонстрирует, насколько плохо коммерческие языковые модели справляются с обнаружением собственных ошибок цитирования.

Авторы исследования предлагают четыре системных меры: автоматическую проверку ссылок до начала рецензирования, включение метаданных целостности в наборы данных статей, ретроспективный скрининг уже опубликованных работ и создание отдельной категории «сфабрикованные ссылки» в базах нарушений научной этики. Примечательно, что сами авторы использовали Claude для разработки кода и проверки грамматики в ходе исследования — что они прямо указали в статье.

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ

По теме