Команда под руководством Максима Топаза из Колумбийского университета опубликовала в The Lancet крупнейший на сегодня анализ цитирования в биомедицинской литературе. Учёные проверили 97,1 млн ссылок из 2,47 млн статей, размещённых в открытом архиве PubMed Central с января 2023 по февраль 2026 года. Ссылка признавалась сфабрикованной, если её заголовок не обнаруживался ни в одной из четырёх баз: PubMed, Crossref, OpenAlex и Google Scholar. Итог — 4 046 несуществующих ссылок в 2 810 статьях.
Динамика красноречива. На протяжении всего 2023 года показатель держался на уровне около 4 фальшивых ссылок на 10 000 статей. С середины 2024 года кривая резко пошла вверх: к концу 2025-го — 51,3 на 10 000, в первые семь недель 2026-го — уже 56,9. Рост более чем двенадцатикратный. Авторы указывают на очевидную корреляцию с массовым распространением языковых моделей вроде ChatGPT, которые вошли в широкий обиход в конце 2022 года. Поскольку путь статьи от подачи до публикации занимает 100–200 дней, ИИ-сгенерированный текст начал появляться в PubMed Central в заметных объёмах именно с середины 2024-го. Исследователи, впрочем, не исключают и других факторов — активизации «фабрик статей» или изменений в практике индексирования.
| Период | Фальшивых ссылок на 10 000 статей |
|---|---|
| 2023 год (весь год) | ~4 |
| Конец 2025 года | 51,3 |
| Январь–февраль 2026 года | 56,9 |
Что делает проблему особенно опасной — фальшивые ссылки практически неотличимы от настоящих. Они соответствуют теме статьи, оформлены по стандартам, указывают реальных учёных и правдоподобные годы публикации. В одной урологической статье 18 из 30 проверенных ссылок оказались несуществующими — при этом все точно соответствовали узкой хирургической теме. Исследователи также зафиксировали паттерны, характерные для координированной деятельности «фабрик статей»: два автора фигурировали в одиннадцати статьях одного хирургического журнала с 15 сфабрикованными ссылками на темы CRISPR-диагностики и микробиома кишечника.
Частота фальшивых ссылок выросла с 4 на 10 000 статей в начале 2023 года до 56,9 на 10 000 в начале 2026-го.

Особую тревогу вызывает то, что сильнее всего пострадали обзорные статьи — их показатель фабрикации на 57% выше, чем у других типов публикаций. Именно обзоры служат фундаментом клинических рекомендаций. Если в такой статье часть источников несуществующая, вся доказательная цепочка, на которой строятся решения о лечении пациентов, оказывается скомпрометированной. При этом на момент аудита 98,4% затронутых статей не получили никакой реакции от издателей.
Научное сообщество начало адаптироваться, но ответ остаётся несистемным. Arxiv ужесточил санкции за непроверенный вывод LLM в рукописях, включая галлюцинированные источники, угрожая авторам годовым баном. Анализ принятых статей NeurIPS 2025 показал, что даже ведущие ИИ-конференции не могут надёжно выявлять сфабрикованные цитаты. Среди инструментов противодействия — CiteAudit, open-source система автоматической проверки ссылок, хотя она же наглядно демонстрирует, насколько плохо коммерческие языковые модели справляются с обнаружением собственных ошибок цитирования.
Авторы исследования предлагают четыре системных меры: автоматическую проверку ссылок до начала рецензирования, включение метаданных целостности в наборы данных статей, ретроспективный скрининг уже опубликованных работ и создание отдельной категории «сфабрикованные ссылки» в базах нарушений научной этики. Примечательно, что сами авторы использовали Claude для разработки кода и проверки грамматики в ходе исследования — что они прямо указали в статье.



