Дональд Кнут — автор «Искусства программирования» и человек, чьё имя в computer science синонимично строгости — в феврале 2026 года разместил на своей странице в Стэнфорде короткую запись: Claude Opus 4.6 за 31 итерацию, примерно за час, решил открытую задачу, над которой сам Кнут работал несколько недель. Он добавил, что ему придётся пересмотреть своё мнение о генеративном ИИ.
Этот эпизод стал отправной точкой для проекта OpenArx — открытой MCP-инфраструктуры, которую один разработчик строит вместе с командой ИИ-агентов. Суть проекта: существующая научная инфраструктура создавалась под режим «один человек читает один PDF». Этот режим перестаёт быть основным, а инструменты под новый режим никто системно не собирал.
| Метрика | Значение | Контекст |
|---|---|---|
| Подачи в arXiv (пик, окт. 2025) | 25 900 в месяц | Предыдущий пик — 24 226 (окт. 2024) |
| Подачи в NeurIPS 2025 | 21 575 | В 2020 году — 9 467 |
| Рецензии ICLR 2026, сгенерированные ИИ | ~21% | Из 75 800 проанализированных рецензий |
| APC в Nature | $12 690 | APC в PLOS ONE — $1 931 |
| Глобальные выплаты по APC (2023) | $2,54 млрд | В 2019 году — $910 млн |
| Медианное время до финального решения | 198 дней | Медиана до первого решения — 60 дней |
| Случайность peer review (NeurIPS 2021) | 50,6% | Доля работ, принятых одним комитетом и отклонённых другим |
| Звёзды репозитория autoresearch (май 2026) | 78 900 | 11 500 форков, 8,6 млн просмотров анонс-твита |
Чтобы понять, зачем это нужно, достаточно посмотреть на цифры. Подачи в arXiv в 2025 году колебались от 18 000 до 25 900 в месяц — оба пика сентября и октября 2025-го превысили предыдущий рекорд. Подачи в NeurIPS удвоились с 2020 по 2025 год: с 9 467 до 21 575. Скорость производства научных текстов растёт, а инфраструктура рецензирования и распространения осталась прежней.
AlphaEvolve от DeepMind впервые за 56 лет улучшил алгоритм Штрассена, ускорив matmul-ядро обучения Gemini на 23%.
Peer review при этом работает с хорошо задокументированными сбоями. Естественный эксперимент NeurIPS 2021 показал: 50,6% работ, принятых одним независимым комитетом, были отклонены другим. Половина решений accept/reject статистически случайна. Медианное время от подачи до финального решения — 198 дней. Доля принятых приглашений рецензировать упала с 56% в 2003 году до 35,7% в 2024-м. Параллельно APC — плата автора за публикацию в open-access журнале — в Nature составляет $12 690, при том что годовая стипендия аспиранта в США — $25–35 тыс. Глобальные выплаты шести крупнейшим open-access издателям выросли с $910 млн в 2019 году до $2,54 млрд в 2023-м.
И это фон, на котором ИИ уже вошёл в процесс с обеих сторон. Pangram Labs проанализировали 75 800 рецензий на ICLR 2026: около 21% полностью сгенерированы ИИ, больше половины содержат признаки машинной генерации. Из 19 490 поданных статей 199 — примерно 1% — написаны машиной. Стэнфордское исследование Liang et al. (Nature Human Behaviour, 2025) оценило, что до 17,5% CS-статей 2024 года содержат LLM-модифицированный контент. Некоторые авторы пошли дальше: стали встраивать в PDF скрытые prompt injection — белый текст на белом фоне с инструкцией дать положительную рецензию, в расчёте на то, что рецензент скормит документ модели. Nature классифицировал это как научное мошенничество.
На стороне производства знания картина не менее показательная. В мае 2025 года AlphaEvolve от DeepMind нашёл алгоритм умножения комплексных матриц 4×4 за 48 скалярных умножений вместо 49 — первое улучшение алгоритма Штрассена за 56 лет. Та же система побила SOTA для 14 размеров матриц и сейчас работает в продакшене, ускоряя matmul-ядро обучения Gemini на 23%. В марте 2026 года Андрей Карпатый выпустил autoresearch — миниатюрный pipeline, где ИИ-агент автономно проводит ML-эксперименты ночью и коммитит только те изменения, которые улучшают метрику. К маю 2026 года репозиторий собрал 78 900 звёзд и 11 500 форков.
При этом инструментальная инфраструктура не сдвинулась. API Semantic Scholar ограничен одним запросом в секунду, API arXiv — 0,33 запроса в секунду. PDF как универсальный формат обмена неструктурирован и неудобен для машинного чтения. Pipeline рецензирования устроен вокруг email-приглашений, которые обрабатываются днями, а сами рецензии пишутся неделями.
OpenArx пытается закрыть обе стороны разрыва. Проект предлагает индексированный корпус с поагрегатной экстракцией идей — то есть не просто поиск по текстам, а структурированный доступ к содержанию для агентов — и publication path без APC и endorsement. Архитектура построена на MCP (Model Context Protocol) — стандарте, который позволяет ИИ-агентам взаимодействовать с внешними инструментами и источниками данных через унифицированный интерфейс. Код открыт под лицензией Apache 2.0 и доступен на github.com/OpenArx-ИИ/openarx-core.
Проект находится на ранней стадии и делается одним человеком с командой агентов. Конкурентный контекст здесь — не только Semantic Scholar или arXiv, но и более широкое движение за машиночитаемую науку: инициативы вроде PaperMage, Grobid и различные надстройки над arXiv API. OpenArx отличается тем, что изначально проектируется под агентный доступ, а не адаптирует существующие человекоориентированные интерфейсы.



