OpenArx: открытая инфраструктура для науки, где ИИ-агенты — полноправные участники

Подготовлено редакцией Malakhov AI

Habr AI·14 мая·4 минРоссияКод

Claude Opus 4.6 за час решил математическую задачу, над которой Дональд Кнут работал несколько недель — и этот факт стал отправной точкой для проекта OpenArx, open-source инфраструктуры, которая перестраивает научный процесс под режим совместной работы людей и ИИ-агентов.

Кратко

—21% рецензий на ICLR 2026 полностью сгенерированы ИИ, ещё больше половины содержат следы машинной генерации.
—AlphaEvolve от DeepMind впервые за 56 лет улучшил алгоритм Штрассена, ускорив matmul-ядро обучения Gemini на 23%.
—Подачи в arXiv в 2025 году достигали 25 900 в месяц — темп, который peer review и человеческое внимание не успевают обрабатывать.
—APC за публикацию в Nature составляет $12 690, а глобальные выплаты шести крупнейшим open-access издателям выросли с $910 млн до $2,54 млрд за четыре года.
—OpenArx — Apache 2.0, MCP-инфраструктура с индексированным корпусом и publication path без APC и endorsement, разрабатывается одним человеком с командой агентов.

Глоссарий · 7 терминов▾

MCP (Model Context Protocol): Стандартный протокол, позволяющий ИИ-агентам обращаться к внешним инструментам, базам данных и сервисам через единый унифицированный интерфейс.
APC (Article Processing Charge): Плата, которую автор вносит издателю за публикацию статьи в открытом доступе вместо традиционной подписной модели.
Peer review: Процедура рецензирования научной статьи независимыми экспертами в той же области перед публикацией в журнале или на конференции.
Prompt injection: Атака на языковую модель, при которой в обрабатываемый текст встраиваются скрытые инструкции, переопределяющие исходное задание модели.
AlphaEvolve: Система DeepMind, использующая эволюционный поиск с помощью LLM для автоматического открытия и улучшения алгоритмов.
SOTA (State of the Art): Лучший результат, достигнутый на данный момент по конкретной задаче или benchmark среди всех известных методов.
matmul: Операция матричного умножения — одна из ключевых вычислительных операций при обучении нейронных сетей.

Дональд Кнут — автор «Искусства программирования» и человек, чьё имя в computer science синонимично строгости — в феврале 2026 года разместил на своей странице в Стэнфорде короткую запись: Claude Opus 4.6 за 31 итерацию, примерно за час, решил открытую задачу, над которой сам Кнут работал несколько недель. Он добавил, что ему придётся пересмотреть своё мнение о генеративном ИИ.

Этот эпизод стал отправной точкой для проекта OpenArx — открытой MCP-инфраструктуры, которую один разработчик строит вместе с командой ИИ-агентов. Суть проекта: существующая научная инфраструктура создавалась под режим «один человек читает один PDF». Этот режим перестаёт быть основным, а инструменты под новый режим никто системно не собирал.

Метрика	Значение	Контекст
Подачи в arXiv (пик, окт. 2025)	25 900 в месяц	Предыдущий пик — 24 226 (окт. 2024)
Подачи в NeurIPS 2025	21 575	В 2020 году — 9 467
Рецензии ICLR 2026, сгенерированные ИИ	~21%	Из 75 800 проанализированных рецензий
APC в Nature	$12 690	APC в PLOS ONE — $1 931
Глобальные выплаты по APC (2023)	$2,54 млрд	В 2019 году — $910 млн
Медианное время до финального решения	198 дней	Медиана до первого решения — 60 дней
Случайность peer review (NeurIPS 2021)	50,6%	Доля работ, принятых одним комитетом и отклонённых другим
Звёзды репозитория autoresearch (май 2026)	78 900	11 500 форков, 8,6 млн просмотров анонс-твита

Чтобы понять, зачем это нужно, достаточно посмотреть на цифры. Подачи в arXiv в 2025 году колебались от 18 000 до 25 900 в месяц — оба пика сентября и октября 2025-го превысили предыдущий рекорд. Подачи в NeurIPS удвоились с 2020 по 2025 год: с 9 467 до 21 575. Скорость производства научных текстов растёт, а инфраструктура рецензирования и распространения осталась прежней.

AlphaEvolve от DeepMind впервые за 56 лет улучшил алгоритм Штрассена, ускорив matmul-ядро обучения Gemini на 23%.

Peer review при этом работает с хорошо задокументированными сбоями. Естественный эксперимент NeurIPS 2021 показал: 50,6% работ, принятых одним независимым комитетом, были отклонены другим. Половина решений accept/reject статистически случайна. Медианное время от подачи до финального решения — 198 дней. Доля принятых приглашений рецензировать упала с 56% в 2003 году до 35,7% в 2024-м. Параллельно APC — плата автора за публикацию в open-access журнале — в Nature составляет $12 690, при том что годовая стипендия аспиранта в США — $25–35 тыс. Глобальные выплаты шести крупнейшим open-access издателям выросли с $910 млн в 2019 году до $2,54 млрд в 2023-м.

И это фон, на котором ИИ уже вошёл в процесс с обеих сторон. Pangram Labs проанализировали 75 800 рецензий на ICLR 2026: около 21% полностью сгенерированы ИИ, больше половины содержат признаки машинной генерации. Из 19 490 поданных статей 199 — примерно 1% — написаны машиной. Стэнфордское исследование Liang et al. (Nature Human Behaviour, 2025) оценило, что до 17,5% CS-статей 2024 года содержат LLM-модифицированный контент. Некоторые авторы пошли дальше: стали встраивать в PDF скрытые prompt injection — белый текст на белом фоне с инструкцией дать положительную рецензию, в расчёте на то, что рецензент скормит документ модели. Nature классифицировал это как научное мошенничество.

На стороне производства знания картина не менее показательная. В мае 2025 года AlphaEvolve от DeepMind нашёл алгоритм умножения комплексных матриц 4×4 за 48 скалярных умножений вместо 49 — первое улучшение алгоритма Штрассена за 56 лет. Та же система побила SOTA для 14 размеров матриц и сейчас работает в продакшене, ускоряя matmul-ядро обучения Gemini на 23%. В марте 2026 года Андрей Карпатый выпустил autoresearch — миниатюрный pipeline, где ИИ-агент автономно проводит ML-эксперименты ночью и коммитит только те изменения, которые улучшают метрику. К маю 2026 года репозиторий собрал 78 900 звёзд и 11 500 форков.

При этом инструментальная инфраструктура не сдвинулась. API Semantic Scholar ограничен одним запросом в секунду, API arXiv — 0,33 запроса в секунду. PDF как универсальный формат обмена неструктурирован и неудобен для машинного чтения. Pipeline рецензирования устроен вокруг email-приглашений, которые обрабатываются днями, а сами рецензии пишутся неделями.

OpenArx пытается закрыть обе стороны разрыва. Проект предлагает индексированный корпус с поагрегатной экстракцией идей — то есть не просто поиск по текстам, а структурированный доступ к содержанию для агентов — и publication path без APC и endorsement. Архитектура построена на MCP (Model Context Protocol) — стандарте, который позволяет ИИ-агентам взаимодействовать с внешними инструментами и источниками данных через унифицированный интерфейс. Код открыт под лицензией Apache 2.0 и доступен на github.com/OpenArx-ИИ/openarx-core.

Проект находится на ранней стадии и делается одним человеком с командой агентов. Конкурентный контекст здесь — не только Semantic Scholar или arXiv, но и более широкое движение за машиночитаемую науку: инициативы вроде PaperMage, Grobid и различные надстройки над arXiv API. OpenArx отличается тем, что изначально проектируется под агентный доступ, а не адаптирует существующие человекоориентированные интерфейсы.

Разобраться глубже

ИИ-агенты для бизнеса: что это и где применять

ИИ-агенты для бизнеса простыми словами: чем агент отличается от чат-бота, из каких четырёх частей собирается, какие бывают уровни автономности, карта из 10 сценариев применения, кейс сервисной компании и расчёт окупаемости агента поддержки.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ

По теме

Palantir внедряет NVIDIA Nemotron для ИИ в госучреждениях США

Продолжить по разделам

OpenArx: открытая инфраструктура для науки, где ИИ-агенты — полноправные участники

Кратко

Читать дальше

VK вылетел из App Store, а в России готовят регулирование ИИ

«Яндекс» запустил платформу для создания ИИ-агентов в «Алисе ИИ»

Palantir внедряет NVIDIA Nemotron для ИИ в госучреждениях США