Два болезненных места в жизни любого учёного — оформление иллюстраций и ожидание рецензий. Google Research предложила агентные системы для обоих случаев, опубликовав описание PaperVizAgent и ScholarPeer.

PaperVizAgent принимает на вход два элемента: методическую часть рукописи с техническими деталями и подпись к будущему рисунку, описывающую, что именно должна передавать иллюстрация. Дальше работает конвейер из пяти агентов. Retriever и planner собирают референсы из существующей литературы и структурируют содержание. Stylist формирует эстетические правила под академические стандарты. Visualizer либо рендерит изображение, либо генерирует исполняемый Python-код для статистических графиков. Наконец, critic сравнивает результат с исходным текстом и при обнаружении расхождений запускает цикл доработки.

На сравнительном тесте по шкале 0–100 (где 50 — уровень человека) PaperVizAgent набрал 60,2 балла. Конкуренты — GPT-Image-1.5, Nano-Banana-Pro и Paper2Any — остались ниже человеческого базиса. Особенно высокие оценки система получила за лаконичность и эстетику, а также показала конкурентоспособные результаты в генерации статистических графиков.

Система набрала 60,2 балла и стала единственным решением, превысившим человеческий базис в 50 баллов — выше GPT-Image-1.5 и Paper2Any.

Google представила двух ИИ-агентов для академических иллюстраций и рецензирования
· Источник: Google Research Blog

ScholarPeer решает другую задачу — автоматическое рецензирование. Система работает по двухпотоковой схеме: один поток строит контекст, второй верифицирует утверждения авторов. Агент-историк субдомена динамически формирует нарратив на основе актуальных веб-источников, а «разведчик базовых линий» выступает в роли оппонента — специально ищет датасеты и сравнительные методы, которые авторы могли проигнорировать. Многоаспектный движок вопросов и ответов проверяет технические утверждения статьи. Итоговый отчёт включает резюме, сильные и слабые стороны работы, вопросы авторам — стандартный формат экспертной рецензии.

Актуальность задачи объясняется простой статистикой: число заявок на ведущие конференции по машинному обучению за последние пять лет выросло в несколько раз, тогда как пул квалифицированных рецензентов растёт значительно медленнее. Это порождает рецензентскую усталость и неравномерное качество оценок. ScholarPeer тестировался на публичных датасетах и показал значимое превосходство над другими автоматизированными системами рецензирования в попарных сравнениях, существенно сократив разрыв между ИИ-обратной связью и разнообразием человеческих оценок.

Оба инструмента Google называет экспериментальными прототипами. В официальном описании прямо указано, что автоматически сгенерированные рецензии и иллюстрации не должны служить основой для редакционных или публикационных решений. Тем не менее компания рассматривает PaperVizAgent и ScholarPeer как первые элементы будущей экосистемы ИИ-ассистентов, охватывающей весь жизненный цикл научной публикации.