Google представила двух ИИ-агентов для академических иллюстраций и рецензирования

Подготовлено редакцией Malakhov AI

Google Research Blog·8 апр.·2 минЛаборатории

Google Research опубликовала описание двух экспериментальных систем — PaperVizAgent и ScholarPeer — для автоматизации двух трудоёмких этапов научной работы: создания иллюстраций к статьям и рецензирования рукописей. PaperVizAgent набрал 60,2 балла из 100 по совокупной оценке, превысив установленный человеческий базис в 50 баллов.

Кратко

—PaperVizAgent генерирует готовые к публикации научные иллюстрации из текста рукописи, используя пять специализированных агентов.
—Система набрала 60,2 балла и стала единственным решением, превысившим человеческий базис в 50 баллов — выше GPT-Image-1.5 и Paper2Any.
—ScholarPeer автоматизирует рецензирование: агент-историк строит нарратив по актуальной литературе, а «разведчик» ищет пропущенные авторами базовые линии.
—Оба инструмента — экспериментальные прототипы и не предназначены для принятия редакционных решений.
—Google позиционирует разработки как часть более широкой программы по встраиванию ИИ-ассистентов в весь цикл научных публикаций.

Глоссарий · 5 терминов▾

Агентный фреймворк: Архитектура, в которой несколько ИИ-агентов выполняют специализированные подзадачи и взаимодействуют между собой для достижения общей цели.
LLM-судья: Языковая модель, используемая для автоматической оценки качества выходных данных другой модели по заданным критериям.
Peer review: Процедура экспертного рецензирования научной статьи независимыми специалистами перед её публикацией в журнале или на конференции.
Базовая линия (baseline): Существующий метод или модель, с которыми сравнивают новое решение, чтобы оценить прирост качества.
Итеративное уточнение: Процесс последовательного улучшения результата через повторяющиеся циклы генерации и критики.

Два болезненных места в жизни любого учёного — оформление иллюстраций и ожидание рецензий. Google Research предложила агентные системы для обоих случаев, опубликовав описание PaperVizAgent и ScholarPeer.

PaperVizAgent принимает на вход два элемента: методическую часть рукописи с техническими деталями и подпись к будущему рисунку, описывающую, что именно должна передавать иллюстрация. Дальше работает конвейер из пяти агентов. Retriever и planner собирают референсы из существующей литературы и структурируют содержание. Stylist формирует эстетические правила под академические стандарты. Visualizer либо рендерит изображение, либо генерирует исполняемый Python-код для статистических графиков. Наконец, critic сравнивает результат с исходным текстом и при обнаружении расхождений запускает цикл доработки.

На сравнительном тесте по шкале 0–100 (где 50 — уровень человека) PaperVizAgent набрал 60,2 балла. Конкуренты — GPT-Image-1.5, Nano-Banana-Pro и Paper2Any — остались ниже человеческого базиса. Особенно высокие оценки система получила за лаконичность и эстетику, а также показала конкурентоспособные результаты в генерации статистических графиков.

Система набрала 60,2 балла и стала единственным решением, превысившим человеческий базис в 50 баллов — выше GPT-Image-1.5 и Paper2Any.

ScholarPeer решает другую задачу — автоматическое рецензирование. Система работает по двухпотоковой схеме: один поток строит контекст, второй верифицирует утверждения авторов. Агент-историк субдомена динамически формирует нарратив на основе актуальных веб-источников, а «разведчик базовых линий» выступает в роли оппонента — специально ищет датасеты и сравнительные методы, которые авторы могли проигнорировать. Многоаспектный движок вопросов и ответов проверяет технические утверждения статьи. Итоговый отчёт включает резюме, сильные и слабые стороны работы, вопросы авторам — стандартный формат экспертной рецензии.

Актуальность задачи объясняется простой статистикой: число заявок на ведущие конференции по машинному обучению за последние пять лет выросло в несколько раз, тогда как пул квалифицированных рецензентов растёт значительно медленнее. Это порождает рецензентскую усталость и неравномерное качество оценок. ScholarPeer тестировался на публичных датасетах и показал значимое превосходство над другими автоматизированными системами рецензирования в попарных сравнениях, существенно сократив разрыв между ИИ-обратной связью и разнообразием человеческих оценок.

Оба инструмента Google называет экспериментальными прототипами. В официальном описании прямо указано, что автоматически сгенерированные рецензии и иллюстрации не должны служить основой для редакционных или публикационных решений. Тем не менее компания рассматривает PaperVizAgent и ScholarPeer как первые элементы будущей экосистемы ИИ-ассистентов, охватывающей весь жизненный цикл научной публикации.

Разобраться глубже

ИИ-агенты для бизнеса: что это и где применять

ИИ-агенты для бизнеса простыми словами: чем агент отличается от чат-бота, из каких четырёх частей собирается, какие бывают уровни автономности, карта из 10 сценариев применения, кейс сервисной компании и расчёт окупаемости агента поддержки.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ

По теме

Stripe на 26% ускорил compliance-проверки с помощью ИИ-агентов на AWS Bedrock

Продолжить по разделам

Google представила двух ИИ-агентов для академических иллюстраций и рецензирования

Кратко

Читать дальше

OpenAI оценила влияние ИИ на рынок труда стран Евросоюза

Palantir внедряет NVIDIA Nemotron для ИИ в госучреждениях США

Stripe на 26% ускорил compliance-проверки с помощью ИИ-агентов на AWS Bedrock