ICLR 2026 в Рио: агенты, кризис рецензий и 19 тысяч заявок

Подготовлено редакцией Malakhov AI

Habr AI·19 мая·3 минРоссияКод

В конце апреля в Рио-де-Жанейро прошла ICLR 2026 — одна из трёх ведущих конференций по машинному обучению: число поданных работ приблизилось к 19 тысячам, а исследователи AIRI привезли репортаж о главных трендах. Центральной темой стали ИИ-агенты — их обучение, оценка и инфраструктура.

Кратко

—На ICLR 2026 подано около 19 тысяч работ, принято чуть более 5 тысяч — доля приёма составила 27%.
—Оргкомитет отклонил около 2% заявок из-за сгенерированного LLM контента и галлюцинаций в ссылках.
—Главный научный тренд конференции — ИИ-агенты: автогенерация задач, унификация сред обучения и новые метрики оценки.
—Фреймворк GEM от Alibaba предлагает единый интерфейс для 24 сред — аналог OpenAI Gym для языковых агентов.
—Инцидент на платформе OpenReview раскрыл авторство рецензий, часть рецензентов начала менять оценки — конференция временно заморозила эту возможность.

Глоссарий · 7 терминов▾

ICLR: International Conference on Learning Representations — ежегодная международная конференция по глубокому обучению, входящая в «большую тройку» наряду с NeurIPS и ICML.
LLM: Large Language Model — большая языковая модель, обученная на текстах и способная генерировать связный текст, отвечать на вопросы и выполнять инструкции.
ИИ-агент: Программная система на основе языковой модели, способная самостоятельно планировать и выполнять многошаговые задачи, взаимодействуя с внешними инструментами или средой.
benchmark: Стандартизированный набор задач и метрик для сравнительной оценки моделей или систем.
OpenReview: Платформа для открытого рецензирования научных статей, которую используют многие ML-конференции, включая ICLR.
OpenAI Gym: Библиотека стандартизированных сред для обучения агентов с подкреплением, ставшая де-факто стандартом в классическом RL.
MCP: Model Context Protocol — открытый протокол для подключения языковых моделей к внешним инструментам и источникам данных.

ICLR 2026 стала 14-й по счёту в серии и впервые прошла в Южной Америке — в выставочном комплексе Риосентро в районе Жакарапегуа. Конференция длилась пять дней: три дня основного трека и два дня воркшопов. Для сравнения, AAAI 2026 при меньшем числе принятых работ занял восемь дней, так что программа в Рио оказалась крайне насыщенной.

ICLR расшифровывается как International Conference on Learning Representations — конференция по выучиванию внутренних представлений данных. Она моложе своих соседей по «большой тройке» (NeurIPS и ICML стартовали ещё в 1980-х), но быстро расширила тематику на всё глубокое обучение и стала одной из самых престижных площадок в области. Публикация на таких конференциях в ML-сообществе традиционно ценится выше, чем статья в журнале первого квартиля.

Работа	Авторы / организация	Суть подхода
AUTOPLAY	Ramrakhya et al., Apple	Агент играет с интерфейсами и генерирует ~20 тысяч задач в обратном направлении: от состояния к инструкции
Don't Just Fine-tune the Agent, Tune the Environment	Lu et al.	Агент обучается через активное исследование адаптивной среды вместо дообучения на записанных демонстрациях
GEM	Alibaba	Унифицированный фреймворк с 24 средами, асинхронной генерацией опыта и поддержкой инструментов для языковых агентов
VitaBench	Han et al.	Бенчмарк на задачах из реальных приложений с комбинированием инструментов и неоднозначными запросами

На церемонии открытия оргкомитет сообщил: число поданных работ приблизилось к 19 тысячам — это рекорд серии. Принято чуть более 5 тысяч, доля приёма составила около 27% и практически не менялась несколько лет. Число рецензентов превысило число поданных статей.

Оргкомитет отклонил около 2% заявок из-за сгенерированного LLM контента и галлюцинаций в ссылках.

Однако за этой статистикой скрывается острая проблема. Всё больше статей и рецензий создаётся с помощью LLM, и организаторам пришлось массово проверять материалы на сгенерированный контент, выявлять галлюцинации — в частности, ссылки на несуществующие публикации. В итоге около 2% всех заявок было отклонено. Ситуацию обострил инцидент на платформе OpenReview: из-за ошибки в API любой желающий мог связать рецензию с её автором. Часть рецензентов начала корректировать свои оценки, и конференция временно заморозила такую возможность, пообещав санкции тем, кто использует утечку для сведения счётов.

Главной научной темой конференции стали ИИ-агенты — автономные системы, способные выполнять многошаговые задачи, взаимодействуя со средой. Исследователи AIRI выделили три устойчивых тренда в этой области.

Первый — автоматическая генерация задач вместо ручной разметки. Размечать тысячи многошаговых сценариев вручную дорого и медленно, а аннотатор не охватит весь спектр возможных ситуаций. Работа AUTOPLAY (Ramrakhya et al., Apple) предлагает иной подход: агент «играет» с мобильными и десктопными интерфейсами, фиксирует достигнутые состояния и формулирует задачи в обратном направлении — от результата к инструкции. Таким способом авторам удалось сгенерировать около 20 тысяч задач. Схожую идею развивает работа «Don't Just Fine-tune the Agent, Tune the Environment» (Lu et al.): вместо дообучения на записанных демонстрациях агент обучается через активное исследование, а среда адаптируется, создавая задачи нужной сложности.

Второй тренд — стандартизация инфраструктуры. Существующие среды для обучения агентов фрагментированы: разные интерфейсы, несовместимые форматы наблюдений. Фреймворк GEM от Alibaba предлагает унифицированный интерфейс с набором из 24 сред, асинхронной генерацией опыта и поддержкой инструментов — Python-интерпретатора, веб-поиска и MCP. По замыслу авторов, GEM должен сыграть для языковых агентов ту же роль, что OpenAI Gym сыграл для классического обучения с подкреплением.

Третий тренд — переосмысление метрик оценки. Бинарное «решил / не решил» перестаёт устраивать сообщество. Бенчмарк VitaBench (Han et al.) оценивает агентов на задачах из реальных приложений, где требуется комбинировать взаимосвязанные инструменты и обрабатывать неоднозначные запросы.

С точки зрения организации конференция оставила смешанные впечатления. Комплекс Риосентро сочетал индустриальный брутализм с природными мотивами — пальмы, зелёные лужайки, пруд с цаплями. Но логистика подвела: фудкорт из привозных вагончиков не справлялся с потоком участников, а постерные сессии проходили в залах такого масштаба, что обойти их целиком было физически затруднительно.

Разобраться глубже

ИИ-агенты для бизнеса: что это и где применять

ИИ-агенты для бизнеса простыми словами: чем агент отличается от чат-бота, из каких четырёх частей собирается, какие бывают уровни автономности, карта из 10 сценариев применения, кейс сервисной компании и расчёт окупаемости агента поддержки.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ