ICLR 2026 стала 14-й по счёту в серии и впервые прошла в Южной Америке — в выставочном комплексе Риосентро в районе Жакарапегуа. Конференция длилась пять дней: три дня основного трека и два дня воркшопов. Для сравнения, AAAI 2026 при меньшем числе принятых работ занял восемь дней, так что программа в Рио оказалась крайне насыщенной.
ICLR расшифровывается как International Conference on Learning Representations — конференция по выучиванию внутренних представлений данных. Она моложе своих соседей по «большой тройке» (NeurIPS и ICML стартовали ещё в 1980-х), но быстро расширила тематику на всё глубокое обучение и стала одной из самых престижных площадок в области. Публикация на таких конференциях в ML-сообществе традиционно ценится выше, чем статья в журнале первого квартиля.
| Работа | Авторы / организация | Суть подхода |
|---|---|---|
| AUTOPLAY | Ramrakhya et al., Apple | Агент играет с интерфейсами и генерирует ~20 тысяч задач в обратном направлении: от состояния к инструкции |
| Don't Just Fine-tune the Agent, Tune the Environment | Lu et al. | Агент обучается через активное исследование адаптивной среды вместо дообучения на записанных демонстрациях |
| GEM | Alibaba | Унифицированный фреймворк с 24 средами, асинхронной генерацией опыта и поддержкой инструментов для языковых агентов |
| VitaBench | Han et al. | Бенчмарк на задачах из реальных приложений с комбинированием инструментов и неоднозначными запросами |
На церемонии открытия оргкомитет сообщил: число поданных работ приблизилось к 19 тысячам — это рекорд серии. Принято чуть более 5 тысяч, доля приёма составила около 27% и практически не менялась несколько лет. Число рецензентов превысило число поданных статей.
Оргкомитет отклонил около 2% заявок из-за сгенерированного LLM контента и галлюцинаций в ссылках.
Однако за этой статистикой скрывается острая проблема. Всё больше статей и рецензий создаётся с помощью LLM, и организаторам пришлось массово проверять материалы на сгенерированный контент, выявлять галлюцинации — в частности, ссылки на несуществующие публикации. В итоге около 2% всех заявок было отклонено. Ситуацию обострил инцидент на платформе OpenReview: из-за ошибки в API любой желающий мог связать рецензию с её автором. Часть рецензентов начала корректировать свои оценки, и конференция временно заморозила такую возможность, пообещав санкции тем, кто использует утечку для сведения счётов.
Главной научной темой конференции стали ИИ-агенты — автономные системы, способные выполнять многошаговые задачи, взаимодействуя со средой. Исследователи AIRI выделили три устойчивых тренда в этой области.
Первый — автоматическая генерация задач вместо ручной разметки. Размечать тысячи многошаговых сценариев вручную дорого и медленно, а аннотатор не охватит весь спектр возможных ситуаций. Работа AUTOPLAY (Ramrakhya et al., Apple) предлагает иной подход: агент «играет» с мобильными и десктопными интерфейсами, фиксирует достигнутые состояния и формулирует задачи в обратном направлении — от результата к инструкции. Таким способом авторам удалось сгенерировать около 20 тысяч задач. Схожую идею развивает работа «Don't Just Fine-tune the Agent, Tune the Environment» (Lu et al.): вместо дообучения на записанных демонстрациях агент обучается через активное исследование, а среда адаптируется, создавая задачи нужной сложности.
Второй тренд — стандартизация инфраструктуры. Существующие среды для обучения агентов фрагментированы: разные интерфейсы, несовместимые форматы наблюдений. Фреймворк GEM от Alibaba предлагает унифицированный интерфейс с набором из 24 сред, асинхронной генерацией опыта и поддержкой инструментов — Python-интерпретатора, веб-поиска и MCP. По замыслу авторов, GEM должен сыграть для языковых агентов ту же роль, что OpenAI Gym сыграл для классического обучения с подкреплением.
Третий тренд — переосмысление метрик оценки. Бинарное «решил / не решил» перестаёт устраивать сообщество. Бенчмарк VitaBench (Han et al.) оценивает агентов на задачах из реальных приложений, где требуется комбинировать взаимосвязанные инструменты и обрабатывать неоднозначные запросы.
С точки зрения организации конференция оставила смешанные впечатления. Комплекс Риосентро сочетал индустриальный брутализм с природными мотивами — пальмы, зелёные лужайки, пруд с цаплями. Но логистика подвела: фудкорт из привозных вагончиков не справлялся с потоком участников, а постерные сессии проходили в залах такого масштаба, что обойти их целиком было физически затруднительно.



