16 июня 2026 года исследователи лаборатории NVIDIA GEAR опубликовали статью с описанием ENPIRE — агентного фреймворка, который передаёт управление циклом обучения роботов непосредственно ИИ-агентам. Система уже показала, что роботизированные манипуляторы способны освоить задачи с высокой точностью позиционирования: вставку GPU в разъёмы на материнской плате и перерезание пластиковых стяжек.
Проблема, которую решает ENPIRE, хорошо известна в робототехнике: обучение с подкреплением на физических роботах требует непрерывного человеческого надзора. Инженер должен сбрасывать сцену после каждой попытки, проверять корректность выполнения задачи, корректировать алгоритм и следить за тем, чтобы параллельные эксперименты не конфликтовали. Это делает масштабирование дорогим и медленным. ENPIRE переносит всю эту работу на агентов.
| ИИ-агент | Модель | Разработчик |
|---|---|---|
| OpenAI Codex | GPT-5.5 | OpenAI |
| Claude Code | Opus 4.7 | Anthropic |
| Kimi Code | Kimi K2.6 | Moonshot AI |
Фреймворк состоит из четырёх модулей. Первый отвечает за автоматический сброс и верификацию задач — то, что раньше делал техник. Второй уточняет политики, управляющие поведением робота. Третий запускает параллельную оценку на нескольких физических роботах одновременно. Четвёртый анализирует логи сбоев, при необходимости обращается к научным статьям и вносит правки в код тренировочной инфраструктуры и алгоритмов. Цикл повторяется автономно: агент сам решает, какие изменения оставить, опираясь на динамику общего процента успеха.
Систему тестировали три агента: OpenAI Codex на GPT-5.5, Anthropic Claude Code на Opus 4.7 и Kimi Code на Kimi K2.6.

Для тестирования исследователи запустили три независимые команды агентов на базе разных моделей: OpenAI Codex с GPT-5.5, Anthropic Claude Code с Opus 4.7 и Moonshot ИИ Kimi Code с Kimi K2.6. Каждая команда разрабатывала собственный алгоритмический подход, проверяла его на реальном железе и итерировала. Авторы подчёркивают, что агентам был выделен «щедрый токенный бюджет» — это указывает на то, что стоимость вычислений пока остаётся существенным ограничением при масштабировании подхода.
Джим Фэн, директор по ИИ NVIDIA, описал происходящее в LinkedIn без лишней скромности: «Часть нашей лаборатории NVIDIA GEAR теперь неустанно самосовершенствуется по ночам. Утром мы просто читаем отчёты». Параллельно он пошутил, что цель такой автоматизации — уйти в отпуск так, чтобы CEO Дженсен Хуанг ничего не заметил.
Для отрасли это исследование обозначает направление, в котором движется роботехника: от ручного курирования экспериментов к полностью автономным лабораториям. Ключевое ограничение сегодня — стоимость токенов и необходимость физической инфраструктуры. Тем не менее команда намерена открыть исходный код ENPIRE, что позволит независимым исследователям и энтузиастам развернуть аналогичные установки самостоятельно. Если подход окажется воспроизводимым за пределами хорошо оснащённой корпоративной лаборатории, темп накопления данных для обучения роботов может существенно вырасти.
