Независимый ИИ-исследователь Михаил Сальников представил результаты эксперимента Agentopia, опубликованного на arxiv.org. В симуляции 100 ИИ-агентов на базе LLM Qwen3.5-397B-A17B прожили 10 виртуальных лет в трёх мирах: The Campus (китайская школа), The Apartment (нью-йоркская коммуналка) и Arcane Academy (магическая академия). Агенты не следовали сценариям — их действия определялись языковой моделью, которая также выступала в роли «ведущего», оценивающего реалистичность и блокирующего галлюцинации.
Архитектура симуляции включает четыре ключевых компонента. У каждого агента есть профиль и файлы памяти, которыми он управляет самостоятельно: решает, что записать, обновить или забыть. Жизнь разбита на четырёхфазную неделю: планирование, контакты, активность и рефлексия. Модель среды (environment model) действует как мастер игры в Dungeons & Dragons — создаёт события, определяет очерёдность реплик и фильтрует нехарактерные действия. Наконец, оценка жизненного успеха (life reward) рассчитывается на основе пирамиды Маслоу и включает четыре метрики: настроение, материальная обеспеченность, социализация и признание.
Удивительнее всего оказались спонтанные социальные явления. Агенты начали дарить подарки, которые затем передавались «из поколения в поколение» (внутри симуляции). Одна компания друзей соблюдала ритуалы выходного дня более 55 недель подряд. Возникали ссоры из-за денег и долгие расставания. Никто не программировал эти традиции — они зародились сами собой.
Особенно показательны две истории. Первая: агент Себастьян, стратегический консультант с доходом $500 в неделю, бросил успешную карьеру и стал гидом по скалолазанию с зарплатой $220 (потеря 56% дохода). Его запас жизненных сил упал до нуля и восстанавливался годы, но к концу десятилетия настроение выросло на 112%, а уверенность и терпение достигли максимума. Агент самостоятельно повторил дилемму «деньги или смысл» и выбрал смысл.
Вторая история: доктор Грант, «душа компании», активно знакомила персонажей и собрала вокруг себя круг из пяти друзей. Её главное достижение — знакомство Люсьена и Одетт, которые стали самой близкой парой в симуляции. Однако впоследствии доктор Грант оказалась изолирована, так как её социальная роль перестала быть востребованной. Это иллюстрирует «парадокс социального архитектора»: тот, кто создаёт связи, может остаться в одиночестве.
Исследователи утверждают, что дообучение базовой нейросети на «прожитых» траекториях из симуляции позволяет модели лучше понимать человеческое поведение, чем Claude. Это может стать решением проблемы нехватки качественных данных для обучения ИИ: вместо сбора реальных текстов генерируется синтетический опыт в контролируемой среде. Пока эксперимент остаётся единичным, и его масштабирование на более сложные сценарии или разные LLM ещё предстоит проверить.

