Agentopia: симуляция жизни 100 ИИ-агентов на 10 лет с LLM Qwen

Подготовлено редакцией Malakhov AI

Habr AI·14 июн.·2 минРоссияКод

Независимый исследователь Михаил Сальников опубликовал статью о симуляции Agentopia, в которой 100 ИИ-агентов на базе Qwen3.5-397B-A17B прожили 10 виртуальных лет в трех мирах без скриптованных сценариев. Агенты самостоятельно формировали социальные связи, меняли карьеру и демонстрировали эмоциональные реакции, включая выгорание.

Кратко

—В симуляции Agentopia 100 ИИ-агентов прожили 10 лет в трех виртуальных мирах, управляемых одной LLM (Qwen3.5-397B-A17B).
—Архитектура включает четыре компонента: агент с файлами памяти, четырехфазный недельный цикл, модель среды-ведущего и оценку жизненного успеха.
—Агенты спонтанно создавали ритуалы, дарили подарки, передаваемые «по наследству», и вступали в конфликты из-за денег.
—Зафиксированы случаи выбора смысла работы над доходом: один агент сменил карьеру с $500 до $220 в неделю ради скалолазания.
—Автор утверждает, что дообучение базовой нейросети на синтетических данных из симуляции улучшает понимание человечности по сравнению с Claude.

Глоссарий · 3 термина▾

LLM: Large Language Model — большая языковая модель, нейросеть, обученная на текстах для генерации и понимания языка.
синтетические данные: Искусственно сгенерированные данные, используемые для обучения моделей, когда реальных данных недостаточно.
пирамида Маслоу: Теория мотивации, иерархия потребностей человека от базовых (еда, безопасность) до самореализации.

Независимый ИИ-исследователь Михаил Сальников представил результаты эксперимента Agentopia, опубликованного на arxiv.org. В симуляции 100 ИИ-агентов на базе LLM Qwen3.5-397B-A17B прожили 10 виртуальных лет в трёх мирах: The Campus (китайская школа), The Apartment (нью-йоркская коммуналка) и Arcane Academy (магическая академия). Агенты не следовали сценариям — их действия определялись языковой моделью, которая также выступала в роли «ведущего», оценивающего реалистичность и блокирующего галлюцинации.

Архитектура симуляции включает четыре ключевых компонента. У каждого агента есть профиль и файлы памяти, которыми он управляет самостоятельно: решает, что записать, обновить или забыть. Жизнь разбита на четырёхфазную неделю: планирование, контакты, активность и рефлексия. Модель среды (environment model) действует как мастер игры в Dungeons & Dragons — создаёт события, определяет очерёдность реплик и фильтрует нехарактерные действия. Наконец, оценка жизненного успеха (life reward) рассчитывается на основе пирамиды Маслоу и включает четыре метрики: настроение, материальная обеспеченность, социализация и признание.

Удивительнее всего оказались спонтанные социальные явления. Агенты начали дарить подарки, которые затем передавались «из поколения в поколение» (внутри симуляции). Одна компания друзей соблюдала ритуалы выходного дня более 55 недель подряд. Возникали ссоры из-за денег и долгие расставания. Никто не программировал эти традиции — они зародились сами собой.

Особенно показательны две истории. Первая: агент Себастьян, стратегический консультант с доходом $500 в неделю, бросил успешную карьеру и стал гидом по скалолазанию с зарплатой $220 (потеря 56% дохода). Его запас жизненных сил упал до нуля и восстанавливался годы, но к концу десятилетия настроение выросло на 112%, а уверенность и терпение достигли максимума. Агент самостоятельно повторил дилемму «деньги или смысл» и выбрал смысл.

Вторая история: доктор Грант, «душа компании», активно знакомила персонажей и собрала вокруг себя круг из пяти друзей. Её главное достижение — знакомство Люсьена и Одетт, которые стали самой близкой парой в симуляции. Однако впоследствии доктор Грант оказалась изолирована, так как её социальная роль перестала быть востребованной. Это иллюстрирует «парадокс социального архитектора»: тот, кто создаёт связи, может остаться в одиночестве.

Исследователи утверждают, что дообучение базовой нейросети на «прожитых» траекториях из симуляции позволяет модели лучше понимать человеческое поведение, чем Claude. Это может стать решением проблемы нехватки качественных данных для обучения ИИ: вместо сбора реальных текстов генерируется синтетический опыт в контролируемой среде. Пока эксперимент остаётся единичным, и его масштабирование на более сложные сценарии или разные LLM ещё предстоит проверить.

Разобраться глубже

ИИ-агенты для бизнеса: что это и где применять

ИИ-агенты для бизнеса простыми словами: чем агент отличается от чат-бота, из каких четырёх частей собирается, какие бывают уровни автономности, карта из 10 сценариев применения, кейс сервисной компании и расчёт окупаемости агента поддержки.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ

По теме

NFC-ключ за $9: физический блокиратор отвлекающих приложений

Продолжить по разделам

Agentopia: симуляция жизни 100 ИИ-агентов на 10 лет с LLM Qwen

Кратко

Читать дальше

Толстый и тонкий харнесс: принципы маршрутизации запросов ИИ-ассистента

ИИ-агенты ускорили научный софт в 60 раз, но не проверяют корректность науки

NFC-ключ за $9: физический блокиратор отвлекающих приложений