Автономные ИИ-агенты, которые работают без участия пользователя, — не новая идея, но до недавнего времени их запуск требовал либо корпоративной инфраструктуры, либо серьёзных технических компромиссов. Hermes Agent от Nous Research предлагает третий путь: open-source решение, которое разворачивается на бюджетном VPS, подключается к любому LLM через API и умеет накапливать опыт между сессиями.
Архитектурно Hermes устроен как оркестратор четырёх слоёв. Шлюзы (gateways) — это каналы общения с пользователем: Telegram, SSH-cli и другие мессенджеры. Инструменты (tools) — модули для взаимодействия с внешним миром: SSH-вызовы, управление файлами, headless-браузер на базе Chrome, синтез и распознавание речи, планировщик Cron, интеграции с умным домом. Навыки (skills) — сохранённые промпты с критериями активации и готовыми последовательностями действий, которые агент может переиспользовать. Наконец, LLM API — подключаемые языковые модели от любого провайдера, от флагманских до бюджетных.
| Компонент | Потребление RAM | Примечание |
|---|---|---|
| Один инстанс Hermes | ~210 МБ | Базовая нагрузка |
| faster-whisper STT (модель base) | ~540 МБ | Быстро выгружается после использования |
| Headless Chrome | 600+ МБ | Зависит от веса сайта; самый прожорливый компонент |
Ключевое отличие от локальных агентов вроде Claude Code или Gemini CLI — постоянная доступность. Локальный агент работает только пока открыт ноутбук; Hermes на VPS отвечает на запросы и выполняет задачи по расписанию круглосуточно. Самообучение реализовано через механизм skills: агент выполняет задачу в диалоге, находит рабочее решение и сохраняет его как навык для следующих запросов. По опыту автора материала, механизм работает, но требует контроля — особенно при использовании бюджетных моделей, которые могут сохранять некорректные паттерны.
Минимальные требования к серверу: 1 vCPU, 2 GB RAM, 20 GB диска — один инстанс занимает около 210 МБ памяти.
Главный конкурент на этом рынке — OpenClaw, который появился раньше. Автор отказался от него из-за двух проблем: раздутая кодовая база (более 400 тысяч строк) и уязвимость к prompt injection — атаке, при которой вредоносный контент из внешних источников заставляет агента выполнять нежелательные команды. Hermes решает обе проблемы: встроенный сканер проверяет входящие данные на признаки инъекций, а Docker-изоляция позволяет запретить агенту влиять на хост-сервер.
По железу требования скромные: 1 vCPU, 2 GB RAM, 20 GB диска. Один инстанс Hermes занимает около 210 МБ памяти. Самый прожорливый компонент — headless Chrome, который при работе с тяжёлыми сайтами потребляет 600+ МБ; именно из-за него 1 GB RAM не хватает. Встроенное распознавание речи на базе faster-whisper с моделью base занимает 540 МБ, но автор заменил его на облачный STT от Groq — быстрее и без нагрузки на сервер. Чистая Ubuntu с Hermes и всеми зависимостями занимает от 10 до 15 GB диска.
Вопрос выбора LLM-провайдера для российского пользователя упирается в географию: большинство западных API недоступны из России из-за санкционных ограничений. Автор решил проблему, разместив VPS во Франции — это даёт доступ к западным провайдерам при приемлемом пинге из России. Российские альтернативы — YandexGPT и GigaChat — он считает непрактичными для личных задач из-за высоких цен и рисков утечки данных. Конкретный сервер работает на хостинге petrosky за 7€ в месяц с оплатой криптовалютой без KYC и заявленным отсутствием оверселла ресурсов.
Автор описывает четыре реальных сценария использования: мониторинг VPS, исследование тем через YouTube, фильтрация фриланс-заказов с генерацией черновика ответа и семейный Telegram-бот для списка покупок. Набор намеренно разнородный — чтобы показать диапазон задач, с которыми справляется агент. Общий вывод: Hermes закрывает нишу между одноразовыми скриптами и корпоративными агентными платформами для тех, кто хочет контролировать собственную инфраструктуру и данные.


