Для безопасного исполнения кода LLM-агентам нужна изолированная среда

Подготовлено редакцией Malakhov AI

Habr AI·11 июн.·2 минРоссияКод

ML-разработчик Евгений в статье на Habr объяснил, почему LLM-агентам необходима изолированная среда для исполнения кода, и перечислил основные риски, связанные с выполнением сгенерированного моделью кода.

Кратко

—LLM-агенты могут выполнять код, что несёт риски: удаление данных, утечка секретов, сетевой доступ, перегрузка ресурсов и промпт-инъекции.
—Песочница (sandbox) — изолированная среда с ограничениями на файловую систему, сеть и ресурсы, необходимая для безопасного исполнения.
—Код от агента нельзя считать доверенным, так как он генерируется вероятностной моделью и не проходит ревью, особенно в ReAct-цикле.
—Статья — первая часть материала; вторая будет посвящена практической реализации агента с Docker Sandbox на open-source LLM.

Глоссарий · 3 термина▾

промпт-инъекция: Атака, при которой вредоносная инструкция внедряется в входные данные модели, заставляя её выполнять нежелательные действия.
ReAct-цикл: Методология построения агентов, где модель чередует рассуждение (reasoning) и выполнение действий (acting) для решения задачи.
песочница (sandbox): Изолированная среда выполнения, ограничивающая доступ к ресурсам системы (файлы, сеть, память) для безопасного запуска недоверенного кода.

Современные LLM-агенты не ограничиваются генерацией текста: они могут выполнять действия — читать файлы, изменять данные, отправлять запросы в сеть. Для этого модели генерируют код, который исполняется в процессе решения задачи. Однако такой код несёт риски, описанные ML-разработчиком Евгением в статье на Habr: от случайного удаления данных до целенаправленных атак через промпт-инъекции.

Евгений выделяет несколько категорий рисков. Во-первых, код может получить доступ к файловой системе, например, удалить не ту директорию или прочитать служебные файлы с секретами. Во-вторых, возможна утечка данных через переменные окружения. В-третьих, при наличии сетевого доступа данные могут быть отправлены на сторонний сервер. Кроме того, код может создать избыточную нагрузку на CPU, загрузить огромный датасет или установить пакеты из недостоверных источников. Отдельная угроза — промпт-инъекция: вредоносная инструкция, встроенная в пользовательский файл или веб-страницу, может заставить агента выполнить нежелательные действия, такие как отправка API-ключей на внешний сервер.

Риск	Описание
Удаление данных	Модель может случайно удалить файлы, ошибившись в пути, или намеренно уничтожить данные.
Утечка секретов	Код может получить доступ к .env или конфигурационным файлам и отправить их по сети.
Сетевой доступ	При наличии доступа в интернет данные могут быть переданы на сторонний сервер.
Избыточное использование ресурсов	Бесконечный цикл или загрузка большого датасета могут перегрузить CPU и память.
Загрузка пакетов из недостоверных источников	Модель может установить вредоносный пакет через pip install или curl.
Промпт-инъекция	Вредоносная инструкция в пользовательском файле может заставить агента выполнить опасные действия.

Для защиты от этих рисков агентам требуется песочница (sandbox) — изолированная среда с заранее заданными ограничениями. Золотое правило, по мнению автора: любой код от агента следует считать потенциально опасным, поэтому его исполнение необходимо ограничивать. Песочница должна предоставлять только те файлы, которые явно переданы агенту, ограничивать сетевой доступ, контролировать использование ресурсов и запрещать установку непроверенных пакетов. Важно, что код генерируется вероятностной моделью и не проходит человеческое ревью, особенно в ReAct-цикле, где агент может выполнить несколько последовательных действий, каждое из которых зависит от предыдущего.

Автор упоминает Docker как инструмент для создания песочницы, что позволяет гибко настраивать изоляцию. Статья является первой частью материала: в ней разобрана теория — что такое песочница, какие риски она предотвращает и какие бывают подходы к реализации. Практическая часть — создание агента с Docker Sandbox на open-source LLM — будет опубликована позже. Материал будет полезен разработчикам, которые внедряют LLM-агентов в продуктивные среды и хотят минимизировать риски безопасности.

Разобраться глубже

Как внедрить ИИ в бизнес в 2026 году: пошаговый план для руководителя

Практический гайд для руководителя: как выбрать первый проект с ИИ, подготовить данные, посчитать экономику и довести пилот до рабочего процесса.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ

По теме

NFC-ключ за $9: физический блокиратор отвлекающих приложений

Продолжить по разделам

Для безопасного исполнения кода LLM-агентам нужна изолированная среда

Кратко

Читать дальше

Толстый и тонкий харнесс: принципы маршрутизации запросов ИИ-ассистента

ИИ-агенты ускорили научный софт в 60 раз, но не проверяют корректность науки

NFC-ключ за $9: физический блокиратор отвлекающих приложений