ИИ-код дырявый: почему это не новая проблема и что с этим делать

Подготовлено редакцией Malakhov AI

Habr AI·16 июн.·3 минРоссияКод

Опрос, на который ссылаются в отраслевых публикациях, фиксирует: 70% разработчиков считают код, сгенерированный ИИ, небезопасным, при этом треть опрошенных деплоит его в продакшн без дополнительной проверки. Автор колонки на Habr настаивает: проблема не в GenAI, а в том, что индустрия забыла про инженерные практики, которые существовали задолго до языковых моделей.

Кратко

—70% разработчиков считают ИИ-генерированный код небезопасным, 30% деплоят его в прод без ревью.
—LLM галлюцинируют и рекомендуют несуществующие пакеты примерно в 20% случаев — этим пользуются злоумышленники (slopsquatting).
—ГОСТ Р 56939—2024 по безопасной разработке содержит чек-лист практик, применимых к любому коду, включая сгенерированный.
—Вайб-кодинг снижает порог входа, но не отменяет необходимость формировать требования, проводить ревью и обучать команду.
—Атаки через галлюцинации воспроизводимы: модель стабильно предлагает одно и то же несуществующее имя пакета, что упрощает злоумышленникам создание вредоносных компонентов.

Глоссарий · 7 терминов▾

GenAI: Генеративный ИИ — класс моделей, способных создавать текст, код, изображения и другой контент на основе запроса пользователя.
LLM: Large Language Model — большая языковая модель, обученная на текстовых данных и используемая для генерации и анализа текста и кода.
Slopsquatting: Атака, при которой злоумышленник регистрирует пакет с именем, которое LLM стабильно галлюцинирует, рассчитывая, что разработчик установит его по подсказке модели.
Вайб-кодинг: Практика разработки, при которой задача описывается на естественном языке, а сгенерированный ИИ код принимается с минимальной проверкой.
SCA (Software Composition Analysis): Автоматический анализ сторонних зависимостей проекта на наличие уязвимых или вредоносных компонентов.
ГОСТ Р 56939—2024: Российский национальный стандарт, описывающий практики разработки безопасного программного обеспечения.
Галлюцинации LLM: Уверенные, но фактически неверные ответы языковой модели — например, рекомендация несуществующего пакета или библиотеки.

Цифры из недавнего отраслевого опроса облетели технические медиа: 70% разработчиков не доверяют безопасности кода, который генерирует ИИ, однако 30% всё равно отправляют его в продакшн. Реакция отрасли предсказуема — волна материалов о том, как теперь выстраивать процессы разработки в эпоху генеративного ИИ.

Автор колонки на Habr, практикующий специалист по качеству ПО, занимает позицию, которую можно сформулировать коротко: ничего не изменилось. Проблема некачественного кода существовала до появления ChatGPT, Copilot и любого другого инструмента на основе LLM. Генеративный ИИ лишь ускорил производство кода — и вместе с ним ускорил накопление технического долга там, где процессы разработки были слабыми или отсутствовали вовсе.

Отдельного внимания заслуживает механизм, который специалисты называют slopsquatting. LLM галлюцинируют при рекомендации сторонних библиотек примерно в 20% случаев: модель уверенно называет пакет, которого не существует в реестре. Злоумышленники научились использовать эту особенность: они заранее регистрируют пакет с именем, которое модель стабильно воспроизводит, и ждут, пока разработчик установит его, доверившись подсказке ИИ-агента в IDE. Воспроизводимость галлюцинаций — то, что модель раз за разом предлагает одно и то же несуществующее имя — делает атаку предсказуемой и масштабируемой.

Что конкретно предлагает автор? Обратиться к ГОСТ Р 56939—2024 — российскому стандарту по разработке безопасного программного обеспечения. Если слово «ГОСТ» вызывает отторжение, суть та же: документ содержит чек-лист инженерных практик, применимых к любому проекту. Среди них — формирование требований к ПО до начала разработки, обучение сотрудников, процесс композиционного анализа зависимостей (Software Composition Analysis, SCA). Последнее особенно актуально именно сейчас: SCA позволяет автоматически проверять, какие сторонние пакеты попали в проект и нет ли среди них вредоносных или уязвимых компонентов.

Альтернативой ГОСТу автор называет методологию AppSec Table Top от Positive Technologies — более прикладной фреймворк с аналогичной логикой. Оба подхода исходят из одного принципа: безопасность и качество закладываются в процесс, а не добавляются постфактум.

Контекст шире одной колонки. Рост популярности вайб-кодинга — практики, при которой разработчик описывает задачу на естественном языке и принимает сгенерированный результат с минимальной проверкой — снижает средний уровень контроля над кодовой базой. Часть таких разработчиков не имеет достаточной квалификации для полноценного ревью; другая часть квалифицирована, но не считает себя ответственной за код, который «написала машина». Оба сценария приводят к одному результату: уязвимости уходят в прод.

Проблема не в том, что GenAI плохо пишет код. Проблема в том, что инструмент снизил воспринимаемую стоимость ошибки — и вместе с ней снизил мотивацию выстраивать контроль качества. Решение, как следует из материала, лежит не в плоскости технологий, а в плоскости организации работы команды.

Разобраться глубже

Как внедрить ИИ в бизнес в 2026 году: пошаговый план для руководителя

Практический гайд для руководителя: как выбрать первый проект с ИИ, подготовить данные, посчитать экономику и довести пилот до рабочего процесса.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ

По теме

NFC-ключ за $9: физический блокиратор отвлекающих приложений

Продолжить по разделам

ИИ-код дырявый: почему это не новая проблема и что с этим делать

Кратко

Читать дальше

Толстый и тонкий харнесс: принципы маршрутизации запросов ИИ-ассистента

ИИ-агенты ускорили научный софт в 60 раз, но не проверяют корректность науки

NFC-ключ за $9: физический блокиратор отвлекающих приложений