Плоский код от ИИ: автор Habr объясняет на примерах

Автор Habr, фрилансер, работающий с Claude Code, утверждает, что код, сгенерированный нейросетями, так же пуст и шаблонен, как тексты от ИИ, но заметить это может только инженер. Он приводит пример из Werkzeug, где наивный промпт пропускает критичный для Windows кейс.

На Habr опубликован разбор, в котором фрилансер, ежедневно работающий с Claude Code, анализирует качество кода, генерируемого большими языковыми моделями (LLM). Автор утверждает, что код, созданный нейросетями по наивным промптам, страдает той же «плоскостью», что и тексты: он грамматически верен, но лишён конкретики и не учитывает граничные случаи. Если в тексте посредственность видна многим, то в коде её замечает только инженер, умеющий читать код. Вайб-кодеры — люди без опыта разработки, полагающиеся на ИИ — не могут оценить качество и принимают видимость работающей системы за настоящую надёжность.

Автор предлагает методику сравнения: взять реальные функции из опенсорса и попросить LLM написать аналог по наивному промпту — такому, какой мог бы сформулировать не-разработчик. Главный тезис: разрыв между кодом сеньора и кодом вайб-кодера, сгенерированными одной и той же LLM, объясняется разницей в промптах. Сеньор молча знает о граничных случаях и учитывает их в запросе, а вайб-кодер даже не подозревает об их существовании.

В качестве первого примера приводится функция secure_filename из библиотеки Werkzeug (ядро Flask). Она преобразует имя файла в безопасное для сохранения на диск. Наивный промпт, скорее всего, сгенерирует функцию, которая просто удаляет недопустимые символы. Оригинал же содержит дополнительную логику: для Windows (nt) проверяет, не совпадает ли имя файла с зарезервированными именами устройств (например, CON, PRN). Если совпадает — название заменяется с добавлением подчёркивания. Этот кейс не очевиден для новичка, но критически важен для кроссплатформенности. Без него приложение может повести себя неожиданно на Windows.

Автор сравнивает ИИ-тексты и ИИ-код: оба выглядят правильно, но лишены конкретики и учёта граничных случаев.

Автор обещает ещё два примера, демонстрирующих более скрытые проблемы. Тем самым он иллюстрирует системный предел LLM: модель выдаёт локально корректный код, но глобально гнилой, а проверить его некому. Статья поднимает важный вопрос о доверии к ИИ-генерированному коду, особенно когда его используют люди без инженерного бэкграунда. Сам автор признаёт, что является частью этого рынка и не претендует на полную объективность. Однако его аргумент о том, что вайб-кодеры покупают не код, а видимость работающей системы, звучит убедительно на фоне растущей популярности инструментов вроде Claude Code и GitHub Copilot.

Плоский код от ИИ: автор Habr объясняет на примерах

Кратко

Читать дальше

Claude сгенерировал DatePicker на React: три дня доработок для WCAG-доступности

Stripe на 26% ускорил compliance-проверки с помощью ИИ-агентов на AWS Bedrock

Рыночная капитализация Micron приблизилась к Meta и Tesla на фоне дефицита памяти для ИИ