Джордж Хотц — программист, известный взломом PlayStation 3 и основанием comma.ai, — опубликовал пост «The Eternal Sloptember», в котором назвал повсеместное внедрение ИИ-агентов в разработку программного обеспечения одной из самых дорогостоящих ошибок, которые совершит индустрия. Вывод основан не на теоретических соображениях, а на шести месяцах практической работы с различными моделями и инструментами, в том числе проекта tinygrad.

Проблема, которую описывает Хотц, лежит в самой природе больших языковых моделей. По его словам, LLM — это «сложные статистические модели», задача которых — имитировать распределение программного кода, а не понимать его. Пока модели были слабее, их ошибки бросались в глаза: неверный синтаксис, очевидные логические провалы. Чем точнее становится статистическая имитация, тем правдоподобнее выглядит дефектный результат — и тем сложнее его поймать. Хотц приводит конкретный пример: модели, которые просто комментируют падающий тест и затем рапортуют, что все тесты пройдены. Традиционные индикаторы качества — синтаксис, стиль, грамматика — перестали работать, потому что ИИ-артефакты возникают иначе, чем человеческий код.

Особую опасность Хотц видит в крупных организациях. Там разработчики с недостаточной квалификацией принимают вывод модели на веру, не имея экспертизы, чтобы распознать скрытый дефект. Накопление такого «скрытого долга» может обойтись дороже, чем любая экономия на скорости прототипирования. Хотц заявил, что теперь разделяет позицию исследователей Янна ЛеКуна и Гэри Маркуса, которые сомневаются в том, что LLM когда-либо достигнут подлинного интеллекта. ЛеКун недавно повторил схожий аргумент: интеллект — это нахождение решений в незнакомых ситуациях, а не имитация известных с переменной точностью. Хотц идёт дальше и утверждает, что для настоящего программирования нужны не языковые, а так называемые world models — модели, способные строить внутреннее представление о мире и причинно-следственных связях.

Главный риск — крупные организации, где слабые разработчики не могут распознать дефектный вывод ИИ.

Image description
Image description · Источник: The Decoder

Позиция Хотца вступает в прямое противоречие с оценкой Андрея Карпати — одного из основателей OpenAI и бывшего директора по ИИ в Tesla. Осенью 2025 года Карпати ещё говорил, что агенты не работают. После выхода GPT-5.4 и Opus 4.6 в декабре он изменил мнение на противоположное: агенты изменили программирование навсегда, а правильное их использование даёт прирост продуктивности более чем в 10 раз. Недавно Карпати перешёл в Anthropic, оставив собственный стартап. При этом он сам подтвердил опасения Хотца насчёт качества кода: «Когда реально смотришь на код, иногда сердце останавливается — он раздутый, с кучей copy-paste, хрупкими абстракциями. Работает, но выглядит ужасно». Планирование и понимание архитектуры, по словам Карпати, по-прежнему требуют человеческой экспертизы.

Разрыв между двумя позициями отражает более широкий раскол в отрасли. Разработчик OpenAI под псевдонимом «roon» ранее признал проблему качества, но предложил нестандартный ответ: ИИ будет делать ошибки, иногда достаточно серьёзные, чтобы положить целые системы, — но в конечном счёте их всё равно найдут и исправят. По его прогнозу, разработчики скоро перестанут проверять код вручную вовсе. Это означает фундаментальный сдвиг в том, что считается приемлемым уровнем контроля над программным обеспечением — и именно здесь расходятся те, кто видит в агентах инструмент ускорения, и те, кто считает их источником системного риска.