Anthropic проанализировала около 400 000 сессий использования Claude Code с октября 2025 по апрель 2026 года, охватив 235 000 пользователей. Выводы оказались неожиданными: профессия пользователя почти не влияет на результат. У разработчиков подтверждённый успех составил 30%, у не-программистов — 26%, разница в 4 процентных пункта.

Исследователи разделили пользователей по уровню экспертизы в диалоге. Эксперты в среднем запускали 12 действий агента на одну команду против 5 у новичков, получая ~3200 слов вместо 600. Эксперты в четыре раза чаще вытаскивали зависшую сессию (15% против 4%) и реже бросали сессию (5–7% против 19%).

УровеньПодтверждённый успехВытащил зависшую сессию
Новичок15%4%
Эксперт~30%15%

Автор статьи на Habr, чьи колонки ранее предсказывали снижение ценности чистого кодинга, согласен с цифрами, но категорически не согласен с выводами Anthropic. Он полагает, что исследование измеряет краткосрочную результативность — скорость сборки прототипа. В реальном продакшн-среде без тестов, безопасности и масштабирования такой прототип быстро развалится под нагрузкой. Оптимальная схема, по его мнению, — связка эксперта предметной области и инженера, который строит инфраструктуру и обеспечивает надёжность.

Эксперты в диалоге с агентом показывают ~30% успеха против 15% у новичков.

Практический вывод: ставьте агенту цель, не расписывая пошаговый план. Исследование показало, что модель справляется с «как» лучше человека. Этот совет совпадает с руководствами Anthropic и OpenAI.