Автор материала на Habr взял одну конкретную задачу — разобрать топ-10 heap alloc_objects нагруженного Go-сервиса по pprof-профилю и предложить фиксы по файлам — и прогнал её через Codex (GPT-5.5), Claude Opus 4 и Qwen 3.7 Max одновременно. Сервис обрабатывает миллионы запросов в минуту, кодовая база средняя по размеру.

Все три модели нашли главную причину аллокаций: функция матчинга источников трафика на каждый запрос заново парсила URL из статической конфигурации, которая меняется раз в сутки. Кумулятивно — около 45% всех аллокаций объектов. Фикс очевиден: парсить конфиг один раз при загрузке. На этом уровне Qwen не уступает топовым моделям.

МодельОценка (0–50)Глубина профилированияБезопасность рекомендацийГотовность к внедрению
Codex (GPT-5.5)46-peek + -list5/54/5
Claude Opus 446-peek5/55/5
Qwen 3.7 Max43-top -cum3/54/5

Разница проявилась в глубине работы с профайлером. Codex и Claude использовали флаг -peek, который показывает разбивку по вызывающим функциям. Это позволило найти дополнительные проблемы: на каждый внешний запрос создаётся новый объект-логгер, код тянет весь хеш из хранилища ради трёх полей, а в проекте уже есть LRU-кэш под соседнюю задачу, который можно переиспользовать. Qwen ограничился -top -cum — кумулятивным видом — и до -peek не дошёл. Итог: per-request логгер и bid-узел остались незамеченными.

Модель предложила небезопасный фикс с указателем в асинхронном коде — Codex и Claude этот вариант отклонили и дали безопасную альтернативу.

Отдельная проблема — небезопасный фикс в разделе «быстрые победы». Qwen предложил переиспользовать один объект в цикле и передавать указатель в функцию сохранения, добавив оговорку «работает только если сохранение синхронное, иначе Clone()». Но проверить, синхронный ли путь в конкретном коде, модель не стала. Путь оказался асинхронным: указатель уходит в канал и сериализуется позже в другой горутине. Такой приём в асинхронном контексте ведёт к порче данных. Codex и Claude этот вариант явно пометили как недопустимый и предложили копии по значению. По итоговой оценке автора: Codex — 46 баллов, Claude Opus — 46, Qwen 3.7 Max — 43 из 50.

Ценовая картина оказалась неожиданной. Подписка Qwen за $50 у Alibaba формально существует, но купить её не удалось: две недели подряд страница показывает out of stock с обещанием пополнения в полночь. Автор перешёл на токенный план за $30 с акционной скидкой 50% на Qwen Max. Пакет на $200 при работе в один поток хватает примерно на 33 часа. При многопоточном режиме, в котором автор обычно работает с Claude и GPT (5+ потоков), тот же пакет расходуется за день-два. Итоговая стоимость — в 15–30 раз выше, чем подписка на Claude или ChatGPT.

Вывод автора прямолинеен: Qwen подходит, если топовые альтернативы недоступны. В пуле агентов заметного выигрыша от добавления Qwen получить не удалось. При наличии Codex, Claude или Gemini предпочтительнее использовать их. По качеству Qwen 3.7 Max автор оценивает как отстающий на 2–4 поколения от актуальных GPT и Claude — что само по себе неплохо, учитывая темп выхода новых версий, но не компенсирует ценовой и качественный разрыв при реальной нагрузке.