Сатья Наделла в интервью сформулировал претензию к одной из устойчивых привычек технологической индустрии: автоматически подключать самую мощную доступную ИИ-модель к любой задаче — от генерации письма до отладки строки кода. Это явление получило неформальное название token-maxing, и, по словам Наделлы, оно не создаёт реальной экономической ценности.

Логика здесь сугубо экономическая. Каждый запрос к frontier-модели — GPT-4o, Claude 3.5 Sonnet или Gemini 2.5 Pro — стоит значительно дороже, чем запрос к компактной специализированной модели. Если задача не требует сложного рассуждения или широкого контекста, использование тяжёлой модели означает переплату без прироста результата. Наделла формулирует это как принцип: «Предельная стоимость прироста производительности должна соответствовать предельной стоимости токена». Иными словами, выбор модели должен быть осознанным экономическим решением, а не рефлекторным.

При этом Наделла не скрывает, что сам нарушает собственный принцип: «Я тоже token-maxer. Это затягивает». Признание показательно: даже человек, управляющий одним из крупнейших инвесторов в OpenAI, фиксирует у себя ту же поведенческую ловушку, о которой предупреждает отрасль. Проблема не в доступности мощных моделей, а в отсутствии культуры их дифференцированного применения.

Frontier-модели не стоит тратить на рутинные задачи — это экономически нецелесообразно.

Параллельно Наделла описывает куда более масштабный сдвиг в самой профессии разработчика. По его видению, программисты в обозримом будущем перестанут писать код вручную — вместо этого они будут координировать работу сотен и тысяч ИИ-агентов. Это не метафора: Наделла говорит, что у него уже есть репозиторий, целиком написанный агентами, и его задача — понять, что именно там произошло. Он называет этот навык cognitive coverage — способность глубоко осмыслить и верифицировать код, который создан не тобой.

Такой подход переосмысляет ценность классического образования в области computer science. Наделла не считает, что оно устарело — напротив, он настаивает на его необходимости. Но акцент смещается: важно не умение написать алгоритм с нуля, а способность критически оценить архитектурные решения, которые принял агент, выявить ошибки и понять последствия. Это ближе к роли технического директора или архитектора, чем к роли исполнителя.

В более широком контексте позиция Наделлы отражает нарастающую дискуссию в отрасли о том, как правильно встраивать ИИ в производственные процессы. Несколько крупных компаний — в том числе сам Microsoft — уже экспериментируют с маршрутизацией запросов между моделями разного уровня мощности в зависимости от сложности задачи. Такой подход позволяет снизить затраты без потери качества. Token-maxing в этом свете — не просто личная привычка, а системная неэффективность, которую индустрия только начинает осознавать как проблему.