Сатья Наделла предупреждает против «token-maxing» — и сам признаётся в этой привычке

Подготовлено редакцией Malakhov AI

The Decoder·13 июн.·2 минИсследованияИндустрия

Генеральный директор Microsoft Сатья Наделла заявил, что бездумное использование самых мощных ИИ-моделей для любых задач не приведёт к реальному экономическому росту — и тут же признался: «Я сам token-maxer. Это затягивает».

Кратко

—Наделла сформулировал принцип: предельные затраты на прирост производительности должны соответствовать предельной стоимости токена.
—Frontier-модели не стоит тратить на рутинные задачи — это экономически нецелесообразно.
—По прогнозу Наделлы, разработчики перестанут писать код и будут управлять сотнями или тысячами ИИ-агентов.
—Новый ключевой навык программиста — «cognitive coverage»: глубокое понимание кода, написанного агентами.
—Образование в области computer science останется необходимым, но характер работы изменится кардинально.

Видео по теме

Satya Nadella ơn A.I. Jobs: Humans Will Do the ‘Glue Work’ · Источник: The Decoder

Глоссарий · 5 терминов▾

token-maxing: Привычка использовать самые мощные и дорогие ИИ-модели для любых задач без учёта их реальной сложности и стоимости запроса.
frontier-модель: Наиболее мощная и актуальная версия большой языковой модели, находящаяся на переднем крае возможностей отрасли.
токен: Единица текста, которую обрабатывает языковая модель; примерно соответствует слогу или короткому слову, и именно по токенам считается стоимость запроса к API.
cognitive coverage: Термин Наделлы для навыка глубокого понимания и верификации кода, написанного ИИ-агентами, без его самостоятельного написания.
ИИ-агент: Программная система на основе языковой модели, способная самостоятельно выполнять многошаговые задачи — например, писать, тестировать и разворачивать код.

Сатья Наделла в интервью сформулировал претензию к одной из устойчивых привычек технологической индустрии: автоматически подключать самую мощную доступную ИИ-модель к любой задаче — от генерации письма до отладки строки кода. Это явление получило неформальное название token-maxing, и, по словам Наделлы, оно не создаёт реальной экономической ценности.

Логика здесь сугубо экономическая. Каждый запрос к frontier-модели — GPT-4o, Claude 3.5 Sonnet или Gemini 2.5 Pro — стоит значительно дороже, чем запрос к компактной специализированной модели. Если задача не требует сложного рассуждения или широкого контекста, использование тяжёлой модели означает переплату без прироста результата. Наделла формулирует это как принцип: «Предельная стоимость прироста производительности должна соответствовать предельной стоимости токена». Иными словами, выбор модели должен быть осознанным экономическим решением, а не рефлекторным.

При этом Наделла не скрывает, что сам нарушает собственный принцип: «Я тоже token-maxer. Это затягивает». Признание показательно: даже человек, управляющий одним из крупнейших инвесторов в OpenAI, фиксирует у себя ту же поведенческую ловушку, о которой предупреждает отрасль. Проблема не в доступности мощных моделей, а в отсутствии культуры их дифференцированного применения.

Frontier-модели не стоит тратить на рутинные задачи — это экономически нецелесообразно.

Параллельно Наделла описывает куда более масштабный сдвиг в самой профессии разработчика. По его видению, программисты в обозримом будущем перестанут писать код вручную — вместо этого они будут координировать работу сотен и тысяч ИИ-агентов. Это не метафора: Наделла говорит, что у него уже есть репозиторий, целиком написанный агентами, и его задача — понять, что именно там произошло. Он называет этот навык cognitive coverage — способность глубоко осмыслить и верифицировать код, который создан не тобой.

Такой подход переосмысляет ценность классического образования в области computer science. Наделла не считает, что оно устарело — напротив, он настаивает на его необходимости. Но акцент смещается: важно не умение написать алгоритм с нуля, а способность критически оценить архитектурные решения, которые принял агент, выявить ошибки и понять последствия. Это ближе к роли технического директора или архитектора, чем к роли исполнителя.

В более широком контексте позиция Наделлы отражает нарастающую дискуссию в отрасли о том, как правильно встраивать ИИ в производственные процессы. Несколько крупных компаний — в том числе сам Microsoft — уже экспериментируют с маршрутизацией запросов между моделями разного уровня мощности в зависимости от сложности задачи. Такой подход позволяет снизить затраты без потери качества. Token-maxing в этом свете — не просто личная привычка, а системная неэффективность, которую индустрия только начинает осознавать как проблему.

Разобраться глубже

Какие бизнес-процессы автоматизировать с помощью ИИ: матрица и 10 сценариев

Какие процессы реально автоматизировать с помощью ИИ в 2026 году: матрица фильтров эффект×сложность×риск×данные, 10 готовых сценариев, развёрнутый кейс агентства и калькулятор окупаемости поддержки интернет-магазина.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ

По теме

Толстый и тонкий харнесс: принципы маршрутизации запросов ИИ-ассистента

Продолжить по разделам

Сатья Наделла предупреждает против «token-maxing» — и сам признаётся в этой привычке

Кратко

Читать дальше

ИИ-агенты ускорили научный софт в 60 раз, но не проверяют корректность науки

NFC-ключ за $9: физический блокиратор отвлекающих приложений

Толстый и тонкий харнесс: принципы маршрутизации запросов ИИ-ассистента