В июне экономический тупик стал главным драйвером изменений в индустрии ИИ. Компании, ранее полагавшиеся на топовые западные модели вроде GPT-5.5-Thinking и Opus 4.8, начали массово переходить на китайские open-weight аналоги. Coinbase стала одним из первых громких прецедентов: генеральный директор Брайан Армстронг объявил, что теперь компания генерирует больше токенов, чем когда-либо, но платит за них ровно в два раза меньше.

Как это удалось? Coinbase внедрила динамический роутинг: перед отправкой запроса балансировщик анализирует параметры задачи и выбирает оптимальную модель — где токен дешевле и есть ли нужный ответ в кэше. Оптимизация кэширования контекста позволила поднять хит-рейт с 5% до 60%. Кроме того, компания сделала упор на «инженерную гигиену»: разработчиков учат изолировать область видимости файлов, отключать неиспользуемые плагины и принудительно сбрасывать сессии при переключении задач. Эти меры позволили отказаться от жестких лимитов и алертов, заменив их свободой выбора с привязкой к бизнес-эффекту.

СдвигСутьПримеры
ЭкономическийПереход на более дешевые модели ИИ для снижения затрат на токеныCoinbase заменила GPT-5.5 и Opus 4.8 на GLM 5.2, Kimi 2.7, Deepseek v4
ТехническийОблачные провайдеры софтом латают дефицит VRAM для on-premise развертыванияMicrosoft Foundry Local, NVIDIA RTX Spark
ЮридическийНовые законопроекты заставляют перекраивать пайплайны обученияРоссийский законопроект об ИИ после переработки

Вслед за Coinbase аналогичные шаги предприняли Snowflake и стартап Lindy. Однако не все готовы отдавать чувствительные данные на сторонние API, поэтому альтернативные модели все чаще разворачивают в собственном закрытом контуре. Это создает новые вызовы: при локальном развертывании на первый план выходит нехватка VRAM и ошибки OOM. В ответ облачные провайдеры — Microsoft и NVIDIA — предлагают решения вроде Foundry Local и RTX Spark, которые помогают латать дефицит видеопамяти.

Динамический роутинг и кэширование контекста подняли хит-рейт с 5% до 60% в Coinbase.

Параллельно развивается юридический фронт. В России законопроект об ИИ радикально переписали после критики, что заставляет архитекторов перекраивать пайплайны обучения. На глобальном уровне растущее регулирование добавляет неопределенности в стратегии компаний, особенно тех, кто готовится к IPO. Исход энтерпрайза из экосистемы OpenAI и других западных лабораторий становится стресс-тестом их бизнес-моделей.

На фоне перехода на open-source модели отрасль сталкивается с физическими ограничениями. Итоги конференции MLSys 2026 показали, что индустрия уперлась в дефицит энергии и вычислительных ресурсов. OpenAI объединилась с Broadcom для создания собственного ИИ-чипа, а NVIDIA анонсировала RTX Spark для тяжелых агентов на ПК. Эти шаги подтверждают: экономика ИИ требует не только дешевых моделей, но и новой инфраструктуры.