Coinbase вдвое сократил расходы на ИИ, перейдя на китайские модели

Подготовлено редакцией Malakhov AI

The Decoder·2 часа назад·2 минИсследованияИндустрия

Coinbase CEO Брайан Армстронг перевел компанию на дешевые китайские ИИ-модели GLM 5.2 и Kimi 2.7, что позволило вдвое сократить затраты при росте потребления токенов. 91% разработчиков не превышают старые лимиты, а автоматический роутинг выбирает оптимальную модель для каждой задачи.

Кратко

—Coinbase использует китайские модели GLM 5.2 и Kimi 2.7, сократив расходы на ИИ вдвое.
—91% разработчиков не достигают прежних лимитов использования токенов.
—Автоматическая система роутинга и улучшенное кэширование повысили hit rate с 5% до 60%.
—Другие компании (Lindy, Snowflake) также тестируют китайские модели, усиливая ценовое давление на западные лаборатории.
—Coinbase связывает рост трат на ИИ с ожиданием измеримого бизнес-результата, противодействуя тренду tokenmaxxing.

Глоссарий · 3 термина▾

токенмаксинг: Практика массового потребления токенов ИИ без привязки к бизнес-результатам, часто поощряемая в крупных технологических компаниях.
контекстная инженерия: Подход к оптимизации работы с большими языковыми моделями, включающий минимизацию контекста и разделение сессий для повышения эффективности.
агентные модели рассуждения: Модели ИИ, способные автономно выполнять многошаговые задачи и цепочки рассуждений, подобно агенту.

Генеральный директор Coinbase Брайан Армстронг объявил о переводе компании на дешевые китайские ИИ-модели. Теперь инфраструктура работает на GLM 5.2 и Kimi 2.7, что позволило вдвое сократить затраты на ИИ, несмотря на рост потребления токенов. Разработчики могут выбирать любую модель, но 91% из них так и не достигают прежних лимитов использования.

Компания внедрила автоматическую систему роутинга запросов, которая выбирает оптимальную модель на основе задачи, цены и возможностей кэширования. Улучшение кэширования позволило поднять показатель попадания (hit rate) с 5% до 60%. Разработчикам рекомендуется минимизировать контекст и начинать новые сессии для каждой задачи — подход, известный как контекстная инженерия. Потребление токенов в Coinbase резко выросло в последние месяцы на фоне появления агентных моделей рассуждения, таких как GPT-5.x-Thinking и Opus 4.5.

Coinbase также сделала использование токенов каждым разработчиком прозрачным, но без жестких лимитов. Это перекликается с трендом tokenmaxxing, когда сотрудники Amazon и Meta получали похвалу за массовое потребление токенов без привязки к результатам. Однако Coinbase нарушает эту практику: «Чем больше вы тратите на ИИ, тем больше отдачи мы ожидаем», — заявил Армстронг. Такой подход сократил расходы компании на ИИ вдвое, даже при росте токенов.

91% разработчиков не достигают прежних лимитов использования токенов.

Coinbase's token usage has shot up in recent months as agentic reasoning models like GPT-5.x-Thinking and Opus 4.5 hit the market. | Image: Armstrong · Источник: The Decoder

Инициатива Coinbase — часть более широкой тенденции. Генеральный директор стартапа Lindy уже перевел свою компанию на Deepseek v4. Snowflake также тестирует китайские модели в поиске более дешевых альтернатив OpenAI и Anthropic. Это создает реальное ценовое давление на западные лаборатории, особенно на фоне их подготовки к IPO. По данным отраслевых источников, между OpenAI и Anthropic разворачивается ценовая война: модель GPT-5.6-Sol стоит столько же, сколько GPT-5.5, но обещает большую токен-эффективность, а также выведены две более слабые и дешевые версии этой модели.

Разобраться глубже

Какие бизнес-процессы автоматизировать с помощью ИИ: матрица и 10 сценариев

Какие процессы реально автоматизировать с помощью ИИ в 2026 году: матрица фильтров эффект×сложность×риск×данные, 10 готовых сценариев, развёрнутый кейс агентства и калькулятор окупаемости поддержки интернет-магазина.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ