Генеральный директор Coinbase Брайан Армстронг объявил о переводе компании на дешевые китайские ИИ-модели. Теперь инфраструктура работает на GLM 5.2 и Kimi 2.7, что позволило вдвое сократить затраты на ИИ, несмотря на рост потребления токенов. Разработчики могут выбирать любую модель, но 91% из них так и не достигают прежних лимитов использования.
Компания внедрила автоматическую систему роутинга запросов, которая выбирает оптимальную модель на основе задачи, цены и возможностей кэширования. Улучшение кэширования позволило поднять показатель попадания (hit rate) с 5% до 60%. Разработчикам рекомендуется минимизировать контекст и начинать новые сессии для каждой задачи — подход, известный как контекстная инженерия. Потребление токенов в Coinbase резко выросло в последние месяцы на фоне появления агентных моделей рассуждения, таких как GPT-5.x-Thinking и Opus 4.5.
Coinbase также сделала использование токенов каждым разработчиком прозрачным, но без жестких лимитов. Это перекликается с трендом tokenmaxxing, когда сотрудники Amazon и Meta получали похвалу за массовое потребление токенов без привязки к результатам. Однако Coinbase нарушает эту практику: «Чем больше вы тратите на ИИ, тем больше отдачи мы ожидаем», — заявил Армстронг. Такой подход сократил расходы компании на ИИ вдвое, даже при росте токенов.
91% разработчиков не достигают прежних лимитов использования токенов.

Инициатива Coinbase — часть более широкой тенденции. Генеральный директор стартапа Lindy уже перевел свою компанию на Deepseek v4. Snowflake также тестирует китайские модели в поиске более дешевых альтернатив OpenAI и Anthropic. Это создает реальное ценовое давление на западные лаборатории, особенно на фоне их подготовки к IPO. По данным отраслевых источников, между OpenAI и Anthropic разворачивается ценовая война: модель GPT-5.6-Sol стоит столько же, сколько GPT-5.5, но обещает большую токен-эффективность, а также выведены две более слабые и дешевые версии этой модели.



