Почти два миллиона специализированных чипов — такой объём производства Google закладывает для нового чипа обработки памяти, который разрабатывается совместно с Marvell Technology. Об этом сообщает The Information со ссылкой на два источника. Финализация дизайна ожидается в следующем году.
Речь идёт о двух разных продуктах. Первый — memory processing unit (MPU), который будет работать параллельно с фирменными TPU Google и брать на себя задачи, требующие интенсивной работы с памятью, пока TPU занимаются вычислениями. Такое разделение труда позволяет эффективнее использовать оба типа чипов при обработке больших языковых моделей. Второй продукт — новый TPU, оптимизированный специально под инференс: запуск уже обученных моделей в продакшне, а не их обучение с нуля. Инференс и обучение предъявляют к железу принципиально разные требования, и отдельный чип под каждую задачу — устойчивая тенденция в отрасли.
Marvell — не случайный выбор. Компания уже разрабатывала первый инференс-чип для стартапа Groq. В декабре 2025 года Nvidia лицензировала технологию LPU (Language Processing Unit) у Groq за $20 млрд и представила на конференции GTC 2026 продукты Groq 3 LPU и стоечную систему Groq 3 LPX. Основатель Groq Джонатан Росс — один из первых инженеров TPU в Google, что замыкает круг технологической преемственности.
Второй чип — новый TPU, созданный специально для инференса, то есть запуска уже обученных ИИ-моделей.
За переговорами с Marvell стоит и коммерческая логика. Текущий партнёр Google по дизайну чипов — Broadcom — берёт высокие комиссии за каждый произведённый TPU. При тиражах в миллионы единиц эти расходы становятся существенной статьёй бюджета. Диверсификация партнёрской базы снижает переговорную зависимость. При этом Broadcom никуда не уходит: в начале апреля Google подписала с ней новый контракт, действующий до 2031 года.
Ситуация отражает более широкий тренд: крупные технологические компании — Google, Amazon, Microsoft, Meta — последовательно наращивают собственные разработки в области кремния, чтобы меньше зависеть от универсальных решений Nvidia. TPU у Google существуют с 2016 года, и каждое новое поколение всё плотнее интегрируется с программным стеком компании. Специализированный чип для инференса — следующий шаг в этой логике: по мере того как модели переходят из исследовательских лабораторий в продукты с миллиардами запросов в сутки, экономика инференса становится не менее важной, чем экономика обучения.


