Google заказывает почти два миллиона новых ИИ-чипов и привлекает Marvell к разработке

Подготовлено редакцией Malakhov AI

The Decoder·20 апр.·2 минИсследованияИндустрия

Google ведёт переговоры с Marvell Technology о создании двух специализированных чипов для своих дата-центров: одного для обработки памяти рядом с TPU и одного нового TPU для инференса. Производство первого чипа планируется в объёме почти двух миллионов единиц, финализация дизайна — в 2026 году.

Кратко

—Google разрабатывает с Marvell чип обработки памяти (MPU) для совместной работы с TPU и распределения задач по вычислениям и памяти.
—Второй чип — новый TPU, созданный специально для инференса, то есть запуска уже обученных ИИ-моделей.
—Объём производства MPU — почти два миллиона единиц, дизайн должен быть готов в следующем году.
—Один из мотивов — снизить зависимость от Broadcom, которая берёт высокие комиссии за каждый произведённый TPU.
—Broadcom сохраняет позиции партнёра: в начале апреля Google подписала с ней новый контракт до 2031 года.

Глоссарий · 5 терминов▾

TPU (Tensor Processing Unit): Специализированный процессор Google, разработанный для ускорения вычислений в задачах машинного обучения.
MPU (Memory Processing Unit): Чип, оптимизированный для операций с памятью; в контексте ИИ-инфраструктуры работает в паре с вычислительным ускорителем, разгружая его от задач, требующих интенсивного доступа к данным.
Инференс: Процесс запуска уже обученной ИИ-модели для получения ответов — в отличие от обучения, когда модель только формирует свои веса.
LPU (Language Processing Unit): Архитектура чипа компании Groq, оптимизированная для последовательной обработки текста в языковых моделях с минимальными задержками.
Benchmark: Стандартизированный тест для сравнения производительности моделей или аппаратного обеспечения по единой шкале.

Почти два миллиона специализированных чипов — такой объём производства Google закладывает для нового чипа обработки памяти, который разрабатывается совместно с Marvell Technology. Об этом сообщает The Information со ссылкой на два источника. Финализация дизайна ожидается в следующем году.

Речь идёт о двух разных продуктах. Первый — memory processing unit (MPU), который будет работать параллельно с фирменными TPU Google и брать на себя задачи, требующие интенсивной работы с памятью, пока TPU занимаются вычислениями. Такое разделение труда позволяет эффективнее использовать оба типа чипов при обработке больших языковых моделей. Второй продукт — новый TPU, оптимизированный специально под инференс: запуск уже обученных моделей в продакшне, а не их обучение с нуля. Инференс и обучение предъявляют к железу принципиально разные требования, и отдельный чип под каждую задачу — устойчивая тенденция в отрасли.

Marvell — не случайный выбор. Компания уже разрабатывала первый инференс-чип для стартапа Groq. В декабре 2025 года Nvidia лицензировала технологию LPU (Language Processing Unit) у Groq за $20 млрд и представила на конференции GTC 2026 продукты Groq 3 LPU и стоечную систему Groq 3 LPX. Основатель Groq Джонатан Росс — один из первых инженеров TPU в Google, что замыкает круг технологической преемственности.

Второй чип — новый TPU, созданный специально для инференса, то есть запуска уже обученных ИИ-моделей.

За переговорами с Marvell стоит и коммерческая логика. Текущий партнёр Google по дизайну чипов — Broadcom — берёт высокие комиссии за каждый произведённый TPU. При тиражах в миллионы единиц эти расходы становятся существенной статьёй бюджета. Диверсификация партнёрской базы снижает переговорную зависимость. При этом Broadcom никуда не уходит: в начале апреля Google подписала с ней новый контракт, действующий до 2031 года.

Ситуация отражает более широкий тренд: крупные технологические компании — Google, Amazon, Microsoft, Meta — последовательно наращивают собственные разработки в области кремния, чтобы меньше зависеть от универсальных решений Nvidia. TPU у Google существуют с 2016 года, и каждое новое поколение всё плотнее интегрируется с программным стеком компании. Специализированный чип для инференса — следующий шаг в этой логике: по мере того как модели переходят из исследовательских лабораторий в продукты с миллиардами запросов в сутки, экономика инференса становится не менее важной, чем экономика обучения.

Разобраться глубже

Какие бизнес-процессы автоматизировать с помощью ИИ: матрица и 10 сценариев

Какие процессы реально автоматизировать с помощью ИИ в 2026 году: матрица фильтров эффект×сложность×риск×данные, 10 готовых сценариев, развёрнутый кейс агентства и калькулятор окупаемости поддержки интернет-магазина.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ