OpenAI и Broadcom представили чип Jalapeño для вывода LLM

Подготовлено редакцией Malakhov AI

Ars Technica·7 часов назад·1 минИсследования

OpenAI совместно с Broadcom анонсировали специализированный ASIC-чип Jalapeño, предназначенный для инференса больших языковых моделей в дата-центрах. Разработка заняла девять месяцев, компании обещают существенное улучшение производительности на ватт, но окончательные результаты пока не опубликованы.

Кратко

—OpenAI и Broadcom представили чип Jalapeño, созданный с нуля для вывода LLM.
—Разработка заняла девять месяцев на основе данных от исследователей OpenAI.
—Заявлена существенно лучшая производительность на ватт по сравнению с текущими решениями.
—Подробный технический отчет ожидается в ближайшие месяцы.
—Чип является первым поколением долгосрочного проекта по созданию специализированных решений.

Глоссарий · 2 термина▾

ASIC: Специализированная микросхема (Application-Specific Integrated Circuit), спроектированная для определённого класса задач.
Инференс: Процесс использования обученной модели машинного обучения для получения ответов на новые данные.

OpenAI и Broadcom анонсировали специализированный чип Jalapeño, выполненный в виде ASIC и предназначенный для инференса больших языковых моделей в дата-центрах. Разработка заняла девять месяцев и велась на основе данных от исследователей OpenAI, включая информацию о будущих моделях и продуктах. По заявлению компаний, Jalapeño демонстрирует существенно лучшую производительность на ватт по сравнению с текущими решениями, однако окончательные измерения ещё не завершены. Подробный технический отчет обещают представить в ближайшие месяцы.

Проблема, которую решает Jalapeño, связана с неэффективностью универсальных GPU-ускорителей при выполнении задач инференса. Современные дата-центры в основном используют графические процессоры, такие как NVIDIA H100, которые изначально разрабатывались для обучения и рендеринга. Специализированные ASIC могут быть оптимизированы под конкретную вычислительную нагрузку, что позволяет снизить энергопотребление и повысить скорость вывода. Broadcom подчёркивает, что чип создавался с «детальным пониманием» потребностей OpenAI, что должно дать преимущество перед аналогами. Интерес к таким чипам растёт на фоне стремительного увеличения масштабов ИИ-нагрузок в дата-центрах.

Несмотря на оптимистичные заявления, остаются вопросы. Компании ещё не опубликовали бенчмарки, а обещанный отчёт появится лишь через несколько месяцев. Кроме того, ASIC-решения менее гибки: если архитектура языковых моделей изменится, чип может устареть быстрее, чем универсальные GPU. Тем не менее, если заявленная эффективность подтвердится, Jalapeño может стать важным шагом в снижении стоимости инференса для крупных ИИ-систем. OpenAI и Broadcom рассматривают это как первый этап долгосрочного проекта по созданию всё более специализированных чипов.

Разработка заняла девять месяцев на основе данных от исследователей OpenAI.

Разобраться глубже

Какие бизнес-процессы автоматизировать с помощью ИИ: матрица и 10 сценариев

Какие процессы реально автоматизировать с помощью ИИ в 2026 году: матрица фильтров эффект×сложность×риск×данные, 10 готовых сценариев, развёрнутый кейс агентства и калькулятор окупаемости поддержки интернет-магазина.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ

OpenAI и Broadcom представили чип Jalapeño для вывода LLM

Кратко

Читать дальше

Google DeepMind встроила компьютерное зрение в Gemini 3.5 Flash

OpenAI и Broadcom представили чип Jalapeño для инференса LLM

Ускорение тонкой настройки MoE-моделей: NeMo AutoModel и Transformers v5