NVIDIA объявила о новой бизнес-модели, которая призвана решить проблему доступа к вычислительным ресурсам для ИИ-компаний. Теперь ИИ-облака могут приобретать инфраструктуру на условиях разделения выручки с NVIDIA, что снижает капитальные затраты и ускоряет развёртывание мощностей.

Модель появилась на фоне сдвига от разработки моделей к их эксплуатации: inference-нагрузки требуют постоянно работающих «ИИ-фабрик», генерирующих токены в промышленных масштабах. Раньше стартапы и даже крупные компании сталкивались с необходимостью длительного финансирования и строительства собственных дата-центров. Новая схема позволяет облачным провайдерам быстрее запускать мощности, а NVIDIA получает регулярный поток дохода, привязанный к использованию.

КомпанияGPUЛокацияМощность
Sharon AIдо 40 000 GB300не указанане указано
Firmusдо 170 000 GPUБатам, Индонезия360 МВт

Первыми партнёрами стали Sharon ИИ и Firmus. Sharon ИИ разворачивает до 40 000 ускорителей NVIDIA Grace Blackwell GB300. Firmus строит DSX ИИ-фабрику в Батаме (Индонезия) мощностью 360 МВт, рассчитанную на 170 000 GPU. «ИИ-native компании нуждаются в масштабируемой, энергоэффективной инфраструктуре», — отметил Тим Розенфилд, со-CEO Firmus.

Sharon ИИ развернёт до 40 000 NVIDIA Grace Blackwell GB300 GPU.

Среди косвенных бенефициаров — ИИ-стартапы вроде Baseten, Fireworks ИИ и Together ИИ, которые получат доступ к вычислительным мощностям без длительного ожидания. Они смогут брать ресурсы для тренировки, дообучения и высокообъёмного агентного инференса, имея коммерческую гибкость при переходе от пилота к промышленной эксплуатации. Новый подход NVIDIA фактически демократизирует доступ к крупномасштабным ИИ-вычислениям, которые ранее были доступны лишь считанным игрокам.