Компании NVIDIA и Amazon Web Services объявили о расширении совместной инфраструктуры для промышленного развёртывания ИИ. Ключевые новинки касаются вычислительных инстансов, векторного поиска и статуса облачной платформы.

Новые Amazon EC2 G7-инстансы оснащены NVIDIA RTX PRO 4500 Blackwell Server Edition GPU. По сравнению с предыдущим поколением G6 они обеспечивают до 4,6-кратного прироста производительности инференса ИИ, до 2,1-кратного ускорения графики и значительно более быстрой обработки данных на Amazon EMR с библиотекой NVIDIA cuDF. Инстансы поддерживают до восьми GPU, 256 ГБ видеопамяти, 700 Гбит/с сетевой пропускной способности и до 7,6 ТБ локального NVMe-хранилища. Такая конфигурация позволяет запускать на одной платформе инференс ИИ, рендеринг, симуляции, CAD, виртуальные рабочие столы и аналитику, снижая необходимость в избыточном резервировании ресурсов.

Второе важное изменение — библиотека NVIDIA cuVS стала движком по умолчанию для векторного индексирования в Amazon OpenSearch Serverless. Это значит, что GPU-ускоренный векторный поиск теперь доступен без дополнительной настройки для всех векторных коллекций. Для задач RAG, семантического поиска, рекомендательных систем и агентного ИИ это даёт прямой выигрыш: индексирование выполняется до 10 раз быстрее и обходится на 75% дешевле по сравнению с CPU-решениями. При этом серверлес-режим устраняет необходимость управления инфраструктурой в периоды простоя.

NVIDIA cuVS в OpenSearch Serverless делает GPU-ускоренное векторное индексирование стандартом — в 10 раз быстрее и на 75% дешевле CPU-аналогов.

Наконец, AWS достигла статуса NVIDIA Exemplar Cloud для GB300, что означает прохождение строгих тестов производительности для задач обучения. Этот статус даёт разработчикам уверенность в том, что облачная платформа обеспечивает предсказуемую и оптимизированную производительность для крупномасштабных тренировочных нагрузок. Совокупность этих обновлений позволяет AWS и NVIDIA предложить заказчикам полноценный стек для промышленного ИИ — от вычислений до поиска и обучения — без лишней операционной сложности.