За первый квартал 2026 года Itglobal.com — международное облачное направление корпорации ITG — зафиксировал 20-процентный рост запросов на аренду GPU-инфраструктуры. В ответ компания пятикратно увеличила мощности кластера на базе Nvidia RTX Pro 6000 Blackwell Server Edition и в 3,5 раза расширила кластер на Nvidia H200. Оба решения ориентированы на корпоративных заказчиков, но закрывают разные классы задач.

RTX Pro 6000 Blackwell Server Edition построен на архитектуре Blackwell и оснащён 96 ГБ памяти GDDR7. По сравнению с предыдущим поколением Ada Lovelace ускоритель обеспечивает более чем пятикратный прирост пропускной способности при инференсе и более чем трёхкратный — в задачах генерации text-to-video. Технология vGPU с поддержкой MIG (Multi-Instance GPU) позволяет делить карту на аппаратно изолированные инстансы с индивидуально настроенными объёмом памяти и вычислительной мощностью — или, напротив, выделять полный профиль под одну задачу. Именно универсальность сделала этот ускоритель лидером спроса: в первом квартале 2026 года на него пришлось 75% всех GPU-запросов компании.

ПараметрNvidia RTX Pro 6000 Blackwell Server EditionNvidia H200
Объём памяти96 ГБ GDDR7141 ГБ HBM3e
Основные сценарииИнференс, 3D-рендеринг, компьютерное зрение, HPCОбучение и инференс крупных LLM
Технология объединенияvGPU / MIGNVLink (до 8 плат SXM, до 1,1 ТБ)
Доля запросов (Q1 2026)75%Не указана
Рост кластера×5 к 2025 году×3,5 к 2025 году

H200 решает другую задачу. Его 141 ГБ быстрой памяти HBM3e критичны для обучения и инференса больших языковых моделей, требовательных к объёму VRAM. Технология NVLink объединяет до восьми плат в форм-факторе SXM (или до четырёх в исполнении PCIe) в единое адресное пространство ёмкостью до 1,1 ТБ — это позволяет разворачивать LLM с десятками миллиардов параметров без сложного шардирования между серверами. Именно поэтому H200 остаётся стандартом для тяжёлых задач машинного обучения в корпоративном сегменте.

Кластер на Nvidia H200 расширен в 3,5 раза — из-за стабильного спроса на обучение крупных LLM.

За ростом спроса на аренду стоит экономическая логика: поколения GPU сменяются быстрее, чем окупаются капитальные вложения в собственное оборудование. Директор облачного направления Itglobal.com Евгений Свидерский объясняет это так: «Корпоративные заказчики всё чаще предпочитают получать актуальные ускорители как сервис, а не замораживать бюджет в инфраструктуре». Доступ к разным классам GPU в одном облаке — H200 под тяжёлые LLM, RTX Pro 6000 Blackwell под инференс, компьютерное зрение и рендеринг — позволяет распределять нагрузки по стоимости и не переплачивать за избыточную производительность.

Параллельно компания развивает модель ИИ as a Service: заказчик получает готовый инструмент для работы с LLM с контролем доступа, защитой от утечки чувствительных данных в публичные модели и прозрачной стоимостью использования. Это отдельный сегмент рынка — не аренда железа, а управляемый сервис поверх него, который снимает с корпоративного клиента операционную нагрузку по администрированию GPU-кластеров.