Itglobal.com увеличил мощности GPU-кластеров в пять раз на фоне роста корпоративного

Подготовлено редакцией Malakhov AI

CNews·5 часов назад·2 минРоссия

В первом квартале 2026 года спрос на GPU-инфраструктуру у Itglobal.com вырос на 20% — компания ответила пятикратным расширением кластера на Nvidia RTX Pro 6000 Blackwell и увеличением кластера H200 в 3,5 раза. Корпоративные заказчики всё чаще берут ускорители в аренду, не вкладываясь в собственное оборудование.

Кратко

—Кластер на Nvidia RTX Pro 6000 Blackwell Server Edition вырос в 5 раз по сравнению с 2025 годом.
—Кластер на Nvidia H200 расширен в 3,5 раза — из-за стабильного спроса на обучение крупных LLM.
—RTX Pro 6000 Blackwell занял 75% всех GPU-запросов компании в I квартале 2026 года.
—H200 с 141 ГБ памяти HBM3e через NVLink объединяет до 8 плат в единое адресное пространство до 1,1 ТБ.
—Itglobal.com развивает модель ИИ as a Service с защитой данных и контролем доступа к LLM.

Глоссарий · 7 терминов▾

Инференс: Процесс применения уже обученной нейросетевой модели для получения ответов или предсказаний — в отличие от обучения, которое требует значительно больше вычислительных ресурсов.
MIG (Multi-Instance GPU): Технология Nvidia, позволяющая разделить один физический GPU на несколько аппаратно изолированных экземпляров с независимыми ресурсами памяти и вычислений.
HBM3e: Высокоскоростная память с широкой шиной данных, устанавливаемая непосредственно на подложку GPU — обеспечивает значительно большую пропускную способность по сравнению с обычной GDDR-памятью.
NVLink: Фирменная высокоскоростная шина Nvidia для объединения нескольких GPU в единое адресное пространство памяти внутри одного сервера.
Шардирование: Разбиение модели или данных на части и распределение их между несколькими серверами или устройствами для обработки задач, не умещающихся в памяти одного узла.
LLM: Large Language Model — большая языковая модель, нейросеть с миллиардами параметров, обученная на текстовых данных для генерации и понимания текста.
vGPU: Технология виртуализации GPU, позволяющая нескольким виртуальным машинам или контейнерам совместно использовать ресурсы одного физического графического ускорителя.

За первый квартал 2026 года Itglobal.com — международное облачное направление корпорации ITG — зафиксировал 20-процентный рост запросов на аренду GPU-инфраструктуры. В ответ компания пятикратно увеличила мощности кластера на базе Nvidia RTX Pro 6000 Blackwell Server Edition и в 3,5 раза расширила кластер на Nvidia H200. Оба решения ориентированы на корпоративных заказчиков, но закрывают разные классы задач.

RTX Pro 6000 Blackwell Server Edition построен на архитектуре Blackwell и оснащён 96 ГБ памяти GDDR7. По сравнению с предыдущим поколением Ada Lovelace ускоритель обеспечивает более чем пятикратный прирост пропускной способности при инференсе и более чем трёхкратный — в задачах генерации text-to-video. Технология vGPU с поддержкой MIG (Multi-Instance GPU) позволяет делить карту на аппаратно изолированные инстансы с индивидуально настроенными объёмом памяти и вычислительной мощностью — или, напротив, выделять полный профиль под одну задачу. Именно универсальность сделала этот ускоритель лидером спроса: в первом квартале 2026 года на него пришлось 75% всех GPU-запросов компании.

Параметр	Nvidia RTX Pro 6000 Blackwell Server Edition	Nvidia H200
Объём памяти	96 ГБ GDDR7	141 ГБ HBM3e
Основные сценарии	Инференс, 3D-рендеринг, компьютерное зрение, HPC	Обучение и инференс крупных LLM
Технология объединения	vGPU / MIG	NVLink (до 8 плат SXM, до 1,1 ТБ)
Доля запросов (Q1 2026)	75%	Не указана
Рост кластера	×5 к 2025 году	×3,5 к 2025 году

H200 решает другую задачу. Его 141 ГБ быстрой памяти HBM3e критичны для обучения и инференса больших языковых моделей, требовательных к объёму VRAM. Технология NVLink объединяет до восьми плат в форм-факторе SXM (или до четырёх в исполнении PCIe) в единое адресное пространство ёмкостью до 1,1 ТБ — это позволяет разворачивать LLM с десятками миллиардов параметров без сложного шардирования между серверами. Именно поэтому H200 остаётся стандартом для тяжёлых задач машинного обучения в корпоративном сегменте.

Кластер на Nvidia H200 расширен в 3,5 раза — из-за стабильного спроса на обучение крупных LLM.

За ростом спроса на аренду стоит экономическая логика: поколения GPU сменяются быстрее, чем окупаются капитальные вложения в собственное оборудование. Директор облачного направления Itglobal.com Евгений Свидерский объясняет это так: «Корпоративные заказчики всё чаще предпочитают получать актуальные ускорители как сервис, а не замораживать бюджет в инфраструктуре». Доступ к разным классам GPU в одном облаке — H200 под тяжёлые LLM, RTX Pro 6000 Blackwell под инференс, компьютерное зрение и рендеринг — позволяет распределять нагрузки по стоимости и не переплачивать за избыточную производительность.

Параллельно компания развивает модель ИИ as a Service: заказчик получает готовый инструмент для работы с LLM с контролем доступа, защитой от утечки чувствительных данных в публичные модели и прозрачной стоимостью использования. Это отдельный сегмент рынка — не аренда железа, а управляемый сервис поверх него, который снимает с корпоративного клиента операционную нагрузку по администрированию GPU-кластеров.

Разобраться глубже

Как внедрить ИИ в бизнес в 2026 году: пошаговый план для руководителя

Практический гайд для руководителя: как выбрать первый проект с ИИ, подготовить данные, посчитать экономику и довести пилот до рабочего процесса.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ

По теме

SpaceX показала спутник AI1 для ИИ-вычислений в космосе

Продолжить по разделам

Itglobal.com увеличил мощности GPU-кластеров в пять раз на фоне роста корпоративного

Кратко

Читать дальше

ИИ-консультант на Qwen3 с передачей диалога оператору через MAX

Orion soft выпустила шлюз StarGuard ИИ для контроля корпоративных LLM

SpaceX показала спутник AI1 для ИИ-вычислений в космосе