ITGlobal.com развернул GPU-инфраструктуру для корпоративного ИИ-ассистента на базе RAG

Подготовлено редакцией Malakhov AI

CNews·4 мая·2 минРоссия

После подключения GPU-инфраструктуры на базе Nvidia RTX 6000 Blackwell Server Edition среднее время поиска информации у сотрудников сократилось с 15 минут до 40 секунд. Нагрузка на внутренние сервисные команды упала на 37%.

Кратко

—Инфраструктуру предоставил ITGlobal.com — облачное направление корпорации ITG.
—ИИ-ассистент работает по механизму RAG: ищет релевантные фрагменты в корпоративных документах и формирует ответ со ссылками на первоисточники.
—Время поиска информации сократилось с 15 минут до 40 секунд после запуска решения.
—Нагрузка на сервисные команды снизилась на 37%, что позволило перераспределить ресурсы на сложные задачи.
—Поддержка vGPU дала возможность стартовать с минимальной конфигурацией и масштабироваться без избыточных затрат на пилоте.

Глоссарий · 4 термина▾

RAG (Retrieval-Augmented Generation): Метод работы языковой модели, при котором перед генерацией ответа система извлекает релевантные фрагменты из заданного набора документов — это снижает вероятность ошибочных ответов и делает их проверяемыми.
vGPU: Технология виртуализации видеокарты, позволяющая разделить один физический GPU на несколько независимых профилей с настраиваемым объёмом памяти и вычислительных ресурсов.
GPU-инфраструктура: Серверные мощности на основе графических процессоров, которые используются для ускоренных вычислений при обучении и инференсе языковых моделей.
Корпоративный контур: Изолированная ИТ-среда компании, в которой данные и сервисы не выходят за пределы внутренней сети.

Среднее время, которое сотрудник тратил на поиск нужного регламента или шаблона, составляло 15 минут — данные расползались по нескольким системам, а типовые вопросы потоком шли во внутреннюю службу поддержки. После запуска ИИ-ассистента на GPU-инфраструктуре ITGlobal.com этот показатель упал до 40 секунд, а нагрузка на сервисные команды сократилась на 37%.

Заказчик — компания с разветвлённой филиальной сетью и несколькими бизнес-направлениями — поставил задачу создать ассистента, который работает внутри корпоративного контура и отвечает на вопросы в диалоговом формате. Ключевое требование: никаких внешних облаков, только актуальная внутренняя документация и стабильная производительность при росте числа пользователей.

Метрика	До внедрения	После внедрения
Среднее время поиска информации	15 минут	40 секунд
Нагрузка на сервисные команды	базовый уровень	−37%

Техническую основу составила GPU-инфраструктура на базе Nvidia RTX 6000 Blackwell Server Edition, которую предоставил ITGlobal.com. Поверх неё развернули среду с механизмом RAG (Retrieval-Augmented Generation). Принцип работы RAG прямолинеен: вместо того чтобы генерировать ответ «из головы», языковая модель сначала извлекает релевантные фрагменты из подключённых источников — в данном случае регламентов, шаблонов, технической документации и базы сервисных обращений — и только затем формирует ответ, прикладывая ссылки на первоисточники. Это снижает риск галлюцинаций и делает ответы проверяемыми.

ИИ-ассистент работает по механизму RAG: ищет релевантные фрагменты в корпоративных документах и формирует ответ со ссылками на первоисточники.

Отдельную роль сыграла поддержка vGPU в облаке ITGlobal.com. Технология виртуализации GPU позволяет делить физическую карту на несколько профилей с настраиваемым объёмом памяти и вычислительных ресурсов. Заказчик начал с минимальной конфигурации, проверил архитектуру на реальных данных и только после этого перешёл к продуктивной нагрузке — без переплаты за избыточные мощности на этапе пилота. По словам директора облачного направления ITGlobal.com Евгения Свидерского, карты актуальных поколений были в наличии, а скорость активации услуг позволила перейти к развёртыванию в сжатые сроки.

RAG-подход к корпоративным знаниям сейчас активно тестируют российские компании, которым закрыт доступ к зарубежным облачным сервисам или которые не готовы выводить внутренние данные за периметр. Локальное развёртывание на собственной или арендованной GPU-инфраструктуре становится стандартным сценарием: модель работает на серверах внутри контура, документы не покидают корпоративную сеть. Результат в данном кейсе — сокращение объёма типовых обращений и перераспределение ресурсов поддержки на задачи, которые ассистент решить не может.

Разобраться глубже

Как внедрить ИИ в бизнес в 2026 году: пошаговый план для руководителя

Практический гайд для руководителя: как выбрать первый проект с ИИ, подготовить данные, посчитать экономику и довести пилот до рабочего процесса.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ

По теме

Активность выхода стартапов с оценкой от $1 млрд достигла максимума с 2021 года

Продолжить по разделам

ITGlobal.com развернул GPU-инфраструктуру для корпоративного ИИ-ассистента на базе RAG

Кратко

Читать дальше

VK вылетел из App Store, а в России готовят регулирование ИИ

«Яндекс» запустил платформу для создания ИИ-агентов в «Алисе ИИ»

Активность выхода стартапов с оценкой от $1 млрд достигла максимума с 2021 года