Общая инфраструктура, изолированные арендаторы

Подготовлено редакцией Malakhov AI

AWS Machine Learning Blog·2 часа назад·2 минЛабораторииКод

AWS представила архитектурный паттерн для мультитенантных ИИ-агентов на основе Amazon Bedrock AgentCore, который обеспечивает полную изоляцию клиентов, разделение на уровни обслуживания и поштучный учет затрат. Решение демонстрируется на примере медицинских ИИ-ассистентов для разных типов учреждений.

Кратко

—Архитектура использует трехуровневую иерархию «Уровень → Арендатор → Пользователь» для изоляции.
—Разделение на тарифы Basic (Mistral Ministral 3B) и Premium (OpenAI GPT OSS 120B) с разными возможностями.
—Пул-модель обеспечивает экономию ресурсов за счет совместного использования инфраструктуры.
—Маршрутизация и контроль доступа через Amazon Cognito, API Gateway и Lambda.
—Учет затрат ведется на уровне каждого арендатора с помощью нативных инструментов AWS.

Глоссарий · 3 термина▾

Мультитенантность: Архитектурный подход, при котором один экземпляр приложения обслуживает несколько клиентов (арендаторов) с изоляцией данных и конфигураций.
Пул-модель (pool model): Модель развертывания, при которой все арендаторы используют общую инфраструктуру и вычислительные ресурсы, а изоляция обеспечивается программными средствами.
Amazon Bedrock AgentCore: Сервис AWS для создания и выполнения ИИ-агентов, предоставляющий компоненты для выполнения, памяти, идентификации, инструментов и политик.

Создание мультитенантных ИИ-приложений требует решения нескольких сложных задач: обеспечение полной изоляции между клиентами, поддержка разных уровней обслуживания, точный учет затрат на каждого арендатора и мониторинг. Без этих механизмов возникает риск утечки данных, несоответствия качества обслуживания или неконтролируемого роста расходов. AWS опубликовала вторую часть серии статей, посвященную реализации таких систем с помощью Amazon Bedrock AgentCore.

Предложенная архитектура использует трехуровневую иерархию: Уровень (Tier) → Арендатор (Tenant) → Пользователь (User). Изоляция обеспечивается на каждом уровне через документы в базе знаний, память, доступ к моделям и учет затрат. Для примера взяты медицинские ИИ-ассистенты: базовый тариф для небольших клиник использует модель Mistral Ministral 3 8B Instruct, а премиум-тариф для больниц и специализированных центров — OpenAI GPT OSS 120B с продвинутыми возможностями рассуждений и доступом к веб-поиску.

Компонент	Назначение
Amazon Cognito	Аутентификация и хранение метаданных арендатора в JWT
Amazon API Gateway	Маршрутизация запросов и тарифные лимиты
AWS Lambda	Извлечение контекста арендатора и вызов агента
AgentCore (Runtime, Memory, Identity, Gateway, Policy)	Выполнение агента, управление состоянием, идентификация, инструменты, политики
Amazon S3	Хранение документов в изолированных корзинах

Решение использует пул-модель, при которой арендаторы разделяют общую инфраструктуру, а изоляция достигается логическими механизмами — идентификаторами, политиками доступа и разделением данных. Такой подход максимизирует утилизацию ресурсов и упрощает эксплуатацию. Для управления доступом применяются Amazon Cognito (хранение метаданных арендатора в JWT), API Gateway (маршрутизация и тарифные лимиты) и AWS Lambda (извлечение контекста и вызов агента). Агенты используют компоненты AgentCore: Runtime, Memory, Identity, Gateway и Policy.

Разделение на тарифы Basic (Mistral Ministral 3B) и Premium (OpenAI GPT OSS 120B) с разными возможностями.

Ключевые преимущества — возможность точно отслеживать затраты на каждого арендатора и легко масштабировать систему. Поскольку пул-модель не требует выделенных ресурсов для каждого клиента, операционные расходы снижаются, а внедрение новых арендаторов упрощается. Архитектура подходит для SaaS-платформ, корпоративных решений и управляемых сервисов. Исходный код примера доступен на GitHub.

Разобраться глубже

ИИ-агенты для бизнеса: что это и где применять

ИИ-агенты для бизнеса простыми словами: чем агент отличается от чат-бота, из каких четырёх частей собирается, какие бывают уровни автономности, карта из 10 сценариев применения, кейс сервисной компании и расчёт окупаемости агента поддержки.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ

По теме

Microsoft запустила Azure Copilot Observability Agent для мониторинга облачных систем

Продолжить по разделам

Общая инфраструктура, изолированные арендаторы

Кратко

Читать дальше

NVIDIA Agent Toolkit: открытый модульный набор для ИИ-агентов

Автоматизация генерации контента: ComfyUI на Amazon SageMaker ИИ

Microsoft запустила Azure Copilot Observability Agent для мониторинга облачных систем