Агентства, работающие в AWS GovCloud (US), получили доступ к новым open-weight моделям — OpenAI GPT OSS (120B и 20B) и всей линейке NVIDIA Nemotron (Super 120B, Nano 9B v2, 12B v2, 30B). Эти модели доступны через Amazon Bedrock и работают полностью внутри изолированной среды GovCloud, на инфраструктуре AWS, управляемой гражданами США на территории США. Это позволяет решать задачи, требующие высокой степени конфиденциальности и соответствия регуляторным требованиям, включая FedRAMP High, DoD SRG Impact Levels 2/4/5, ITAR и CJIS.
AWS GovCloud (US) — это набор изолированных регионов AWS, предназначенных для хранения конфиденциальных данных и выполнения регулируемых рабочих нагрузок. Регионы физически расположены в США и администрируются исключительно гражданами США. До сих пор спектр доступных моделей в GovCloud был ограничен; новый релиз существенно расширяет возможности выбора.
| Модель | Параметры (всего) | Активные на токен | Контекстное окно | Прирост пропускной способности |
|---|---|---|---|---|
| Nemotron 3 Super 120B | 120B | 12B | 1 млн | до 5x |
| Nemotron 3 Nano 30B | 30B | ~3B | 1 млн | до 4x |
Линейка NVIDIA Nemotron включает как малые (SLM), так и большие языковые модели (LLM) с архитектурой mixture-of-experts (MoE). Nemotron 3 Super (120B параметров всего, 12B активных на токен) обеспечивает до пятикратного прироста пропускной способности по сравнению с предыдущим поколением за счёт MoE-дизайна. Nemotron 3 Nano (30B параметров, ~3B активных) даёт четырёхкратный прирост пропускной способности. Обе модели поддерживают контекстное окно в 1 миллион токенов, что позволяет агентам сохранять долгосрочную память при многошаговых задачах. OpenAI GPT OSS (120B и 20B) — это open-weight модели для рассуждений и интеграции с инструментами; они поддерживают настраиваемые усилия рассуждения.
Модели работают полностью в изолированных регионах GovCloud, соответствующих требованиям FedRAMP High и ITAR.
Среди типовых применений — автоматизированная оценка соответствия безопасности, синтез разведывательных данных из множества документов, анализ контрактов и закупок, проверка соблюдения политик. Все вычисления выполняются внутри границы соответствия GovCloud, что исключает необходимость перемещать чувствительные данные за её пределы.
Разработчики могут использовать единый API Amazon Bedrock для выбора подходящей модели под конкретный сценарий без изменения кода приложения. Bedrock — полностью управляемый сервис, позволяющий обращаться к моделям от независимых провайдеров, при этом инференс выполняется на инфраструктуре AWS в регионе GovCloud.



