Amazon SageMaker ИИ получил поддержку запуска ComfyUI-воркфлоу в режиме processing jobs. Это позволяет автоматизировать пакетную генерацию медиаконтента — от изображений до видео — без ручного управления инфраструктурой.
ComfyUI — это node-based визуальный конструктор для генеративных нейросетей. Пользователь собирает пайплайн из готовых блоков (загрузка модели, промпт, сэмплер, вывод), не требуя программирования. Такой граф можно сохранить как JSON и повторно использовать. SageMaker ИИ Processing Jobs запускает эти сценарии на GPU-инстансах, гарантируя высокую скорость и автоматическое завершение — плата взимается посекундно.
| Параметр | Значение |
|---|---|
| Название модели | Z-Image Turbo |
| Параметры | 6 млрд |
| Архитектура | S3DiT (Scalable Single-Stream Transformer) |
| Слои | 30 |
| Скрытая размерность | 3840 |
| Головки внимания | 32 |
| Размер FFN | 10240 |
| Тип | Decoder-only Transformer |
В качестве примера AWS приводит модель Z-Image Turbo. Она основана на архитектуре Scalable Single-Stream Transformer (S3DiT) c 6 миллиардами параметров. Отличительная особенность — Early Fusion: текстовые и визуальные токены обрабатываются единым Transformer-декодером, что улучшает кросс-модальное взаимодействие. Z-Image Turbo состоит из 30 слоёв со скрытой размерностью 3840, 32 головками внимания и промежуточным слоем FFN размером 10240.

Основное преимущество подхода — масштабируемость. Вместо последовательной ручной генерации можно отправлять на SageMaker сотни заданий, каждое использует свой вариант промпта для персонализации контента. Например, для глобальной кампании можно за час создать сотни вариантов социальных изображений, соответствующих бренд-гайдлайнам.
Используя SageMaker's pay-per-second billing, вы платите только за реальное время вычислений. Очередь задач масштабируется автоматически, а при отсутствии заданий инстансы останавливаются. Это делает решение экономически эффективным для предприятий, которые хотят внедрить ИИ-генерацию, не инвестируя в выделенные GPU-серверы.
Хотя пример сфокусирован на изображениях, ComfyUI поддерживает также аудиосинтез, 3D-рендеринг и динамическую видеоанимацию. Разработчик может заменить воркфлоу на свой — достаточно убедиться, что в контейнере установлены нужные модели и кастомные ноды. AWS Cloud Development Kit (CDK) позволяет развернуть инфраструктуру одной командой.



