Amazon SageMaker ИИ получил поддержку запуска ComfyUI-воркфлоу в режиме processing jobs. Это позволяет автоматизировать пакетную генерацию медиаконтента — от изображений до видео — без ручного управления инфраструктурой.

ComfyUI — это node-based визуальный конструктор для генеративных нейросетей. Пользователь собирает пайплайн из готовых блоков (загрузка модели, промпт, сэмплер, вывод), не требуя программирования. Такой граф можно сохранить как JSON и повторно использовать. SageMaker ИИ Processing Jobs запускает эти сценарии на GPU-инстансах, гарантируя высокую скорость и автоматическое завершение — плата взимается посекундно.

ПараметрЗначение
Название моделиZ-Image Turbo
Параметры6 млрд
АрхитектураS3DiT (Scalable Single-Stream Transformer)
Слои30
Скрытая размерность3840
Головки внимания32
Размер FFN10240
ТипDecoder-only Transformer

В качестве примера AWS приводит модель Z-Image Turbo. Она основана на архитектуре Scalable Single-Stream Transformer (S3DiT) c 6 миллиардами параметров. Отличительная особенность — Early Fusion: текстовые и визуальные токены обрабатываются единым Transformer-декодером, что улучшает кросс-модальное взаимодействие. Z-Image Turbo состоит из 30 слоёв со скрытой размерностью 3840, 32 головками внимания и промежуточным слоем FFN размером 10240.

Автоматизация генерации контента: ComfyUI на Amazon SageMaker ИИ
· Источник: AWS Machine Learning Blog

Основное преимущество подхода — масштабируемость. Вместо последовательной ручной генерации можно отправлять на SageMaker сотни заданий, каждое использует свой вариант промпта для персонализации контента. Например, для глобальной кампании можно за час создать сотни вариантов социальных изображений, соответствующих бренд-гайдлайнам.

Используя SageMaker's pay-per-second billing, вы платите только за реальное время вычислений. Очередь задач масштабируется автоматически, а при отсутствии заданий инстансы останавливаются. Это делает решение экономически эффективным для предприятий, которые хотят внедрить ИИ-генерацию, не инвестируя в выделенные GPU-серверы.

Хотя пример сфокусирован на изображениях, ComfyUI поддерживает также аудиосинтез, 3D-рендеринг и динамическую видеоанимацию. Разработчик может заменить воркфлоу на свой — достаточно убедиться, что в контейнере установлены нужные модели и кастомные ноды. AWS Cloud Development Kit (CDK) позволяет развернуть инфраструктуру одной командой.