BoltzGen на Amazon SageMaker ИИ ускоряет дизайн белков с минимальными затратами

Подготовлено редакцией Malakhov AI

AWS Machine Learning Blog·12 часов назад·2 минЛабораторииКод

Диффузионная модель BoltzGen, предназначенная для дизайна белков-связывателей, интегрирована с Amazon SageMaker ИИ, что автоматизирует управление GPU-инфраструктурой. Кампания из 1000 образцов на 4-GPU инстансе ml.g5.12xlarge занимает ~375 часов, а двухчасовой прогон на ml.g4dn.xlarge стоит около $1,50.

Кратко

—BoltzGen — диффузионная модель для генерации белков и пептидов, связывающихся с заданными мишенями.
—SageMaker ИИ автоматизирует provisioning, выполнение и уборку GPU-инстансов, устраняя операционные издержки.
—Доступны два режима: быстрые Processing Jobs и масштабируемые Pipelines с кэшированием шагов.
—Стоимость двухчасового прогона на ml.g4dn.xlarge составляет около $1,50, биллинг посекундный.
—Поддерживаются инстансы от ml.g4dn (T4) до ml.g6e (L40S) для баланса производительности и бюджета.

Глоссарий · 3 термина▾

диффузионная модель: Генеративная модель, которая постепенно добавляет шум к данным и учится восстанавливать их, создавая новые образцы.
обратное сворачивание (inverse folding): Задача предсказания аминокислотной последовательности по заданной трехмерной структуре белка.
фолдинг: Процесс предсказания трехмерной структуры белка по его аминокислотной последовательности.

BoltzGen — это диффузионная модель, которая генерирует структуры белков и пептидов, способных связываться с заданными биомолекулярными мишенями. Процесс дизайна включает несколько этапов: генерация основной цепи (backbone), обратное сворачивание (inverse folding) для подбора аминокислотных последовательностей, валидация структуры с помощью Boltz2 и ранжирование кандидатов. Каждый из этих этапов требует использования GPU-вычислений, а типичная кампания включает сотни и тысячи образцов. Это создает значительную операционную нагрузку: нужно выделять инстансы, передавать данные между шагами, отслеживать затраты и восстанавливаться после сбоев.

Amazon SageMaker ИИ автоматизирует этот жизненный цикл: после отправки задания платформа самостоятельно выделяет GPU-инстанс, запускает в нем контейнер с BoltzGen, сохраняет результаты в S3 и освобождает ресурсы. Биллинг посекундный, поэтому нет затрат на простой. По данным из репозитория, кампания из 1000 образцов на 4-GPU инстансе ml.g5.12xlarge занимает около 375 часов. Для более коротких экспериментов, например двухчасовой прогон на ml.g4dn.xlarge, стоимость составит примерно $1,50.

Режим	Описание	Когда использовать
Processing Jobs	Прямое пакетное выполнение, минимальное время настройки	Быстрые эксперименты, тестирование спецификаций
Pipelines	Оркестрованный 5-шаговый конвейер с кэшированием и масштабированием	Производственные рабочие нагрузки, итеративная работа

Реализация поддерживает два режима выполнения. Первый — SageMaker Processing Jobs: прямое пакетное выполнение для быстрых экспериментов, когда требуется минимизировать время настройки. Второй — SageMaker Pipelines: оркестрованный пятишаговый конвейер с кэшированием результатов на 7 дней в S3. Это особенно важно для итеративной работы: шаг генерации, на который приходится около 90% вычислительных затрат, не перезапускается при изменении параметров фильтрации. Каждый шаг (дизайн, обратное сворачивание, фолдинг, анализ, фильтрация) можно масштабировать независимо.

Pipeline mode architecture diagram showing five sequential steps: Design, Inverse Folding, Folding, Analysis, and Filtering, with cached intermediate outputs in Amazon S3 · Источник: AWS Machine Learning Blog

Выбор инстансов варьируется от ml.g4dn (T4 GPU, минимальная стоимость) до ml.g6e (NVIDIA L40S). Это позволяет подбирать инстанс под требуемый бюджет и пропускную способность. Решение ориентировано на академические лаборатории, биотехнологические стартапы, фармацевтические R&D-отделы и образовательные программы. Исходный код и скрипты развертывания доступны в репозитории GitHub.

Разобраться глубже

Как внедрить ИИ в бизнес в 2026 году: пошаговый план для руководителя

Практический гайд для руководителя: как выбрать первый проект с ИИ, подготовить данные, посчитать экономику и довести пилот до рабочего процесса.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ

По теме

Google Research открыла карту отражательной способности крыш для 50+ городов

Продолжить по разделам

BoltzGen на Amazon SageMaker ИИ ускоряет дизайн белков с минимальными затратами

Кратко

Читать дальше

Amazon Bedrock в AWS GovCloud (US) получил OpenAI GPT OSS и NVIDIA Nemotron

NVIDIA Isaac ROS: открытая платформа для роботов на CUDA-ускорении

Google Research открыла карту отражательной способности крыш для 50+ городов