Шифрование на всём пути: как запустить ML-инференс на AWS без раскрытия данных

Подготовлено редакцией Malakhov AI

AWS Machine Learning Blog·8 июн.·3 минЛабораторииКод

Библиотека concrete-ml от Zama в связке с Amazon SageMaker ИИ позволяет выполнять ML-инференс так, что данные остаются зашифрованными на протяжении всего вычисления — включая промежуточные результаты внутри модели. Подход основан на полностью гомоморфном шифровании (FHE) и не требует доверенной аппаратной среды.

Кратко

—FHE позволяет модели обрабатывать зашифрованный запрос и возвращать зашифрованный ответ — без единого момента дешифрования на сервере.
—concrete-ml версии 1.9.0 совместима по API с scikit-learn и поддерживает несколько типов моделей «из коробки», не требуя ручной реализации алгоритмов.
—Архитектура включает кастомный Docker-контейнер для обучения в SageMaker ИИ и отдельный клиент, который шифрует запросы локально перед отправкой.
—В отличие от AWS Nitro Enclaves, где данные расшифровываются внутри изолированной среды, FHE не раскрывает данные ни на каком этапе — безопасность обеспечивается математикой.
—Лицензия concrete-ml от Zama допускает прототипирование и некоммерческое использование бесплатно; коммерческое применение требует платной лицензии.

Глоссарий · 7 терминов▾

FHE (полностью гомоморфное шифрование): Схема шифрования, при которой математические операции можно выполнять прямо над зашифрованными данными, получая результат, идентичный вычислению над открытым текстом.
ML-инференс: Применение обученной модели машинного обучения к новым данным для получения предсказания или классификации.
concrete-ml: Библиотека компании Zama для обучения и развёртывания ML-моделей с поддержкой FHE; совместима по API с scikit-learn.
Amazon SageMaker ИИ: Управляемый сервис AWS для обучения, развёртывания и мониторинга моделей машинного обучения в облаке.
Nitro Enclaves: Технология AWS для создания аппаратно изолированных вычислительных сред внутри EC2-инстансов, где данные обрабатываются в открытом виде, но недоступны гипервизору.
квантизация модели: Снижение точности числовых весов и активаций модели (например, с 32-битных до 8-битных), необходимое для совместимости с FHE-вычислениями.
Amazon ECR: Управляемый реестр контейнерных образов AWS, используемый для хранения и развёртывания Docker-образов.

Стандартная схема облачного ML-инференса предполагает, что провайдер хотя бы на мгновение видит данные в открытом виде. Даже если канал передачи зашифрован, внутри вычислительной среды запрос расшифровывается перед подачей в модель. Именно этот момент становится проблемой для медицинских организаций, телеком-операторов и компаний, работающих с коммерческой тайной.

Полностью гомоморфное шифрование (FHE) устраняет этот разрыв математически. Схема позволяет выполнять арифметические операции прямо над зашифрованными данными — результат после расшифровки совпадает с тем, что получилось бы при работе с открытым текстом. Применительно к ML это означает: модель принимает зашифрованный вектор признаков, производит вычисления в зашифрованном пространстве и возвращает зашифрованный результат. Ключ для расшифровки есть только у клиента.

Подход	Данные во время вычисления	Основа безопасности	Пример реализации в AWS
FHE	Остаются зашифрованными	Математика (Learning With Errors)	concrete-ml + SageMaker AI
Доверенная среда (TEE)	Расшифровываются внутри анклава	Аппаратная изоляция и аттестация	AWS Nitro Enclaves

AWS опубликовала подробное руководство по интеграции библиотеки concrete-ml версии 1.9.0 с Amazon SageMaker ИИ. concrete-ml разработана компанией Zama специально для FHE-инференса и совместима по API с scikit-learn — это означает, что многие существующие пайплайны можно адаптировать без переписывания логики обучения. Библиотека поддерживает несколько классов моделей «из коробки»: линейные классификаторы, деревья решений, градиентный бустинг и нейронные сети с квантизацией.

concrete-ml версии 1.9.0 совместима по API с scikit-learn и поддерживает несколько типов моделей «из коробки», не требуя ручной реализации алгоритмов.

Architecture diagram showing the training workflow: Model trainer provides training data and training container image to AWS Cloud. Training data goes to S3 data bucket, container image to ECR registry. Both feed into Amazon SageMaker AI wh · Источник: AWS Machine Learning Blog

Архитектура решения состоит из трёх частей. Первая — кастомный Docker-контейнер на базе Python 3.12 с зафиксированными версиями пакетов (concrete-ml 1.9.0, concrete-python 2.10.0, torch 2.3.1), который публикуется в Amazon ECR и используется для обучения в SageMaker ИИ. Обучение происходит на открытых данных после нормализации признаков, как правило, к диапазону [-1, 1]. Вторая часть — эндпоинт SageMaker ИИ, развёрнутый из аналогичного контейнера для инференса. Третья — клиентская библиотека, которая шифрует запрос локально, отправляет его на эндпоинт и расшифровывает ответ.

Важно разграничить FHE и конкурирующий подход — доверенные среды исполнения (TEE), которые AWS реализует через Nitro Enclaves. В Nitro Enclaves данные расшифровываются внутри аппаратно изолированного анклава с CPU и памятью, недоступными для гипервизора. Безопасность здесь опирается на аппаратные гарантии и аттестацию. При FHE данные не расшифровываются вообще — безопасность определяется сложностью математических задач (в частности, задачи Learning With Errors). Оба подхода дополняют друг друга и решают разные модели угроз.

Практические сценарии, которые AWS приводит в качестве примеров, охватывают три отрасли. В здравоохранении страховая компания может предоставить врачам облачную модель прогнозирования исходов процедур, не получая доступа к данным пациентов. В энергетике нефтегазовая корпорация может обрабатывать спутниковые снимки чувствительных локаций в облаке, не раскрывая их провайдеру. В телекоме оператор может фильтровать спам в письмах клиентов, соблюдая требования регуляторов о шифровании сообщений у третьих сторон.

Ограничения подхода связаны прежде всего с производительностью: FHE-вычисления значительно медленнее операций над открытым текстом, поэтому на практике применяются квантизованные модели с ограниченной точностью. Кроме того, concrete-ml требует строгого совпадения версий Python, concrete-ml и concrete-python на стороне клиента и сервера — любое расхождение нарушает совместимость зашифрованных данных. Лицензионная политика Zama допускает бесплатное использование для прототипирования и некоммерческих проектов; коммерческое применение требует отдельного соглашения.

Разобраться глубже

Как внедрить ИИ в бизнес в 2026 году: пошаговый план для руководителя

Практический гайд для руководителя: как выбрать первый проект с ИИ, подготовить данные, посчитать экономику и довести пилот до рабочего процесса.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ

По теме

NFC-ключ за $9: физический блокиратор отвлекающих приложений

Продолжить по разделам

Шифрование на всём пути: как запустить ML-инференс на AWS без раскрытия данных

Кратко

Читать дальше

Толстый и тонкий харнесс: принципы маршрутизации запросов ИИ-ассистента

ИИ-агенты ускорили научный софт в 60 раз, но не проверяют корректность науки

NFC-ключ за $9: физический блокиратор отвлекающих приложений