Apple запустила модели ИИ на серверах Google, сохранив архитектуру приватности

Подготовлено редакцией Malakhov AI

Ars Technica·9 июн.·2 минИсследования

AFM 3 Cloud Pro — модель Apple для сложных задач и агентных сценариев — работает на оборудовании Nvidia, принадлежащем Google. Чтобы сохранить прежние гарантии конфиденциальности, Apple адаптировала технологию Private Cloud Compute для сторонней инфраструктуры.

Кратко

—Модель AFM 3 Cloud Pro для сложных рассуждений и агентных задач размещена на Nvidia-серверах Google Cloud.
—Две другие облачные модели — AFM 3 Cloud и ADM 3 Cloud — по-прежнему работают на оборудовании Apple.
—На устройствах пользователей появилась локальная модель AFM 3 Core на базе Gemini, совместно разработанная Apple и Google.
—Для защиты данных на чужих серверах Apple использует Confidential Computing от Nvidia, Trust Domain Extensions от Intel и чип Titan от Google.
—Apple ведёт криптографически верифицируемый журнал всего оборудования Google Cloud в составе PCC-флота — устройства доверяют только ПО, подписанному Apple.

Глоссарий · 7 терминов▾

Private Cloud Compute (PCC): Технология Apple для обработки облачных запросов ИИ без сохранения данных пользователя и без доступа к ним со стороны сотрудников компании.
Confidential Computing: Подход к защите данных, при котором вычисления выполняются в изолированной аппаратной среде (trusted execution environment), недоступной даже для оператора сервера.
Trust Domain Extensions (TDX): Технология Intel, позволяющая изолировать виртуальные машины на уровне процессора так, чтобы гипервизор и облачный провайдер не имели доступа к их памяти.
Titan: Аппаратный чип безопасности Google, используемый для аттестации серверов — подтверждения того, что на машине запущено именно заявленное программное обеспечение.
Append-only ledger: Журнал, в который можно только добавлять записи, но не изменять или удалять существующие — это делает историю изменений криптографически проверяемой.
Агентные задачи (agentic tool use): Сценарии, в которых языковая модель самостоятельно вызывает внешние инструменты, API или выполняет многошаговые действия для достижения цели пользователя.
AFM / ADM: Внутренние обозначения Apple для семейств языковых (Apple Foundation Model) и диффузионных (Apple Diffusion Model) моделей, используемых в Apple Intelligence.

Вице-президент Apple по программному обеспечению Крейг Федериги представил архитектуру Apple Intelligence нового поколения, в центре которой — три уровня обработки запросов: локальная модель на устройстве, облачные модели на серверах Apple и, наконец, AFM 3 Cloud Pro на инфраструктуре Google Cloud.

Локальный уровень получил модель AFM 3 Core, разработанную совместно с Google на базе Gemini. Устройства с не менее чем 12 ГБ оперативной памяти и чипами M3/M4 или A19 Pro используют расширенную версию — AFM 3 Core Advanced, которая задействует дополнительное хранилище для улучшения диктовки и более выразительного голоса Siri. Более простые устройства ограничены базовой версией модели.

Модель	Назначение	Где работает
AFM 3 Core	Простые запросы на устройстве	Устройство пользователя
AFM 3 Core Advanced	Диктовка, выразительный голос Siri (12 ГБ+ RAM, M3/M4/A19 Pro)	Устройство пользователя
AFM 3 Cloud	Общие облачные задачи	Серверы Apple (кремний Apple)
ADM 3 Cloud	Генерация изображений	Серверы Apple (кремний Apple)
AFM 3 Cloud Pro	Агентные задачи, сложное рассуждение	Google Cloud (Nvidia-серверы)

Для «сложных» запросов устройство обращается к облаку. Здесь Apple разделила нагрузку на три модели: AFM 3 Cloud для общих задач, ADM 3 Cloud для генерации изображений и AFM 3 Cloud Pro для агентных сценариев и комплексного рассуждения. Первые две модели работают на собственном кремнии Apple в её дата-центрах. AFM 3 Cloud Pro — исключение: она размещена на Nvidia-серверах, принадлежащих Google.

Две другие облачные модели — AFM 3 Cloud и ADM 3 Cloud — по-прежнему работают на оборудовании Apple.

Federighi outlines the high-level architecture of its new Apple Intelligence capabilities. Credit: Andrew Cunningham · Источник: Ars Technica

Перенос части вычислений на чужую инфраструктуру потребовал переработки Private Cloud Compute (PCC) — технологии, которую Apple представила в 2024 году как гарантию того, что облачные запросы не сохраняются и не доступны даже сотрудникам компании. Новая итерация PCC опирается на три аппаратных механизма защиты: Confidential Computing от Nvidia изолирует вычисления на уровне GPU, Trust Domain Extensions от Intel защищают память на уровне процессора, а чип Titan от Google обеспечивает аппаратную аттестацию сервера.

Помимо аппаратных мер, Apple ведёт криптографически верифицируемый журнал с дозаписью (append-only ledger), в котором фиксируется всё оборудование Google Cloud, входящее в PCC-флот. Устройства Apple доверяют только программному обеспечению на этих серверах, если оно подписано самой Apple. Это означает, что Google технически не может развернуть на своих серверах иной код, который получал бы доступ к пользовательским данным.

Подобная архитектура отражает более широкую тенденцию в отрасли: крупные платформы всё чаще вынуждены балансировать между масштабируемостью публичных облаков и требованиями к конфиденциальности. Microsoft использует схожий подход в Azure Confidential Computing, а Google продвигает собственные Confidential VMs. Apple, однако, делает ставку на верифицируемость: пользователь теоретически может убедиться, что на сервере запущен именно тот код, который задекларирован.

Ограничения подхода очевидны: гарантии конфиденциальности здесь опираются на совокупность аппаратных и криптографических механизмов от нескольких вендоров, каждый из которых вносит свою поверхность атаки. Независимая проверка этих утверждений остаётся сложной задачей — Apple публикует технические описания PCC, но полный аудит сторонними исследователями пока не проводился в публичном пространстве.

Разобраться глубже

ИИ-агенты для бизнеса: что это и где применять

ИИ-агенты для бизнеса простыми словами: чем агент отличается от чат-бота, из каких четырёх частей собирается, какие бывают уровни автономности, карта из 10 сценариев применения, кейс сервисной компании и расчёт окупаемости агента поддержки.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ

По теме

Толстый и тонкий харнесс: принципы маршрутизации запросов ИИ-ассистента

Продолжить по разделам

Apple запустила модели ИИ на серверах Google, сохранив архитектуру приватности

Кратко

Читать дальше

ИИ-агенты ускорили научный софт в 60 раз, но не проверяют корректность науки

NFC-ключ за $9: физический блокиратор отвлекающих приложений

Толстый и тонкий харнесс: принципы маршрутизации запросов ИИ-ассистента