Anthropic возвращает Claude Fable 5 на Amazon Bedrock с новыми ограничениями

Подготовлено редакцией Malakhov AI

AWS Machine Learning Blog·9 часов назад·1 минЛабораторииКод

Завтра на платформе Amazon Bedrock снова станут доступны модели Anthropic Claude Fable 5, которые получили усиленные защиты для предотвращения злоупотреблений. В случае срабатывания ограничений модель автоматически переключается на Opus 4.8.

Кратко

—Anthropic Claude Fable 5 возвращается на Amazon Bedrock с улучшенными защитными механизмами.
—При срабатывании guardrails модель автоматически понижается до Opus 4.8.
—AWS и Anthropic совместно работали над безопасностью Project Glasswing.
—Новые модели обладают мощными возможностями в кибербезопасности, но предназначены для защитников.

Глоссарий · 5 терминов▾

Bedrock: Сервис AWS для доступа к фундаментальным моделям ИИ через API с корпоративными функциями безопасности.
Guardrails: Ограничения, встроенные в модель, чтобы предотвратить её использование в опасных или вредоносных сценариях.
Frontier models: Модели ИИ с наиболее продвинутыми возможностями, часто требующие особых мер безопасности при выпуске.
ИИ Red Team: Специализированная команда, которая тестирует модели ИИ на уязвимости и возможность злоупотреблений.
Project Glasswing: Совместный проект AWS и Anthropic по разработке безопасных методов выпуска мощных моделей ИИ.

Завтра на платформе Amazon Bedrock станут доступны модели Anthropic Claude Fable 5 с новыми защитными механизмами. Эти модели относятся к классу frontier, обладают расширенными возможностями, особенно в области кибербезопасности, но их широкое распространение требует дополнительных мер предосторожности. AWS и Anthropic, работая проекта Project Glasswing, разработали guardrails, которые должны предотвратить использование моделей злоумышленниками для глубокого исследования уязвимостей.

При срабатывании ограничений модель автоматически переключается на Opus 4.8 — также высокопроизводительную модель, уже доступную публично. Такой подход позволяет предоставить пользователям мощные инструменты, не давая существенных преимуществ атакующим. AWS подчёркивает, что цель — дать защитникам (компаниям, правительствам, академическим институтам) возможность укрепить свои системы раньше, чем злоумышленники получат доступ к новым возможностям.

Anthropic, в свою очередь, опубликовал блог "Redeploying Fable 5", где описывает принципы оценки серьёзности инцидентов и SLA по реагированию на уязвимости. Это первая структура для моделей, обладающих киберспособностями. AWS ИИ Red Team совместно с Anthropic дополнительно протестировала защиту. Компании намерены продолжать итерации и совершенствовать guardrails по мере появления новых моделей и накопления опыта.

При срабатывании guardrails модель автоматически понижается до Opus 4.8.

Разобраться глубже

Как внедрить ИИ в бизнес в 2026 году: пошаговый план для руководителя

Практический гайд для руководителя: как выбрать первый проект с ИИ, подготовить данные, посчитать экономику и довести пилот до рабочего процесса.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ

По теме

Google Research открыла карту отражательной способности крыш для 50+ городов

Продолжить по разделам

Anthropic возвращает Claude Fable 5 на Amazon Bedrock с новыми ограничениями

Кратко

Читать дальше

Anthropic представила Claude Sonnet 5 на Amazon Bedrock

NVIDIA BioNeMo Agent Toolkit интегрирован в научный ИИ-воркбенч Claude Science

Google Research открыла карту отражательной способности крыш для 50+ городов