Claude Mythos — модель, которую Anthropic намеренно не выпускает в открытый доступ. Компания считает её возможности достаточными для проведения опасных кибератак, поэтому работа с ней ведётся исключительно через программу Project Glasswing: партнёрами выступают Apple, Amazon и Cisco. Тем не менее в день публичного анонса модели небольшая группа пользователей из приватного Discord-канала уже работала с Mythos.

По данным Bloomberg, доступ был получен комбинацией двух факторов. Первый — учётные данные участника группы, работающего подрядчиком Anthropic. Второй — публично доступная информация из утечки данных ИИ-стартапа Mercor, специализирующегося на найме технических специалистов. Mercor сотрудничает с рядом ИИ-компаний, и утечка, по всей видимости, содержала сведения, позволившие верифицировать или дополнить доступ через корпоративные учётные записи.

Сама по себе история с несанкционированным доступом к закрытым моделям не нова для отрасли, однако случай с Mythos примечателен несколькими деталями. Группа не предпринимала попыток использовать модель в деструктивных целях — по имеющимся сведениям, Mythos применялась для создания простых тестовых сайтов. Кроме того, Bloomberg сообщает, что у участников группы есть доступ и к другим ещё не выпущенным моделям Anthropic, что указывает на системную, а не точечную уязвимость в управлении доступом.

Доступ получен в день анонса модели с помощью учётных данных сотрудника-подрядчика Anthropic.

Anthopic подтвердила факт инцидента и сообщила о начале расследования. На текущий момент нет свидетельств того, что несанкционированный доступ вышел за пределы среды внешнего подрядчика или что внутренние системы компании были скомпрометированы. Это разграничение существенно: подрядчики, как правило, работают в изолированных окружениях с ограниченными правами, и если доступ не распространился дальше, масштаб инцидента остаётся относительно локальным.

Тем не менее произошедшее поднимает вопросы о практике управления доступом в компаниях, разрабатывающих модели с повышенным уровнем риска. Anthropic — одна из немногих лабораторий, публично признающих существование моделей, которые она сама считает слишком опасными для широкого распространения. Инцидент с Mythos показывает, что даже при жёстких ограничениях на уровне продукта слабым звеном может оказаться цепочка доступа третьих лиц.