Anthropic собиралась незаметно ухудшать производительность Claude Fable 5 для пользователей, которые применяют модель для обучения конкурирующих систем. Механизм должен был работать без какого-либо предупреждения — исследователи просто получали бы деградированные ответы, не зная причины. После того как детали стали известны, компания столкнулась с резкой критикой и была вынуждена отступить.
«Мы сделали неверный выбор и приносим извинения за то, что не нашли правильного баланса», — заявила Anthropic изданию WIRED. Теперь компания обещает, что любые защитные меры будут видимы пользователям: если ограничение существует, оно будет явным.
Критика пришла с разных сторон. Дин Болл, бывший советник Белого дома по вопросам ИИ, назвал скрытый подход «шокирующе враждебным». Уилл Браун из open-source стартапа Prime Intellect сформулировал суть претензий прямо: «Это выглядело так, будто Anthropic говорит публике: мы не доверяем никому другому заниматься ИИ-исследованиями. Только мы имеем право это делать».
После публичной критики компания отказалась от этого подхода и принесла извинения, пообещав прозрачность.
Подобная политика затрагивает фундаментальный вопрос для отрасли: могут ли разработчики закрытых моделей контролировать, как именно их продукты используются в исследовательской цепочке? Большинство крупных LLM распространяются через API с условиями использования, запрещающими дистилляцию — перенос знаний модели в другую через обучение на её выходах. Однако явный запрет в условиях и скрытое техническое ухудшение качества — принципиально разные вещи. Первое оставляет пользователю выбор, второе лишает его информации для принятия решения.
Однако скандал с ограничениями для исследователей — не единственная проблема вокруг Fable 5. Модель требует хранения данных для работы новых классификаторов безопасности: промпты и ответы сохраняются на срок до 30 дней, а при выявлении нарушений политики — до двух лет. Для корпоративных пользователей с жёсткими требованиями к конфиденциальности это неприемлемо.
Микрософт уже отреагировала: по данным The Verge, компания ограничила использование Fable 5 внутри организации. Все остальные модели Claude работают у Microsoft в режиме нулевого хранения данных, тогда как Fable 5 не появляется даже в списке доступных моделей для внутренней версии GitHub Copilot. Это показательный сигнал: даже крупнейший корпоративный партнёр не готов принять условия, которые Anthropic считает необходимыми для обеспечения безопасности своей флагманской модели.
Ситуация обнажает противоречие, с которым сталкиваются все ведущие ИИ-лаборатории: чем мощнее модель, тем острее конфликт между коммерческими интересами, требованиями безопасности и ожиданиями открытости со стороны исследовательского сообщества. Anthropic в этом случае выбрала скрытый механизм защиты — и получила публичный урок о том, что доверие к инфраструктуре, на которой строится научная работа, не восстанавливается незаметно.
