В конце июня пользователи Claude Opus 4.8 — самой дорогой подписки Anthropic за $200 в месяц — массово зафиксировали падение качества ответов. Модель забывала контекст диалога, обращалась не к тем файлам и выдавала результаты, требующие многократной переделки. Проблема проявилась не у единичных пользователей: на GitHub и форумах появились десятки жалоб, а независимые замеры показали ухудшение метрик.
Термин «нёрф» пришёл из онлайн-игр: так называют ослабление сильного персонажа или оружия патчем. В случае с ИИ нёрф — это скрытое ухудшение модели, когда разработчик тихо снижает качество, не публикуя changelog. Именно это, по мнению многих наблюдателей, произошло с Opus 4.8 в конце июня.
| Дата | Событие |
|---|---|
| 28 мая | Релиз Claude Opus 4.8, инвестраунд $65 млрд при оценке $965 млрд |
| 1 июня | Anthropic подаёт документы на IPO (данные Fortune) |
| 9 июня | Релиз Fable 5 — новой флагманской линейки выше Opus |
| 12 июня | Правительство США блокирует Fable 5 экспортным контролем |
| 30 июня | Блокировка снята, выход Sonnet 5 — дешёвой альтернативы Opus |
| 1 июля | Fable 5 возвращается с новыми классификаторами безопасности |
Хронология событий указывает на совпадение с бизнес-циклом Anthropic. 28 мая компания выпустила Opus 4.8 и одновременно закрыла инвестраунд на $65 млрд при оценке $965 млрд. Уже 1 июня, по данным Fortune, Anthropic конфиденциально подала документы на IPO, запланированное на осень. 9 июня вышла Fable 5 — новая флагманская линейка выше Opus, с рекордами в бенчмарках, но 12 июня правительство США заблокировало её экспортным контролем из-за рисков безопасности. 30 июня блокировку сняли, и в тот же день Anthropic представила Sonnet 5 — модель, позиционируемую как «производительность, близкая к Opus 4.8», но в два с половиной раза дешевле ($2 против $5 за миллион токенов промо-цены).
Ухудшение совпало с релизом Sonnet 5 и возвращением Fable 5 — более новых и дешевых моделей.
Экономический контекст объясняет возможную мотивацию. Anthropic готовится к IPO, и ей важно демонстрировать рост выручки и снижение затрат на инфраструктуру. Перевод пользователей с дорогого Opus на более дешёвую Sonnet снижает операционные расходы и увеличивает маржинальность. При этом компания не публикует никаких метрик качества модели — есть только статус-страница доступности API, но не «качества ответов». За июнь статус-страница зафиксировала 26 признанных сбоев Opus 4.8, но ни одного уведомления об изменении поведения модели.
Остаётся неясным, был ли нёрф Opus 4.8 намеренным или стал побочным эффектом технических изменений. Anthropic официально не комментировала жалобы пользователей. Однако сама компания ранее признавала, что тайно ухудшала ответы для некоторых пользователей — хотя и «не для всех». В отсутствие публичных бенчмарков и обязательств по прозрачности пользователям остаётся лишь гадать, не станет ли их модель хуже ровно перед выходом новой.

