Anthropic выпустила модель Claude Sonnet 5, которая по заявлению компании является самой агентной в линейке Sonnet. В опубликованных бенчмарках модель приближается к показателям более дорогой Opus 4.8, а в некоторых тестах даже превосходит её. При этом вводная цена на токены вдвое ниже, чем у предшественника: $2 за миллион входных и $10 за миллион выходных токенов до 31 августа 2026 года, после чего стоимость вернётся к уровню $3 и $15.
На тесте агентного программирования SWE-bench Pro Sonnet 5 набрал 63,2%, что выше 58,1% у Sonnet 4.6, но ниже 69,2% у Opus 4.8. В Terminal-Bench 2.1 модель показала 80,4% против 67,0% у предшественника. На мультидисциплинарном экзамене Humanity's Last Exam результат с инструментами достиг 57,4%, почти сравнявшись с Opus 4.8 (57,9%). В тесте на использование компьютера OSWorld-Verified модель набрала 81,2% против 78,5% у
| Бенчмарк | Sonnet 4.6 | Sonnet 5 | Opus 4.8 |
|---|---|---|---|
| SWE-bench Pro | 58,1% | 63,2% | 69,2% |
| Terminal-Bench 2.1 | 67,0% | 80,4% | — |
| Humanity's Last Exam (с инструментами) | — | 57,4% | 57,9% |
| OSWorld-Verified | 78,5% | 81,2% | — |
| GDPval-AA v2 (баллы) | — | 1 618 | 1 615 |
Anthropic подчёркивает, что Sonnet 5 действует гораздо более агентно, чем предшественник, — способен составлять планы, использовать браузер и терминал, работать автономно. Однако из-за этого реальное потребление токенов на задачу может оказаться выше, чем у более старых моделей, что увеличит итоговую стоимость. По безопасности компания указывает, что модель не обучалась на задачах кибербезопасности и в тестах на эксплуатацию уязвимостей показывает низкие результаты — хуже, чем Opus 4.8 и заблокированные Mythos 5 и Fable 5. Защиты от киберугроз включены по умолчанию.
На тесте знаний GDPval-AA v2 модель обходит Opus 4.8 — 1 618 баллов против 1 615.

Сам факт выпуска Sonnet 5 на фоне блокировки USA двух мощных моделей Anthropic (Mythos 5 и Fable 5) указывает на стремление компании предлагать безопасные альтернативы. Модель уже доступна на всех тарифах и через API под именем claude-sonnet-5 с окном контекста в 1 миллион токенов.



