Anthropic выпустила Opus 4.7 с обновлённым токенизатором и коротко предупредила: тот же текст теперь может занимать в 1.0–1.35 раза больше токенов «в зависимости от типа контента». Ни механизм изменений, ни граница применимости этих цифр официально не раскрыты. Разработчики, которые платят за API по числу токенов, столкнулись с тем, что расходы выросли без изменения тарифов — классическая скрытая инфляция.

Чтобы понять, как работает токенизация и почему она вообще может меняться между версиями модели, нужно разобраться в базовом механизме. Каждая языковая модель преобразует входной текст в последовательность токенов — числовых идентификаторов из заранее составленного словаря. Чем больше словарь, тем длиннее сочетания символов в нём представлены и тем меньше токенов нужно для передачи одного и того же текста. Исторически словари росли, и расход токенов снижался. В случае Opus 4.7 произошло нечто обратное: токенов стало больше, хотя это не обязательно означает уменьшение словаря — возможно, изменилась стратегия разбиения.

Тип контентаСимволовТокенов 4.6Токенов 4.7Коэффициент
Technical docs (English)2 5414787041.47
Shell script2 6321 0331 4361.39
TypeScript code4 4181 2081 6401.36
Spanish prose2 5297339861.35
Markdown with code blocks2 3786048121.34
Python code3 1828641 1121.29
English prose2 2025086111.20
JSON (dense)48 06713 93915 7061.13
Tool definitions (JSON Schema)2 5217388261.12
CSV (numeric)9 5465 0445 4141.07
Japanese prose9938568661.01
Chinese prose7507797891.01

Исследователи в интернет-обсуждениях предложили несколько версий. Рисёрчер Натан Ламберт предположил смену базовой модели. В ответном треде появились альтернативные объяснения: токенизация может меняться даже при том же словаре, если алгоритм выбирает более короткие сочетания символов — это улучшает качество в задачах вроде посимвольной обработки строк. Отдельная публикация показала, что числа лучше токенизировать справа налево, имитируя человеческое восприятие разрядов, — это положительно сказывается на арифметике.

Сильнее всего токенизация изменилась для текстов заглавными буквами (капслок, SQL, shell-скрипты) — прирост превышает 1.5x.

Токенизатор Opus 4.7 делает русский текст дороже: что показали замеры через API
· Источник: Habr AI

Практические замеры провели несколько разработчиков. Саймон Уиллисон, создатель Django, воспользовался Token Counting API от Anthropic и обнаружил, что стандартный системный промпт в Opus 4.7 занял в 1.46x больше токенов, чем в 4.6, — выше заявленного максимума. Большой PDF-файл дал всего 1.08x. Билл Чемберс собрал краудсорсинговую выборку промптов и получил среднее значение 1.36x, также превышающее официальную планку. Он же зафиксировал, что тексты в верхнем регистре (капслок, SQL-запросы, shell-скрипты) дают прирост свыше 1.5x.

Наиболее детальный анализ по типам контента провёл Абишек Рэй. Технические документы на английском показали коэффициент 1.47, shell-скрипты — 1.39, TypeScript-код — 1.36, испанская проза — 1.35, Python-код — 1.29, английская проза — 1.20. JSON с плотными данными — 1.13, CSV с числами — 1.07. Китайская и японская проза — 1.01, то есть практически без изменений. Числовые данные тоже почти не затронуты.

Русский язык в выборке Рэя отсутствовал. Авторы материала — команда, разрабатывающая редактор кода с поддержкой нескольких ИИ-моделей, — заполнили этот пробел самостоятельно. Они прогнали через тот же Token Counting API тексты от бюрократических документов до JSON-файлов с русскоязычными значениями. Дополнительно они зафиксировали рост служебного оверхеда: при отправке промпта «в один токен» Opus 4.6 возвращал 8 токенов (7 служебных), Opus 4.7 — уже 12 (11 служебных). Для коротких запросов это заметная разница.

Практический вывод для разработчиков, работающих с Opus через API: стоит пересчитать бюджеты с учётом реального коэффициента для своего типа контента, а не ориентироваться на официальные 1.0–1.35x. Код с заглавными буквами, SQL и shell-скрипты — зоны повышенного риска. Рэй также проверил модель по бенчмарку IFEval на следование инструкциям и сделал осторожный вывод: небольшое улучшение качества есть, но оправдывает ли оно рост стоимости — каждый решает сам.