Anthropic в серии инженерных постов за 2024–2025 годы последовательно пришла к неочевидному выводу: прежняя обвязка вокруг языковой модели начинает её сдерживать по мере роста возможностей самой модели. Это не абстрактный тезис — компания приводит конкретный пример. Модель Sonnet 4.5 страдала от «context anxiety»: чувствуя приближение лимита контекста, она сворачивала задачу раньше времени. В harness добавили принудительный сброс контекста. Когда вышел Opus 4.5, поведение исчезло само — а сброс остался в коде мёртвым грузом. Anthropic формулирует это прямо: «harnesses encode assumptions about what Claude can't do on its own» — и допущения устаревают.

Автор серии на Habr структурирует накопленный опыт в семь дисциплин. Первая часть посвящена четырём базовым. Первая — context engineering. Контекст не бесплатен: платишь не деньгами, а вниманием модели. Чем больше токенов в окне, тем хуже модель удерживает важное. На длинных контекстах возникает context rot — модель начинает противоречить себе и путать инструкции. Решение: держать в контексте минимально достаточный набор, рабочую память выносить во внешний файл (например, claude-progress.txt), постоянный контекст проекта — в CLAUDE.md. Инструкции «на всякий случай», которые ни разу не сработали, из промпта убирать.

ДисциплинаСуть сдвигаБылоСтало
Context engineeringМеньше токенов — лучше внимание моделиВсё в системный промпт «на всякий случай»Минимальный контекст + внешняя память (claude-progress.txt, CLAUDE.md)
Tool designИнструменты под задачи агента, не под APIПо инструменту на каждый эндпойнт (get_user, find_user…)Узкий набор под реальные задачи + общие примитивы
Agent SkillsНавык подтягивается по требованиюНавык зашит в системный промпт постоянноПапка SKILL.md, подключается когда нужен

Вторая дисциплина — tool design. Anthropic в посте «Writing tools for agents» разграничивает API для разработчика и инструмент для агента: первый — контракт между двумя детерминированными системами, второй — между детерминированной системой и недетерминированной моделью, которая может ошибиться или выбрать не тот инструмент. Отсюда практические следствия: не делать по инструменту на каждый API-эндпойнт (get_user, find_user, list_users, search_users — это четыре точки выбора, на каждой модель тратит контекст и может промахнуться), возвращать осмысленный контекст вместо голых ID, контролировать размер ответа через пагинацию и фильтрацию. Описание инструмента — это промпт: каждое слово в имени и описании влияет на то, выберет ли модель его правильно. Чем сильнее модель, тем дальше она уходит на общих примитивах — файловая система, выполнение кода, bash — вместо россыпи узких функций.

Tool design: десяток узких инструментов под каждый API-эндпойнт хуже, чем несколько широких под реальные задачи агента.

Третья дисциплина — Agent Skills. Это способ упаковать навык (инструкцию плюс опциональные скрипты и файлы) в папку с одним файлом SKILL.md. Anthropic выпустила фичу в октябре 2025, в декабре 2025 опубликовала открытый стандарт на agentskills.io. За три месяца его поддержали более тридцати инструментов: Claude Code, Codex CLI от OpenAI, Cursor, Copilot, Gemini CLI. Стандарт позволяет не держать навык в системном промпте постоянно, а подтягивать его по требованию — что прямо следует из логики context engineering.

Четвёртая дисциплина в материале обозначена как фундамент для остальных: сквозной принцип компенсации. Production-агент — это модель плюс всё, что построено вокруг неё, чтобы закрыть реальные дыры: у LLM нет встроенного сигнала «пора остановиться», нет памяти о предыдущих попытках, нет ощущения времени. Всё это вкручивается снаружи — потолки итераций, лог попыток, таймеры, чекпоинты. Но компенсировать нужно ровно столько, сколько модель ещё не умеет сама. Автор использует метафору: леса вокруг стройки бывают подпоркой, а бывают клеткой. Вторая часть серии обещает три frontier-дисциплины и полную карту.