Четыре дисциплины production-агента: меньше инструкций — лучше результат

Подготовлено редакцией Malakhov AI

Habr AI·6 дней назад·3 минРоссияКод

Anthropic за последний год переосмыслила подход к построению агентов: чем сильнее модель, тем больше вреда приносит избыточная обвязка вокруг неё. Автор серии на Habr разбирает четыре базовых дисциплины, на которых держится агент в production, — и три из четырёх сводятся к тому, чтобы убрать лишнее.

Кратко

—Context engineering: раздутый системный промпт снижает качество — важное «тонет» в токенах, возникает context rot.
—Tool design: десяток узких инструментов под каждый API-эндпойнт хуже, чем несколько широких под реальные задачи агента.
—Agent Skills: стандарт упаковки навыков в папку с SKILL.md вышел в октябре 2025, за три месяца его поддержали 30+ инструментов.
—Обвязка кодирует устаревшие допущения: пример Anthropic — «context anxiety» у Sonnet 4.5 исчезла в Opus 4.5, но костыль остался в коде.
—Сильной модели не нужна пошаговая диктовка — ей нужен общий примитив и цель.

Глоссарий · 7 терминов▾

context rot: Деградация качества ответов языковой модели при очень длинном контексте: модель начинает противоречить себе, путать инструкции и галлюцинировать.
harness: Обвязка вокруг языковой модели — код и инфраструктура, которые управляют контекстом, инструментами, памятью и циклом работы агента.
context engineering: Практика управления тем, какой именно набор токенов видит модель в момент генерации ответа, в противовес простому написанию инструкций.
Agent Skills: Открытый стандарт упаковки навыка агента (инструкция + файлы) в папку с файлом SKILL.md, позволяющий подключать навык по требованию, а не держать его в промпте постоянно.
CLAUDE.md: Файл с постоянным контекстом проекта, который агент читает в начале каждой сессии, чтобы не выводить структуру заново.
context anxiety: Поведение модели Sonnet 4.5, при котором та сворачивала задачу раньше времени, «чувствуя» приближение лимита контекстного окна.
LLM: Large Language Model — большая языковая модель, нейросеть, обученная на текстах и способная генерировать связный текст, код и рассуждения.

Anthropic в серии инженерных постов за 2024–2025 годы последовательно пришла к неочевидному выводу: прежняя обвязка вокруг языковой модели начинает её сдерживать по мере роста возможностей самой модели. Это не абстрактный тезис — компания приводит конкретный пример. Модель Sonnet 4.5 страдала от «context anxiety»: чувствуя приближение лимита контекста, она сворачивала задачу раньше времени. В harness добавили принудительный сброс контекста. Когда вышел Opus 4.5, поведение исчезло само — а сброс остался в коде мёртвым грузом. Anthropic формулирует это прямо: «harnesses encode assumptions about what Claude can't do on its own» — и допущения устаревают.

Автор серии на Habr структурирует накопленный опыт в семь дисциплин. Первая часть посвящена четырём базовым. Первая — context engineering. Контекст не бесплатен: платишь не деньгами, а вниманием модели. Чем больше токенов в окне, тем хуже модель удерживает важное. На длинных контекстах возникает context rot — модель начинает противоречить себе и путать инструкции. Решение: держать в контексте минимально достаточный набор, рабочую память выносить во внешний файл (например, claude-progress.txt), постоянный контекст проекта — в CLAUDE.md. Инструкции «на всякий случай», которые ни разу не сработали, из промпта убирать.

Дисциплина	Суть сдвига	Было	Стало
Context engineering	Меньше токенов — лучше внимание модели	Всё в системный промпт «на всякий случай»	Минимальный контекст + внешняя память (claude-progress.txt, CLAUDE.md)
Tool design	Инструменты под задачи агента, не под API	По инструменту на каждый эндпойнт (get_user, find_user…)	Узкий набор под реальные задачи + общие примитивы
Agent Skills	Навык подтягивается по требованию	Навык зашит в системный промпт постоянно	Папка SKILL.md, подключается когда нужен

Вторая дисциплина — tool design. Anthropic в посте «Writing tools for agents» разграничивает API для разработчика и инструмент для агента: первый — контракт между двумя детерминированными системами, второй — между детерминированной системой и недетерминированной моделью, которая может ошибиться или выбрать не тот инструмент. Отсюда практические следствия: не делать по инструменту на каждый API-эндпойнт (get_user, find_user, list_users, search_users — это четыре точки выбора, на каждой модель тратит контекст и может промахнуться), возвращать осмысленный контекст вместо голых ID, контролировать размер ответа через пагинацию и фильтрацию. Описание инструмента — это промпт: каждое слово в имени и описании влияет на то, выберет ли модель его правильно. Чем сильнее модель, тем дальше она уходит на общих примитивах — файловая система, выполнение кода, bash — вместо россыпи узких функций.

Tool design: десяток узких инструментов под каждый API-эндпойнт хуже, чем несколько широких под реальные задачи агента.

Третья дисциплина — Agent Skills. Это способ упаковать навык (инструкцию плюс опциональные скрипты и файлы) в папку с одним файлом SKILL.md. Anthropic выпустила фичу в октябре 2025, в декабре 2025 опубликовала открытый стандарт на agentskills.io. За три месяца его поддержали более тридцати инструментов: Claude Code, Codex CLI от OpenAI, Cursor, Copilot, Gemini CLI. Стандарт позволяет не держать навык в системном промпте постоянно, а подтягивать его по требованию — что прямо следует из логики context engineering.

Четвёртая дисциплина в материале обозначена как фундамент для остальных: сквозной принцип компенсации. Production-агент — это модель плюс всё, что построено вокруг неё, чтобы закрыть реальные дыры: у LLM нет встроенного сигнала «пора остановиться», нет памяти о предыдущих попытках, нет ощущения времени. Всё это вкручивается снаружи — потолки итераций, лог попыток, таймеры, чекпоинты. Но компенсировать нужно ровно столько, сколько модель ещё не умеет сама. Автор использует метафору: леса вокруг стройки бывают подпоркой, а бывают клеткой. Вторая часть серии обещает три frontier-дисциплины и полную карту.

Разобраться глубже

Как внедрить ИИ в бизнес в 2026 году: пошаговый план для руководителя

Практический гайд для руководителя: как выбрать первый проект с ИИ, подготовить данные, посчитать экономику и довести пилот до рабочего процесса.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ

Продолжить по разделам