Разбор Context Engineering полезен тем, что переводит разговор об агентах из области удачных формулировок в область системного дизайна. Автор показывает: в Claude Code, Codex и Cursor пользовательский запрос занимает лишь небольшую часть доступного контекста. Остальное - system prompt, файлы проекта, память, MCP, skills, история команд и результаты инструментов. Если эти слои не спроектированы, агент начинает тратить лимиты на шум и принимать решения по случайным фрагментам.

Главный тезис материала - не нужно складывать в окно всё подряд. Хороший контекст - это минимальный набор высокосигнальных токенов, который помогает модели выбрать правильное действие. Здесь появляется context rot: чем больше в сессии старых результатов, промежуточных правок и нерелевантных файлов, тем выше шанс, что модель будет казаться уверенной, но потеряет нить задачи. Для длинных агентных сессий это уже не UX-проблема, а инженерный риск.

Веса (Слой 0)Контекст (Слои 1–6)
Когда формируютсяПри обучении (месяцы)При каждом запросе (мс)
Можно изменитьНет (заморожены)Да
Объём~триллион параметров~200K токенов
Что хранятЯзык, факты, рассуждения, характерКонкретная задача, история
АналогияОбразование и характер человекаДокументы у него на столе

Практический слой ещё важнее. Проекту нужны короткие управляющие документы, явные правила чтения кода, компактные спецификации и регулярная очистка контекста. CLAUDE.md или аналогичный файл становится не памяткой для человека, а частью runtime агента. Tool results тоже надо дозировать: лог на тысячу строк может стоить дороже и помогать меньше, чем десять строк с точным диффом или ошибкой теста.

Главный риск длинного окна - context rot: модель видит больше токенов, но рассуждает хуже и дороже.

Почему промптов уже мало: агентам нужен инженерный контекст
· Источник: Habr AI

Для бизнеса это меняет экономику внедрения ИИ в разработку. Агентные инструменты выглядят как способ ускорить senior-команды, но без инженерного контекста они быстро превращаются в дорогой генератор вариантов. Команды, которые научатся управлять слоями контекста, будут получать более стабильные результаты и меньше зависеть от того, насколько удачно конкретный разработчик сформулировал запрос.