Разбор Context Engineering полезен тем, что переводит разговор об агентах из области удачных формулировок в область системного дизайна. Автор показывает: в Claude Code, Codex и Cursor пользовательский запрос занимает лишь небольшую часть доступного контекста. Остальное - system prompt, файлы проекта, память, MCP, skills, история команд и результаты инструментов. Если эти слои не спроектированы, агент начинает тратить лимиты на шум и принимать решения по случайным фрагментам.
Главный тезис материала - не нужно складывать в окно всё подряд. Хороший контекст - это минимальный набор высокосигнальных токенов, который помогает модели выбрать правильное действие. Здесь появляется context rot: чем больше в сессии старых результатов, промежуточных правок и нерелевантных файлов, тем выше шанс, что модель будет казаться уверенной, но потеряет нить задачи. Для длинных агентных сессий это уже не UX-проблема, а инженерный риск.
| Веса (Слой 0) | Контекст (Слои 1–6) | |
|---|---|---|
| Когда формируются | При обучении (месяцы) | При каждом запросе (мс) |
| Можно изменить | Нет (заморожены) | Да |
| Объём | ~триллион параметров | ~200K токенов |
| Что хранят | Язык, факты, рассуждения, характер | Конкретная задача, история |
| Аналогия | Образование и характер человека | Документы у него на столе |
Практический слой ещё важнее. Проекту нужны короткие управляющие документы, явные правила чтения кода, компактные спецификации и регулярная очистка контекста. CLAUDE.md или аналогичный файл становится не памяткой для человека, а частью runtime агента. Tool results тоже надо дозировать: лог на тысячу строк может стоить дороже и помогать меньше, чем десять строк с точным диффом или ошибкой теста.
Главный риск длинного окна - context rot: модель видит больше токенов, но рассуждает хуже и дороже.

Для бизнеса это меняет экономику внедрения ИИ в разработку. Агентные инструменты выглядят как способ ускорить senior-команды, но без инженерного контекста они быстро превращаются в дорогой генератор вариантов. Команды, которые научатся управлять слоями контекста, будут получать более стабильные результаты и меньше зависеть от того, насколько удачно конкретный разработчик сформулировал запрос.



