Два направления — SE for ИИ и ИИ for SE — часто путают, потому что оба оперируют одной лексикой: модели, данные, тесты, пайплайны, качество. Но объекты у них разные. SE for ИИ строит системы, в которых ИИ работает как компонент. ИИ for SE использует ИИ внутри самого процесса разработки — для написания кода, тестов, анализа требований, миграции репозиториев.
SE for ИИ выросла из наблюдения, сформулированного ещё в 2015 году: ML-система создаёт не только программный, но и модельный, дата-зависимый и эксплуатационный долг. Sculley et al. описали boundary erosion, hidden feedback loops и data dependencies как типичные источники проблем — не дефекты модели в изоляции, а дефекты связей между компонентами. MLOps закрыл часть этого разрыва, предложив принципы и роли для вывода ML-продуктов в production. Но к 2026 году SE for ИИ уже нельзя свести к MLOps: LLM-агенты соединяют стохастические ответы модели с детерминированными системами — файловой системой, CI, базами данных, платёжными сервисами. Исследование Srinivasan о production LLM agents вводит понятие stochastic-deterministic boundary: контракт между proposer, verifier, commit step и reject signal, определяющий, когда ответ модели превращается в действие системы. Нормативный слой тоже уплотнился: EU ИИ Act, опубликованный 12 июля 2024 года, переводит часть инженерных практик в режим юридически значимой документации; NIST 7 апреля 2026 года выпустил concept note для критической инфраструктуры.
| Характеристика | SE for AI | AI for SE |
|---|---|---|
| Объект | AI-enabled система | Инженерная работа с участием ИИ |
| Главный артефакт | Модель, данные, pipeline, runtime, политика риска | Patch, тест, issue, migration plan, документация, protocol |
| Тип ошибки | Деградация поведения системы в эксплуатации | Правдоподобный, но неверный инженерный артефакт |
| Проверка | Мониторинг, evals, audit trail, risk controls | Тесты, CI, review, sandbox, invariant checks |
| Новая граница 2026 года | Стохастический агент превращает ответ в действие | Агент получает инструменты, права и долговременный контекст |
ИИ for SE прошла путь от автодополнения кода до агентов, работающих напрямую в репозитории. Ключевым переломом стал SWE-bench (Jimenez et al., 2023/2024): вместо синтетических задач модель получает реальный GitHub issue и должна изменить кодовую базу. Исходный датасет — 2 294 задачи из 12 Python-репозиториев — показал, что даже сильные модели справлялись только с простыми случаями. SWE-agent добавил другой вывод: результат зависит не только от модели, но и от agent-computer interface — интерфейса, через который агент читает файлы, редактирует код и запускает тесты.
SWE-Bench Mobile: лучший из 22 agent-model configurations решил лишь 12% задач из production iOS-кода.
Бенчмарки 2026 года фиксируют сдвиг от разового патча к длительному сопровождению. SWE-Bench Mobile оценивает агентов на задачах из production iOS-кода — PRD, Figma, Swift/Objective-C. Среди 22 agent-model configurations лучший результат составил 12% task success rate. SWE-Chain тестирует цепочки обновлений пакетов: 12 upgrade chains, 9 Python-пакетов, 155 version transitions, 1 660 grounded upgrade requirements. Средний resolving rate по девяти frontier-конфигурациям — 44,8%, лучший — 60,8%. Отдельную нишу занимает RustPrint: система использует документацию как архитектурный blueprint для миграции C-репозиториев в Rust и на восьми репозиториях от 11K до 84K строк кода превысила agentic Claude Code baseline по feature preservation и test pass rate.
Где два направления сходятся — это зона агентной программной инженерии. Когда coding agent получает shell-доступ, права на чтение репозитория и долговременный контекст, задачи SE for ИИ и ИИ for SE перестают быть раздельными. AuthBench (Yan et al., 2026) на 120 реалистичных terminal tasks показал: frontier-модели одновременно пропускают нужные разрешения и выдают лишние или чувствительные доступы, а увеличение reasoning-time проблему не устраняет. Вывод прямой: агенту нельзя доверять определение собственных полномочий — их нужно проектировать как системный контур. Protocol-Driven Development (He and Yu, 2026) предлагает считать главным артефактом не код, а machine-enforceable protocol: структурные, поведенческие и операционные инварианты плюс Evidence Chain для допуска реализации. Генератор может менять код, но право на приёмку принадлежит протоколу и verifier.
Позиционная статья Cao от 4 июня 2026 года формулирует радикальный тезис: в агентных системах код становится ephemeral tooling для LLM-driven reasoning loop, а Agentic Engineering претендует на отдельный объект изучения. Свежие бенчмарки, однако, не подтверждают исчезновение программной инженерии — они фиксируют рост требований к интерфейсам, ограничениям, тестам, протоколам и правам доступа. SE for ИИ отвечает за управляемость ИИ-системы. ИИ for SE отвечает за качество инженерного действия, которое выполняет ИИ. Coding agent с shell-доступом соединяет обе задачи в одном артефакте.


