SE for ИИ и ИИ for SE: чем отличаются два подхода к инженерии с участием ИИ

Подготовлено редакцией Malakhov AI

Habr AI·вчера·4 минРоссияКод

К июню 2026 года граница между двумя направлениями инженерии — SE for ИИ и ИИ for SE — сместилась к агентным системам: coding agent одновременно автоматизирует разработку и сам становится ИИ-системой, требующей архитектурных ограничений и контроля доступа. Разобраться в различиях помогают свежие бенчмарки и исследования, включая SWE-bench, SWE-Chain и работы по least-privilege authorization.

Кратко

—SE for ИИ проектирует системы, где ИИ — компонент продукта; ИИ for SE использует ИИ как исполнителя инженерной работы.
—SWE-Bench Mobile: лучший из 22 agent-model configurations решил лишь 12% задач из production iOS-кода.
—SWE-Chain на 155 переходах между версиями Python-пакетов: средний resolving rate — 44,8%, лучший результат — 60,8%.
—AuthBench показал: frontier-модели одновременно пропускают нужные разрешения и выдают лишние; увеличение reasoning-time проблему не устраняет.
—Protocol-Driven Development предлагает считать главным артефактом не код, а machine-enforceable protocol с Evidence Chain для приёмки реализации.

Глоссарий · 7 терминов▾

SE for ИИ: Software Engineering for ИИ — инженерная дисциплина, занимающаяся проектированием, проверкой и сопровождением систем, в которых ИИ является компонентом продукта.
ИИ for SE: ИИ for Software Engineering — использование ИИ-инструментов и агентов внутри самого процесса разработки: написание кода, тестов, анализ требований, миграция репозиториев.
SWE-bench: Benchmark для оценки LLM-агентов на реальных GitHub issues: модель должна изменить кодовую базу так, чтобы закрыть задачу, описанную в issue.
stochastic-deterministic boundary: Граница между стохастическим выходом языковой модели и детерминированным действием системы; определяет, в какой момент ответ модели превращается в реальное изменение данных или состояния.
Protocol-Driven Development: Подход, при котором главным артефактом разработки считается не код, а machine-enforceable protocol — набор инвариантов и цепочка доказательств, по которым принимается или отклоняется реализация.
least-privilege authorization: Принцип минимальных привилегий: агент или процесс получает ровно те права доступа, которые необходимы для конкретной задачи, и не более.
MLOps: Набор принципов, ролей и рабочих процессов для вывода ML-моделей в production и их последующей эксплуатации, включая мониторинг и переобучение.

Два направления — SE for ИИ и ИИ for SE — часто путают, потому что оба оперируют одной лексикой: модели, данные, тесты, пайплайны, качество. Но объекты у них разные. SE for ИИ строит системы, в которых ИИ работает как компонент. ИИ for SE использует ИИ внутри самого процесса разработки — для написания кода, тестов, анализа требований, миграции репозиториев.

SE for ИИ выросла из наблюдения, сформулированного ещё в 2015 году: ML-система создаёт не только программный, но и модельный, дата-зависимый и эксплуатационный долг. Sculley et al. описали boundary erosion, hidden feedback loops и data dependencies как типичные источники проблем — не дефекты модели в изоляции, а дефекты связей между компонентами. MLOps закрыл часть этого разрыва, предложив принципы и роли для вывода ML-продуктов в production. Но к 2026 году SE for ИИ уже нельзя свести к MLOps: LLM-агенты соединяют стохастические ответы модели с детерминированными системами — файловой системой, CI, базами данных, платёжными сервисами. Исследование Srinivasan о production LLM agents вводит понятие stochastic-deterministic boundary: контракт между proposer, verifier, commit step и reject signal, определяющий, когда ответ модели превращается в действие системы. Нормативный слой тоже уплотнился: EU ИИ Act, опубликованный 12 июля 2024 года, переводит часть инженерных практик в режим юридически значимой документации; NIST 7 апреля 2026 года выпустил concept note для критической инфраструктуры.

Характеристика	SE for AI	AI for SE
Объект	AI-enabled система	Инженерная работа с участием ИИ
Главный артефакт	Модель, данные, pipeline, runtime, политика риска	Patch, тест, issue, migration plan, документация, protocol
Тип ошибки	Деградация поведения системы в эксплуатации	Правдоподобный, но неверный инженерный артефакт
Проверка	Мониторинг, evals, audit trail, risk controls	Тесты, CI, review, sandbox, invariant checks
Новая граница 2026 года	Стохастический агент превращает ответ в действие	Агент получает инструменты, права и долговременный контекст

ИИ for SE прошла путь от автодополнения кода до агентов, работающих напрямую в репозитории. Ключевым переломом стал SWE-bench (Jimenez et al., 2023/2024): вместо синтетических задач модель получает реальный GitHub issue и должна изменить кодовую базу. Исходный датасет — 2 294 задачи из 12 Python-репозиториев — показал, что даже сильные модели справлялись только с простыми случаями. SWE-agent добавил другой вывод: результат зависит не только от модели, но и от agent-computer interface — интерфейса, через который агент читает файлы, редактирует код и запускает тесты.

SWE-Bench Mobile: лучший из 22 agent-model configurations решил лишь 12% задач из production iOS-кода.

Бенчмарки 2026 года фиксируют сдвиг от разового патча к длительному сопровождению. SWE-Bench Mobile оценивает агентов на задачах из production iOS-кода — PRD, Figma, Swift/Objective-C. Среди 22 agent-model configurations лучший результат составил 12% task success rate. SWE-Chain тестирует цепочки обновлений пакетов: 12 upgrade chains, 9 Python-пакетов, 155 version transitions, 1 660 grounded upgrade requirements. Средний resolving rate по девяти frontier-конфигурациям — 44,8%, лучший — 60,8%. Отдельную нишу занимает RustPrint: система использует документацию как архитектурный blueprint для миграции C-репозиториев в Rust и на восьми репозиториях от 11K до 84K строк кода превысила agentic Claude Code baseline по feature preservation и test pass rate.

Где два направления сходятся — это зона агентной программной инженерии. Когда coding agent получает shell-доступ, права на чтение репозитория и долговременный контекст, задачи SE for ИИ и ИИ for SE перестают быть раздельными. AuthBench (Yan et al., 2026) на 120 реалистичных terminal tasks показал: frontier-модели одновременно пропускают нужные разрешения и выдают лишние или чувствительные доступы, а увеличение reasoning-time проблему не устраняет. Вывод прямой: агенту нельзя доверять определение собственных полномочий — их нужно проектировать как системный контур. Protocol-Driven Development (He and Yu, 2026) предлагает считать главным артефактом не код, а machine-enforceable protocol: структурные, поведенческие и операционные инварианты плюс Evidence Chain для допуска реализации. Генератор может менять код, но право на приёмку принадлежит протоколу и verifier.

Позиционная статья Cao от 4 июня 2026 года формулирует радикальный тезис: в агентных системах код становится ephemeral tooling для LLM-driven reasoning loop, а Agentic Engineering претендует на отдельный объект изучения. Свежие бенчмарки, однако, не подтверждают исчезновение программной инженерии — они фиксируют рост требований к интерфейсам, ограничениям, тестам, протоколам и правам доступа. SE for ИИ отвечает за управляемость ИИ-системы. ИИ for SE отвечает за качество инженерного действия, которое выполняет ИИ. Coding agent с shell-доступом соединяет обе задачи в одном артефакте.

Разобраться глубже

Как внедрить ИИ в бизнес в 2026 году: пошаговый план для руководителя

Практический гайд для руководителя: как выбрать первый проект с ИИ, подготовить данные, посчитать экономику и довести пилот до рабочего процесса.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ