Егор, QA Fullstack Java в компании SENSE, год назад был убеждён, что ИИ-агент в тестировании — либо маркетинг, либо угроза профессии. Сегодня агент в его проекте разбирает упавшие тесты, актуализирует локаторы и генерирует шаблонные кейсы по спецификациям. Путь занял около полугода.

Первые версии агента разочаровали: инструмент не справлялся с элементарным — например, не мог корректно добавить поле в класс. Перелом наступил, когда тестировщикам из фокус-группы дали возможность самостоятельно настраивать агент: добавлять промты, корректировать существующие, загружать документацию. Команда последовательно «кормила» агента документацией по Selenium, PlaywrightCLI для анализа DOM-дерева, Gradle и внутренними стандартами тестирования банка. Параллельно агент получил доступ к проекту через консоль и начал анализировать код напрямую — вместо работы в отрыве от реального контекста.

ЗадачаСправляется агентПримечание
Написание шаблонных тест-кейсов по спецификациямДаJUnit, TestNG, Gherkin/Cucumber
Обновление локаторов при изменениях UIДаТребуется PlaywrightCLI
Анализ Allure-отчётов и поиск паттернов паденийДаДобавляет retry-логику для нестабильных тестов
Отладка упавших тестовЧастичноМожет починить один баг и внести два новых
Оптимизация фреймворка и распараллеливание тестовНетОстаётся за человеком
Рефакторинг архитектуры, настройка HibernateНетНе справился в боевом проекте
Поиск нестандартных edge casesНетПишет только по шаблонам

Появилась техническая проблема: агент тормозил, терял соединение с сервером из-за нехватки памяти — особенно на серверах под управлением РОСА. Команда уменьшила размер контекста, ограничила глубину анализа и добавила кэширование промежуточных результатов. После этого агент заработал стабильно.

Решающим испытанием стал хакатон по вайб-кодингу в апреле 2026 года. За 24 часа требовалось с нуля собрать клиент-серверное приложение и добиться покрытия кода тестами не менее 80%. Агент работал непрерывно: анализировал коммиты, строил тестовые сценарии, писал юнит-тесты на JUnit, интеграционные проверки и тесты API, мониторил покрытие через JaCoCo, запускал тесты локально и отлаживал упавшие. Итог — около 1600 тестов, включая модульные (JUnit/TestNG), UI-тесты на Selenium и интеграционные сценарии для микросервисов, покрытие кода превысило 85%.

Внедрение в действующий проект автотестов, который развивается несколько лет, оказалось сложнее. Егор вводил агента поэтапно: сначала разбор упавших тестов и правка устаревших локаторов в Selenide, затем генерация тест-кейсов в формате Gherkin для Cucumber и структур для JUnit по спецификациям новой функциональности, потом анализ Allure-отчётов с поиском повторяющихся паттернов падений и добавлением retry-логики. Когда дошло до архитектурных задач — настройки Retry и Rerun в Cucumber, оптимизации запросов Hibernate с ленивой загрузкой и кэшированием — агент не справился.

Практика выявила устойчивый набор сильных сторон. Агент одинаково уверенно генерирует базовые тестовые сценарии для монолита и микросервиса, обновляет Page Object Model при изменениях UI с помощью PlaywrightCLI, обрабатывает результаты прогона и формирует отчёты — вне зависимости от того, 10 тестов или 10 000. Для проектов с 2000+ интеграционных тестов и ежедневно меняющимися тестовыми данными это критически важно.

Ограничения тоже очевидны. Оптимизация фреймворка, распараллеливание тестов и рефакторинг архитектуры остаются за человеком. Агент требует постоянного контроля: он может самостоятельно решить переименовать класс — и тогда падает половина проекта, или починить один баг и внести два новых. Главный структурный изъян — отсутствие нестандартного мышления: агент пишет кейсы по шаблонам и пропускает edge cases вроде поведения системы при одновременном нажатии всех кнопок или ввода в поле возраста строки «мне 999 лет». Ответственность за результат в любом случае остаётся за человеком.

Вайб-кодинг как явление — это подход к разработке, при котором человек задаёт направление и контролирует результат, а рутинную кодогенерацию делегирует ИИ. Хакатон в апреле 2026 года стал показательным стресс-тестом именно такой модели работы в QA. Опыт Егора вписывается в более широкую тенденцию: крупные российские технологические компании и банки активно экспериментируют с ИИ-ассистентами в разработке, однако реальные кейсы с конкретными цифрами из боевых проектов появляются редко.

Совет для тех, кто сейчас на стадии скепсиса: не давать агенту архитектурную задачу с первого дня — он не справится, и это только укрепит недоверие. Начинать с простого, расширять зону ответственности по мере накопленного доверия.