До сих пор одна из главных проблем браузерных ИИ-агентов — непрозрачность: пользователь отправляет задачу и ждёт результата, не видя, что именно агент делает на сайте. Amazon решила эту проблему через новый компонент BrowserLiveView в составе Bedrock AgentCore TypeScript SDK. Он транслирует видеопоток активной браузерной сессии агента прямо внутрь React-приложения.

Архитектура намеренно минималистична. Сервер приложения запускает сессию через класс Browser из пакета bedrock-agentcore, задаёт разрешение viewport (например, 1920×1080) и генерирует presigned URL — подписанную ссылку с встроенными SigV4-credentials и временем жизни 300 секунд по умолчанию. Этот URL передаётся на фронтенд. Дальше компонент BrowserLiveView принимает URL, устанавливает WebSocket-соединение и начинает рендерить поток. Видео идёт напрямую из инфраструктуры AWS в браузер пользователя, не проходя через сервер разработчика — это снижает задержку и убирает необходимость строить собственный стриминговый слой.

Протокол передачи — Amazon DCV (ранее NICE DCV), изначально разработанный для удалённого доступа к высокопроизводительным рабочим станциям в облаке. Его применение здесь логично: протокол оптимизирован для низкой задержки и адаптивного качества картинки при переменной пропускной способности сети. Компонент самостоятельно обрабатывает согласование протокола, декодирование потока и отрисовку кадров, масштабируясь под размер родительского контейнера с сохранением пропорций.

Для подключения достаточно presigned URL с истечением 300 секунд — секреты AWS не попадают на клиент.

Amazon Bedrock AgentCore: встраиваем прямую трансляцию браузерного агента в React
· Источник: AWS Machine Learning Blog

С точки зрения кода интеграция выглядит так: на сервере три вызова — создание объекта Browser, startSession с параметрами viewport и generateLiveViewUrl. На клиенте — импорт BrowserLiveView и один JSX-тег с тремя пропсами: signedUrl, remoteWidth и remoteHeight. Значения ширины и высоты должны точно совпадать с теми, что заданы при старте сессии: расхождение даёт обрезку или чёрные полосы.

Для управления агентом в примере используется Anthropic Claude через Amazon Bedrock Converse API, однако сам компонент Live View не зависит от выбора модели — его можно подключить к любому агентному фреймворку или провайдеру. Это принципиальное архитектурное решение: наблюдаемость отделена от логики агента.

Практическая ценность компонента выходит за рамки удобства. В регулируемых отраслях — финансах, здравоохранении, юридических сервисах — агент, работающий с чувствительными данными, должен оставлять аудиторский след. BrowserLiveView в связке с записью сессий в Amazon S3 и возможностью воспроизведения через консоль AWS закрывает этот сценарий: есть и наблюдение в реальном времени, и архив для последующего разбора. Супервайзер может вмешаться прямо из интерфейса приложения, не переключаясь в отдельный инструмент мониторинга.

Браузерные агенты как класс инструментов активно развиваются последние полтора года: Anthropic представила Computer Use в конце 2024-го, OpenAI запустила оператора в начале 2025-го. Общая проблема всех этих решений — доверие пользователя к автономным действиям агента. BrowserLiveView — это ставка AWS на то, что наблюдаемость, встроенная прямо в продукт, эффективнее решает проблему доверия, чем постфактум-логи или текстовые отчёты о выполненных шагах.