Референсная архитектура от AWS решает задачу, с которой сталкивается любой ритейлер или сервис доставки: принимать голосовые заказы через разные каналы — приложение, сайт, голосовой ассистент — при этом сохраняя контекст разговора и не перегружая инфраструктуру в пиковые часы. В основе решения — две технологии: Amazon Nova 2 Sonic, речевая модель с двунаправленной обработкой аудио, и Amazon Bedrock AgentCore, платформа для запуска ИИ-агентов в управляемой среде.
Nova 2 Sonic — это speech-to-speech модель, то есть она принимает на вход живую речь и возвращает голосовой ответ, минуя промежуточный текстовый слой. Это сокращает задержку и делает диалог естественнее по сравнению с классической цепочкой ASR → LLM → TTS. AgentCore Runtime запускает агента в микровиртуальной машине: каждая пользовательская сессия изолирована, что исключает как утечку данных между клиентами, так и деградацию производительности при росте нагрузки.
Связь агента с бизнес-логикой организована через AgentCore Gateway по протоколу MCP (Model Context Protocol) — открытому стандарту, который описывает, как ИИ-приложение обнаруживает и вызывает внешние инструменты. На практике это означает, что агент не знает деталей реализации бэкенда: он просто вызывает инструмент по имени, а Gateway транслирует вызов в REST-запрос к API Gateway, который маршрутизирует его в нужную Lambda-функцию. Такая развязка позволяет менять или дополнять бэкенд без переписывания кода агента.
AgentCore Runtime изолирует каждую пользовательскую сессию в отдельной микровиртуальной машине для безопасности и производительности.

Полный стек включает Amazon Cognito для аутентификации с выдачей JWT-токенов, DynamoDB для хранения профилей, заказов, меню и корзин с задержкой в единицы миллисекунд, AWS Location Services для рекомендаций по точкам самовывоза и AWS Amplify для хостинга фронтенда. Пользователь открывает WebSocket-соединение с AgentCore Runtime, подписанное по протоколу SigV4, передаёт токен для верификации личности — и агент строит персонализированный системный промпт с именем и идентификатором клиента ещё до начала диалога.
Вся инфраструктура описана в коде через AWS CDK и разбита на четыре независимых модуля: бэкенд-сервисы, AgentCore Gateway, AgentCore Runtime с образом контейнера в ECR и фронтенд на Amplify. Модульность позволяет подключить собственный бэкенд, заменив только соответствующий модуль. Для развёртывания нужны Node.js 20+, Python 3.13+, AWS CLI 2.x и Boto3 версии не ниже 1.38.0 — последнее требование связано с поддержкой сервиса bedrock-agentcore-control, появившегося в свежих релизах SDK. Исходный код опубликован в репозитории aws-samples на GitHub.


