Amazon FinTech, подразделение финансовых технологий Amazon, внедрила систему автоматизации обработки запросов регуляторов на основе генеративного ИИ. Платформа использует Amazon Bedrock и модель Claude Sonnet 4.5 (через Converse Stream API) для построения диалогового интерфейса, который помогает командам извлекать информацию из тысяч исторических документов.

Регуляторные запросы требуют синтеза данных из документов разных форматов (PDF, PPT, Word, CSV) с доменно-специфичной терминологией. Для решения проблемы фрагментации знаний Amazon FinTech применила Retrieval Augmented Generation (RAG). Знания хранятся в отдельных базах знаний для каждой команды, развернутых на Amazon Bedrock Knowledge Bases. Векторный поиск выполняется через Amazon OpenSearch Serverless.

Система поддерживает многоповоротные диалоги: контекст предыдущих взаимодействий сохраняется в Amazon DynamoDB. Поскольку запросы регуляторов высоко контекстуальны, решение не использует кэширование ответов LLM — из-за низкой вероятности повторного совпадения запросов.

Решение использует RAG с Amazon OpenSearch Serverless и модель Claude Sonnet 4.5.

Важным аспектом является наблюдаемость. Команды используют OpenTelemetry и self-hosted Langfuse для отслеживания процесса генерации, выявления галлюцинаций и устаревших руководств. Это позволяет непрерывно улучшать систему и поддерживать соответствие принципам ответственного ИИ.

Процесс загрузки документов автоматизирован: пользователи загружают файлы через клиентское приложение, получают предварительно подписанные S3-URL и инициируют обработку через API Gateway и Lambda-функции. Конвертация форматов и параллельная обработка выполняются без предварительной обработки изображений и таблиц, так как Amazon Bedrock Knowledge Bases обрабатывает их автоматически.