Предприятия, эксплуатирующие рабочие нагрузки на AWS, ежедневно получают десятки уведомлений о состоянии сервисов: окончание поддержки Amazon Linux 2, устаревание версий RDS, вывод из эксплуатации EC2-инстансов. При наличии 50 и более аккаунтов у операционной команды нет простого способа быстро выявить критичные события, оценить их срочность и влияние на бизнес. Традиционный подход — полагаться на Technical Account Managers (TAM) для интерпретации событий — создает узкие места и вынуждает команды тратить время на реактивное «тушение пожаров».

Решение, предложенное в блоге AWS Machine Learning Blog, называется Chaplin (Customer Health and Planned Lifecycle Intelligence Nexus). Это открытый инструмент, который реализует самостоятельную аналитику событий AWS Health с помощью агентного ИИ на платформе Amazon Bedrock, предоставляя доступ через Model Context Protocol (MCP). Вместо статических дашбордов Chaplin позволяет задавать вопросы на естественном языке прямо из MCP-совместимых ассистентов — например, Claude Code или Kiro CLI. Оператор может спросить: «Какие события RDS ожидаются в ближайшие 60 дней?» или «Покажи открытые EC2-события по срочности» — и получить точный ответ с контекстом.

AccountBUDivisionSpend/moEventsDeadline
Analytics-production-8137AnalyticsRetail$76,70022025-03-31
DataScience-production-9480DataScienceRetail$70,90012026-07-14
Payments-production-2382PaymentsEngineering$50,00032025-03-31
Security-production-2466SecurityEngineering$40,90032025-09-30
Logistics-production-5002LogisticsFinTech$33,90022025-03-31
Support Cases – Q Test Acct 3OrdersRetail$32,00032026-05-15

Ключевая особенность Chaplin — многоагентная архитектура, объединяющая обработку структурированных и неструктурированных данных. Традиционные Retrieval-Augmented Generation (RAG) системы недетерминированы при числовых агрегациях: они могут выдать 190 событий вместо фактических 958. Chaplin обходит это ограничение, используя агенты для точного подсчёта и суммирования. Благодаря MCP решение интегрируется с другими инструментами (JIRA, GitHub, ServiceNow) и обогащает анализ бизнес-контекстом — тегами ресурсов, окружениями, ответственными. В ближайшее время некоторые события AWS Health будут связаны с шаблонами AWS Transform, и Chaplin сможет приоритизировать их для немедленных действий.

Решение использует многоагентную архитектуру на Amazon Bedrock и протокол MCP для интеграции с ИИ-ассистентами.