Amazon Quick Research — новый инструмент в составе платформы Amazon Quick, предназначенный для интеграции данных из множества биомедицинских источников. Он решает проблему разрозненности данных в исследованиях редких видов рака, где информация распределена по геномным секвенаторам, клиническим регистрам, репозиториям биомаркеров и научной литературе. Традиционно интеграция этих источников требует настройки ETL-пайплайнов, ручного согласования схем и итеративных запросов, что занимает недели. Amazon Quick Research сокращает этот процесс до часов благодаря агентному ИИ-воркфлоу.

Основные компоненты платформы включают парсинг исследовательского вопроса на подтемы для параллельного анализа, загрузку данных из веба (PubMed, ClinicalTrials.gov, открытые журналы) и файлов (PDF, Word, Excel, PowerPoint, CSV, TXT, RTF, JSON, YAML, XML, HTML), а также из собственных ресурсов Amazon Quick (Spaces, дашборды, базы знаний). Перед запуском генерируется структурированный план с указанием тем, источников и методов анализа, который можно отредактировать. Результатом является отчёт с inline-цитатами, где каждое утверждение имеет ссылку на источник. Функция «Understand the statement» позволяет просмотреть цепочку доказательств.

КомпонентОписание
Парсинг исследовательского вопросаИнтерпретирует естественно-языковой вопрос и разбивает на подтемы для параллельного анализа.
Многоисточниковая загрузка данныхПоддержка веб-поиска, загрузки файлов (PDF, Word, Excel, PowerPoint, CSV и др.) и ресурсов Amazon Quick.
AI-генерируемый план исследованияПеред запуском создаётся структурированный план тем, источников и методов анализа.
Генерация отчёта с цитатамиИтоговый отчёт содержит inline-цитаты с ссылками на исходные документы и URL.
Версионированный рабочий процесс ревизийВозможность аннотировать утверждения, запускать новый прогон и сохранять предыдущие версии.
Форматы экспортаЭкспорт в PDF или Word с настраиваемой детализацией (Executive, General, Custom).

Рабочий процесс поддерживает версионирование — можно аннотировать конкретные утверждения комментариями до 400 символов, после чего запускается новый исследовательский прогон, ограниченный изменёнными разделами. При этом сохраняется предыдущая версия для сравнения. Отчёты экспортируются в PDF или Word с настраиваемой детализацией (Executive, General, Custom). Организация данных осуществляется через Spaces — логические контейнеры до 10 000 файлов, которые индексируются при загрузке и становятся корпусом для поиска.

Поддерживает до 10 000 файлов в одном пространстве (Space) и поиск по вебу и открытым базам.

Figure 1 Screenshot of Amazon Quick New Research interface showing the research objective input field with example text about pediatric sarcomas, and research materials section with web search, file uploads, and Quick assets options expande
Figure 1 Screenshot of Amazon Quick New Research interface showing the research objective input field with example text about pediatric sarcomas, and research materials section with web search, file uploads, and Quick assets options expande · Источник: AWS Machine Learning Blog

Пошаговый пример, опубликованный в блоге AWS, демонстрирует настройку исследования для педиатрической саркомы — редкого типа рака. Сначала создаётся Space и загружаются публично доступные наборы геномных данных и рефераты PubMed. Затем в Quick Research формулируется исследовательский вопрос, например: «Какие перспективные подходы таргетной терапии существуют для педиатрических сарком?». Система генерирует план, пользователь утверждает его, и запускается анализ. Результаты можно итерировать через ревизии. Инструмент рассчитан на исследователей с базовым знакомством с биомедицинской терминологией.

Хотя решение ориентировано на редкие виды рака, его архитектура универсальна и применима в любой предметной области, где требуется интеграция разрозненных источников данных. Amazon Quick является платным сервисом, поэтому после тестирования необходимо выполнить очистку ресурсов для избежания затрат.