Amazon Bedrock AgentCore Memory, управляемый сервис памяти для ИИ-агентов, обновился: появилась поддержка фильтрации по метаданным. Новая функция позволяет сужать область поиска по бизнес-атрибутам — приоритету, отделу, временному диапазону — до того, как запускается семантический поиск. Это решает проблему «стены точности», когда при накоплении истории взаимодействий семантически близкие результаты разных контекстов смешиваются.
Раньше изоляция памяти достигалась через namespace'ы — логические разделы для разных клиентов или сущностей. Но внутри одного namespace, например, для клиента с полугодовой историей, запрос «обсуждение ребалансировки портфеля» возвращал и срочные недавние беседы, и рутинные запросы трёхмесячной давности. Metadata filtering добавляет второй уровень: сначала отсекаются записи по ключам (например, priority=high, department=investment, date>last_week), затем выполняется векторный поиск по оставшимся.
| Тип вопроса | Без фильтрации | С фильтрацией |
|---|---|---|
| Все вопросы (151) | 40% | 64% |
| Контекстно-зависимые | 16% | 69% |
Механизм работает в три фазы: на этапе конфигурации объявляются ключи метаданных (через Memory Management API), при передаче (ingestion) значения присваиваются вручную или извлекаются моделью с помощью инструкции llmExtractionInstruction, а при поиске фильтры применяются до ранжирования по сходству. Поддерживаются как краткосрочная память (события с key-value парами), так и долгосрочная, где метаданные проходят через консолидацию.

AWS приводит результаты тестирования на датасете из 151 вопроса, построенном по методологии LoCoMo (многосессионные диалоги). Общая точность ответов (QA accuracy) выросла с 40% до 64% при включённой фильтрации. На подмножестве вопросов, требующих учёта контекстных границ (время, приоритет, отдел), точность поднялась с 16% до 69% — почти в 4,3 раза.
Новая возможность особенно полезна в мультитенантных и мультиагентных архитектурах. Namespace'ы обеспечивают полную изоляцию между арендаторами, а метаданные — тонкую настройку внутри каждого арендатора: например, IT-helpdesk может фильтровать по типу тикета, статусу решения и дате. Финансовые сервисы — по типу инвестиционной стратегии и временному горизонту.
Блог AWS рекомендует комбинировать namespace'ы с метаданными, а не заменять одно другим. Первые отвечают на вопрос «кто», вторые — на «что, когда, какой приоритет». Разработчикам стоит тщательно проектировать схему метаданных на этапе конфигурации, чтобы избежать коллизий и обеспечить нужный уровень детализации.



