AWS выпустила интеграцию Exa в Strands Agents SDK для поиска в вебе из ИИ-агентов

Подготовлено редакцией Malakhov AI

AWS Machine Learning Blog·11 мая·3 минЛабораторииКод

Strands Agents SDK от AWS получил нативную интеграцию с поисковым движком Exa, который возвращает структурированный контент без HTML-мусора — напрямую в контекстное окно языковой модели. Два новых инструмента, exa_search и exa_get_contents, позволяют агентам вести многошаговый поиск без дополнительных парсеров и кастомных краулеров.

Кратко

—Strands Agents SDK — open-source фреймворк AWS для построения ИИ-агентов с model-driven архитектурой и более чем 40 встроенными инструментами.
—Exa — поисковый движок для LLM, работающий на семантическом сходстве, а не по ключевым словам; результаты приходят без рекламы и SEO-шума.
—exa_search поддерживает четыре режима скорости: от Instant (~200 мс) до Deep (~3–6 с) для глубокого исследовательского поиска.
—exa_get_contents извлекает полный текст страниц по URL, использует кэш и при необходимости переключается на живой краулинг.
—Для подключения достаточно установить пакет strands-agents-tools и передать инструменты в параметр tools= конструктора Agent.

Глоссарий · 6 терминов▾

Model-driven архитектура (в контексте агентов): Подход, при котором языковая модель сама решает, какие инструменты вызывать и в каком порядке, вместо жёстко заданного кода.
LLM: Large Language Model — большая языковая модель, нейросеть, обученная на текстах и способная генерировать связный текст, отвечать на вопросы и рассуждать.
MCP (Model Context Protocol): Открытый протокол для подключения внешних инструментов к языковым моделям без написания дополнительного кода интеграции.
Семантический поиск: Поиск по смыслу запроса, а не по точному совпадению слов: система находит релевантные документы, даже если в них нет ключевых слов из запроса.
Контекстное окно: Максимальный объём текста, который языковая модель может обработать за один вызов; всё, что в него не помещается, модель не видит.
Живой краулинг (live crawling): Загрузка актуальной версии веб-страницы в реальном времени, в отличие от использования заранее сохранённой копии из кэша.

Большинство поисковых API отдают HTML-страницы и короткие сниппеты, оптимизированные под браузер человека. Для ИИ-агента это означает дополнительный слой работы: нужны парсеры, краулеры и логика ранжирования, прежде чем контент попадёт в контекстное окно модели. Именно этот разрыв закрывает интеграция Exa в Strands Agents SDK.

Strands Agents — open-source фреймворк AWS, построенный на model-driven подходе. Разработчик задаёт модель, системный промпт и список инструментов, а дальше модель сама решает, какой инструмент вызвать, в каком порядке и когда остановиться. Агентный цикл на каждой итерации получает полную историю диалога, включая все предыдущие вызовы инструментов и их результаты. Это накопление контекста позволяет решать многошаговые задачи, недоступные одиночному вызову LLM. SDK поставляется с более чем 40 встроенными инструментами — файловые операции, выполнение кода, работа с AWS API, управление памятью — и поддерживает Model Context Protocol (MCP).

Режим	Время отклика	Назначение
Instant	~200 мс	Автодополнение, голосовые агенты, живые подсказки
Fast	~450 мс	Агентные сценарии с десятками поисковых запросов
Auto (рекомендуется)	~1 с	Большинство задач: баланс скорости и качества
Deep	~3–6 с	Исследовательские задачи, где важна полнота охвата

Exa — поисковый движок, изначально спроектированный для LLM и ИИ-агентов. В отличие от традиционных поисковиков, он работает на семантическом сходстве: запрос «стартапы в области климатических решений» вернёт релевантные компании, даже если на их страницах нет этой точной фразы. Результаты приходят очищенными от рекламы и SEO-шума, готовыми к прямой подаче в контекстное окно модели.

Exa — поисковый движок для LLM, работающий на семантическом сходстве, а не по ключевым словам; результаты приходят без рекламы и SEO-шума.

Strands Agents Deep Research Workflow · Источник: AWS Machine Learning Blog

Интеграция добавляет два инструмента. Первый — exa_search — выполняет семантический поиск в четырёх режимах: Instant (~200 мс) для голосовых агентов и автодополнения, Fast (~450 мс) для агентных сценариев с десятками запросов, Auto (~1 с, рекомендуемый по умолчанию) и Deep (~3–6 с) для исследовательских задач, где важна полнота охвата. Поиск можно фильтровать по категориям контента — новости, научные статьи, GitHub-репозитории, PDF, финансовые отчёты, профили людей — а также по домену и дате. В одном вызове агент может запросить и результаты, и синтезированное резюме по каждому из них.

Второй инструмент — exa_get_contents — извлекает полный текст страниц по списку URL. Exa поддерживает кэш уже обходённых страниц, что ускоряет повторные запросы. Если страница не закэширована или нужна свежая версия, инструмент автоматически переключается на живой краулинг с настраиваемым таймаутом. Объём возвращаемого текста тоже регулируется: например, можно ограничить вывод пятью тысячами символов.

Подключение не требует отдельного SDK Exa — интеграция работает напрямую через REST API. Достаточно установить пакет strands-agents-tools, импортировать инструменты и передать их в параметр tools= конструктора Agent. Модель сама обучается использовать их по сигнатурам функций. Для работы нужны Python 3.10+, доступ к Amazon Bedrock и API-ключ Exa.

Подобный подход — встраивание специализированного поискового слоя прямо в агентный фреймворк — отражает более широкую тенденцию в отрасли. Разработчики агентов для ресёрча, фактчекинга и конкурентной разведки сталкиваются с одной и той же проблемой: общедоступные поисковые API не проектировались под машинное потребление. Решения вроде интеграции Exa пытаются убрать этот слой трансформации, делая веб-поиск таким же нативным инструментом агента, как вызов файловой системы или исполнение кода.

Разобраться глубже

ИИ-агенты для бизнеса: что это и где применять

ИИ-агенты для бизнеса простыми словами: чем агент отличается от чат-бота, из каких четырёх частей собирается, какие бывают уровни автономности, карта из 10 сценариев применения, кейс сервисной компании и расчёт окупаемости агента поддержки.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ

По теме

OpenAI оценила влияние ИИ на рынок труда стран Евросоюза

Продолжить по разделам

AWS выпустила интеграцию Exa в Strands Agents SDK для поиска в вебе из ИИ-агентов

Кратко

Читать дальше

Palantir внедряет NVIDIA Nemotron для ИИ в госучреждениях США

Stripe на 26% ускорил compliance-проверки с помощью ИИ-агентов на AWS Bedrock

OpenAI оценила влияние ИИ на рынок труда стран Евросоюза