Облачная инфраструктура десятилетиями проектировалась под человеческое поведение: поиск, клики, скроллинг и стриминг в предсказуемом ритме. ИИ-агенты работают иначе — они могут запускать десятки подзадач, одновременно обращаясь к сотням баз данных, документам и API за секунды, а затем мгновенно исчезать. Это создаёт нагрузку, с которой традиционные системы не справляются.

На прошлой неделе AWS представила ответ на этот вызов — новое поколение OpenSearch Serverless, полностью управляемой поисковой и векторной базы данных. Ключевое изменение: разделение вычислительных мощностей и хранилища. Раньше, даже в предыдущей версии Serverless, клиентам приходилось держать как минимум один активный инстанс, платя за простаивающие ресурсы. Теперь compute может масштабироваться от нуля до необходимого числа запросов за секунды, а в бездействии снижаться до нуля. «Вы не можете просто автоматически нарастить вычислительные мощности с нужной скоростью — у вас всегда были зарезервированные ресурсы, даже если вы их не использовали», — объяснила Тиа Уайт, гендиректор Amazon OpenSearch Service. Аналогия: раньше вы платили за парковочное место, даже когда машины нет; теперь платите только за фактическое использование.

Новая версия интегрируется с платформами разработки ИИ-агентов Vercel и Kiro, позволяя разработчикам развёртывать поисковые и векторные бэкенды без управления инфраструктурой. Это часть более широкого тренда: по мере перехода ИИ-агентов из экспериментальной фазы в производственную, облачные провайдеры пересматривают архитектуру. Databricks и Snowflake позиционируют себя как системы памяти и поиска для корпоративных данных. Microsoft обновила Azure для обработки всплесков трафика от агентов и обмена памятью между ними. Cloudflare, в свою очередь, запустила инфраструктуру для постоянных сред и мгновенного масштабирования агентов.

Система масштабируется от нуля до тысяч запросов за секунды для пиковых нагрузок от ИИ-агентов.

Image Credits:akinbostanci (opens in a new window) / Getty Images
Image Credits:akinbostanci (opens in a new window) / Getty Images · Источник: TechCrunch AI

По данным Cloudflare, за последние полгода боты составляли 31% всего HTTP-трафика, из которых примерно четверть приходилась на ИИ-сканеры, поисковики и ассистенты. Лай И Ольсен, старший продакт-менеджер Cloudflare, прогнозирует, что нечеловеческий трафик превысит человеческий в первой половине 2027 года. Это означает, что инфраструктура, изначально построенная для людей, всё больше оптимизируется под машины, что, в свою очередь, сделает развёртывание агентов дешевле и масштабируемее.