HippoRAG: реализация нейробиологически вдохновленного RAG на Amazon Bedrock и Neptune

Подготовлено редакцией Malakhov AI

AWS Machine Learning Blog·5 часов назад·2 минЛабораторииКод

Фреймворк HippoRAG, имитирующий работу гиппокампа человека, реализован на стеке AWS с использованием Amazon Bedrock, Neptune и алгоритма Personalized PageRank. Он решает проблему многозвенного вывода (multi-hop reasoning), с которой не справляются стандартные RAG-системы.

Кратко

—HippoRAG строит граф знаний из документов, используя LLM для извлечения триплетов (субъект-отношение-объект).
—Для ранжирования релевантности применяется персонализированный PageRank, обеспечивающий одношаговый многозвенный поиск.
—Инфраструктура включает Amazon Bedrock (LLM), Neptune (графовая БД), Neptune Analytics (алгоритмы) и Titan Embeddings (векторизация).
—Тестирование проводилось на наборе HotpotQA; импорт данных в Neptune конвертируется из JSON через CSV и S3.

Глоссарий · 4 термина▾

RAG: Retrieval Augmented Generation — метод дополнения ответов языковой модели информацией из внешних источников, найденной по запросу.
Multi-hop reasoning: Задача, требующая объединения фактов из нескольких документов для получения ответа.
Personalized PageRank: Алгоритм ранжирования узлов графа относительно заданной начальной точки, учитывающий случайные блуждания с возвратом.
Knowledge Graph: Графовая база данных, хранящая информацию в виде сущностей (узлов) и связей между ними (рёбер).

Метод Retrieval Augmented Generation (RAG) улучшает ответы языковых моделей за счёт подгрузки внешних данных, но при вопросах, требующих связи информации из нескольких документов (multi-hop reasoning), стандартные подходы часто дают сбой. Каждый документ обрабатывается независимо, и модель не может легко соединить разрозненные факты.

HippoRAG, предложенный исследователями, решает эту проблему, копируя механизм человеческой памяти: неокортекс обрабатывает восприятие, а гиппокамп создаёт индекс ассоциаций. В программной реализации это выражается в построении графа знаний (Knowledge Graph) на основе извлечённых из текста триплетов «субъект-отношение-объект». Для поиска релевантных узлов графа используется алгоритм Personalized PageRank (PPR), который позволяет одним шагом пройти по нескольким связям, а не перебирать их итеративно.

Компонент	Роль в HippoRAG
Amazon Bedrock	Извлечение триплетов, ответы на вопросы, распознавание сущностей
Amazon Neptune	Хранение графа знаний
Amazon Neptune Analytics	Выполнение Personalized PageRank
Amazon Titan Embeddings	Векторизация текста

На практике HippoRAG развёрнут на стеке управляемых сервисов AWS. Amazon Bedrock предоставляет LLM для генерации триплетов, ответов на вопросы и распознавания именованных сущностей. Amazon Neptune служит графовой базой данных для хранения структуры знаний. Для выполнения сложных алгоритмов, включая PPR, используется Amazon Neptune Analytics. Векторные представления текста создаются с помощью Amazon Titan Embeddings. Весь процесс импорта данных из набора HotpotQA (JSON → триплеты → CSV → S3 → Neptune) автоматизирован классом HotpotQANeptuneImporter.

Для ранжирования релевантности применяется персонализированный PageRank, обеспечивающий одношаговый многозвенный поиск.

HippoRAG architecture on AWS using Amazon Bedrock, Neptune Database, Neptune Analytics, and Amazon Titan Embeddings · Источник: AWS Machine Learning Blog

Подход HippoRAG особенно актуален для корпоративных сценариев, где ответы требуют объединения информации из множества источников, например, в юридических или медицинских системах. Замена стандартного RAG на вариант с графом знаний и персонализированным PageRank позволяет сократить количество итераций и улучшить точность при многозвенных запросах. Реализация на AWS упрощает масштабирование и интеграцию с существующей инфраструктурой.

Разобраться глубже

Как внедрить ИИ в бизнес в 2026 году: пошаговый план для руководителя

Практический гайд для руководителя: как выбрать первый проект с ИИ, подготовить данные, посчитать экономику и довести пилот до рабочего процесса.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ

По теме

Google Research открыла карту отражательной способности крыш для 50+ городов

Продолжить по разделам

HippoRAG: реализация нейробиологически вдохновленного RAG на Amazon Bedrock и Neptune

Кратко

Читать дальше

Amazon Bedrock в AWS GovCloud (US) получил OpenAI GPT OSS и NVIDIA Nemotron

NVIDIA Isaac ROS: открытая платформа для роботов на CUDA-ускорении

Google Research открыла карту отражательной способности крыш для 50+ городов