ИИ-ассистент с долговременной памятью: извлечение фактов и проблемы персональных данных

Подготовлено редакцией Malakhov AI

Habr AI·16 часов назад·2 минРоссияКод

Система на PostgreSQL с pgvector и вызовами LLM столкнулась с вопросами обработки персональных данных при использовании GigaChat. Разработчик создал ИИ-ассистента с долговременной памятью, который самостоятельно извлекает факты из диалогов, хранит их с весами и забывает устаревшие.

Кратко

—Ассистент извлекает структурированные факты из сообщений пользователя через отдельный вызов модели
—Факты хранятся с весами: повторы увеличивают вес, старые факты со временем забываются
—Используется PostgreSQL с pgvector для векторного поиска по контексту и базе знаний
—Для задач извлекаются дедлайны, которые конвертируются в абсолютные даты
—Применение GigaChat для обработки фактов вызывает вопросы о соответствии закону о персональных данных

Глоссарий · 3 термина▾

pgvector: Расширение PostgreSQL для работы с векторными данными, позволяющее выполнять поиск по смыслу (семантический поиск).
RAG: Retrieval-Augmented Generation — подход, при котором модель дополняется релевантными фрагментами из базы знаний перед генерацией ответа.
Эмбеддинги: Векторные представления текста, сохраняющие смысловую близость между похожими фрагментами.

Разработчик, начав с текстовой браузерной игры, создал ИИ-ассистента с долговременной памятью. Система построена на PostgreSQL с расширением pgvector для векторного поиска и использует облачные LLM для извлечения структурированных фактов из диалогов. Управление памятью включает механизм весов и забывания: повторяющиеся факты получают больший вес, а устаревшие (планы старше 30 дней, события старше 14 дней) постепенно снижаются до нуля и перестают учитываться в промпте.

Память разделена на две части. Первая — векторный поиск по контексту: при каждом запросе пользователя собирается промпт из системного шаблона, профиля, последних сообщений и релевантных фрагментов базы знаний через RAG. Вторая — факты: структурированные утверждения, которые ассистент извлекает после каждого сообщения. Например, из сообщения «У меня Toyota Camry 2019 года… напомни завтра в 15:00 забрать заказ» экстрактор возвращает JSON с фактами и задачами, где «завтра в 15:00» преобразуется в конкретную дату и время UTC.

Задача	Модель	Input / Output, ₽ за 1M токенов
Чат (основная)	Gemini 2.5 Flash	33 / 276
Чат (эконом)	Qwen 3.5 Flash	4 / 44
Extraction	GPT-5 Nano	4 / 31
Vision	Qwen3 VL Flash	3 / 33
Embeddings	text‑embedding-3-small	3

Для работы с памятью применяется нормализация времени: относительные обозначения вроде «сегодня» заменяются на абсолютные даты. При сохранении нового факта система ищет похожий по смыслу (similarity выше 0.70) — если находит, увеличивает вес старого факта, не создавая дубль. Вес старых фактов со временем падает, но физически они не удаляются, а исключаются из промпта. Это предотвращает захламление контекста и конфликты между противоречивыми фактами.

Факты хранятся с весами: повторы увеличивают вес, старые факты со временем забываются

Однако ключевая проблема — обработка персональных данных. Разработчик использует GigaChat (российскую LLM от Сбера) для экстракции фактов, что означает передачу личных сведений пользователя (автомобиль, здоровье, планы) на серверы провайдера. В условиях российского законодательства о персональных данных (152-ФЗ) такая передача требует информированного согласия пользователя и, возможно, локализации данных. В текущей реализации ассистент не предоставляет механизма явного согласия на сбор и обработку фактов, что создаёт юридические риски. Кроме того, использование GigaChat может быть ограничено в контексте хранения и обработки sensitive data без соответствующих гарантий.

Разработчик планирует дальнейшее развитие: улучшение экстракции фактов, интеграция с внешними сервисами через API, поддержка мультиагентских пайплайнов. Однако вопросы конфиденциальности остаются открытыми. Пока ассистент работает как личный инструмент, но для публичного запуска потребуется пересмотреть архитектуру в части обработки персональных данных — возможно, с использованием локальных моделей или шифрования.

Разобраться глубже

Как внедрить ИИ в бизнес в 2026 году: пошаговый план для руководителя

Практический гайд для руководителя: как выбрать первый проект с ИИ, подготовить данные, посчитать экономику и довести пилот до рабочего процесса.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ

По теме

NAIRR и NVIDIA: 700 научных проектов за два года

Продолжить по разделам

ИИ-ассистент с долговременной памятью: извлечение фактов и проблемы персональных данных

Кратко

Читать дальше

ИТ-джуниоры под угрозой: сокращение вакансий на 60% и рост токенмаксинга

Правительственная комиссия одобрила доработанный законопроект об ИИ

NAIRR и NVIDIA: 700 научных проектов за два года