Разработчик, начав с текстовой браузерной игры, создал ИИ-ассистента с долговременной памятью. Система построена на PostgreSQL с расширением pgvector для векторного поиска и использует облачные LLM для извлечения структурированных фактов из диалогов. Управление памятью включает механизм весов и забывания: повторяющиеся факты получают больший вес, а устаревшие (планы старше 30 дней, события старше 14 дней) постепенно снижаются до нуля и перестают учитываться в промпте.

Память разделена на две части. Первая — векторный поиск по контексту: при каждом запросе пользователя собирается промпт из системного шаблона, профиля, последних сообщений и релевантных фрагментов базы знаний через RAG. Вторая — факты: структурированные утверждения, которые ассистент извлекает после каждого сообщения. Например, из сообщения «У меня Toyota Camry 2019 года… напомни завтра в 15:00 забрать заказ» экстрактор возвращает JSON с фактами и задачами, где «завтра в 15:00» преобразуется в конкретную дату и время UTC.

ЗадачаМодельInput / Output, ₽ за 1M токенов
Чат (основная)Gemini 2.5 Flash33 / 276
Чат (эконом)Qwen 3.5 Flash4 / 44
ExtractionGPT-5 Nano4 / 31
VisionQwen3 VL Flash3 / 33
Embeddingstext‑embedding-3-small3

Для работы с памятью применяется нормализация времени: относительные обозначения вроде «сегодня» заменяются на абсолютные даты. При сохранении нового факта система ищет похожий по смыслу (similarity выше 0.70) — если находит, увеличивает вес старого факта, не создавая дубль. Вес старых фактов со временем падает, но физически они не удаляются, а исключаются из промпта. Это предотвращает захламление контекста и конфликты между противоречивыми фактами.

Факты хранятся с весами: повторы увеличивают вес, старые факты со временем забываются

Однако ключевая проблема — обработка персональных данных. Разработчик использует GigaChat (российскую LLM от Сбера) для экстракции фактов, что означает передачу личных сведений пользователя (автомобиль, здоровье, планы) на серверы провайдера. В условиях российского законодательства о персональных данных (152-ФЗ) такая передача требует информированного согласия пользователя и, возможно, локализации данных. В текущей реализации ассистент не предоставляет механизма явного согласия на сбор и обработку фактов, что создаёт юридические риски. Кроме того, использование GigaChat может быть ограничено в контексте хранения и обработки sensitive data без соответствующих гарантий.

Разработчик планирует дальнейшее развитие: улучшение экстракции фактов, интеграция с внешними сервисами через API, поддержка мультиагентских пайплайнов. Однако вопросы конфиденциальности остаются открытыми. Пока ассистент работает как личный инструмент, но для публичного запуска потребуется пересмотреть архитектуру в части обработки персональных данных — возможно, с использованием локальных моделей или шифрования.