Клиент для Ollama переехал с PostgreSQL на MongoDB: зачем и что изменилось

Подготовлено редакцией Malakhov AI

Habr AI·10 часов назад·3 минРоссияКод

Разработчик Николай Пискунов, руководитель направления Big Data в Beeline Cloud, переписал клиент для облачного сервиса Ollama — заменил PostgreSQL на MongoDB, устранил зависания React-интерфейса и добавил анализ кода с фильтрацией через.gitignore. Статья разбирает, почему документоориентированная база оказалась удобнее реляционной для хранения диалогов с LLM.

Кратко

—PostgreSQL хранит большие тексты через механизм TOAST — сжимает и раскладывает по вспомогательным таблицам, что замедляет запись и чтение.
—MongoDB хранит весь диалог как один BSON-документ: одна операция ввода-вывода вместо сборки по кускам, лимит — 16 МБ на документ.
—По данным автора, MongoDB в шесть раз эффективнее использует дисковое пространство при работе с JSON по сравнению с PostgreSQL.
—Фронтенд на React зависал из-за полного перерендера дерева компонентов при каждом новом чанке от LLM — решили мемоизацией через React.memo и useCallback.
—Новая функция «Анализ проекта» позволяет загрузить код для ревью с умной фильтрацией через.gitignore.

Глоссарий · 6 терминов▾

Ollama: Сервис для локального запуска языковых моделей (LLM) на собственной инфраструктуре без отправки данных во внешние облака.
TOAST: Механизм PostgreSQL для хранения больших значений: данные свыше ~2 КБ автоматически сжимаются и переносятся во вспомогательные таблицы.
BSON: Бинарный формат сериализации данных, используемый MongoDB — расширение JSON с поддержкой дополнительных типов данных.
чанк: Фрагмент данных, передаваемый по частям в режиме стриминга — языковые модели отдают ответ не целиком, а последовательными небольшими кусками.
мемоизация: Техника оптимизации, при которой результат вычисления кешируется и повторно используется, если входные данные не изменились.
.gitignore: Файл конфигурации Git, перечисляющий пути и паттерны файлов, которые система контроля версий должна игнорировать.

Николай Пискунов, руководитель направления Big Data в Beeline Cloud, опубликовал продолжение цикла о клиенте для Ollama — облачного сервиса для запуска языковых моделей. В новой части он описывает три изменения: смену базы данных, оптимизацию фронтенда и новую функцию анализа кода.

В первой версии проекта история диалогов хранилась в PostgreSQL: таблица chat_history, каждое сообщение — отдельная строка, связанная с сессией через session_id. Схема работала, но обнаружила слабое место при длинных ответах языковых моделей. PostgreSQL использует механизм TOAST (The Oversized-Attribute Storage Technique): когда текст превышает примерно 2 КБ, база автоматически сжимает его и перемещает в отдельные служебные таблицы, оставляя в основной лишь указатель. При чтении истории сервер вынужден собирать диалог по кускам из нескольких таблиц — это создаёт нагрузку на процессор и дисковую систему, а производительность падает по мере роста объёма текста.

Параметр	PostgreSQL	MongoDB
Механизм хранения больших текстов	TOAST: сжатие и перенос в служебные таблицы при >2 КБ	BSON-документ целиком, без вспомогательных таблиц
Чтение истории диалога	Сборка по строкам через JOIN / ORDER BY	Один запрос — готовый объект со всей историей
Лимит на запись	До 1 ГБ на колонку	До 16 МБ на документ
Эффективность хранения JSON	Базовая	В 6 раз эффективнее по дисковому пространству (по данным автора)
Обновление записи	Перезапись всего объекта	Обновление части документа без перезаписи целиком

MongoDB решает эту задачу иначе. Данные хранятся в бинарном формате BSON как самодостаточные документы: весь диалог — один объект в коллекции chat_sessions, внутри которого массив messages с вложенными документами (role, content, timestamp). Чтение сессии — одна операция ввода-вывода. Лимит на документ составляет 16 МБ, чего, по оценке автора, достаточно для подавляющего большинства диалогов с LLM: для сравнения, все тексты Шекспира в текстовом формате занимают около 5,5 МБ. Автор также указывает, что MongoDB в шесть раз эффективнее использует дисковое пространство при работе с JSON по сравнению с PostgreSQL, а нагрузка на процессор снижается за счёт отсутствия постоянного сжатия и распаковки.

MongoDB хранит весь диалог как один BSON-документ: одна операция ввода-вывода вместо сборки по кускам, лимит — 16 МБ на документ.

Смена базы данных повлекла и изменение модели данных. Вместо SQL-запроса, собирающего строки по session_id, сервис теперь получает готовый объект ChatHistory со всей историей диалога за один запрос. Методы addUserMessage и addAssistantMessage инкапсулируют логику добавления сообщений и обновления временных меток — код сервиса стал компактнее. Автор оговаривается, что NoSQL не универсальное решение, но для документоориентированного сценария чата подход оказался органичным.

Вторая проблема проявилась при тестировании с длинными промтами: фронтенд на React начинал подтормаживать и зависать на несколько секунд. Причина — каждый новый чанк от LLM вызывал обновление состояния messages, что приводило к полному перерендеру всего дерева компонентов, включая MessageList и все дочерние элементы. При тысячах чанков в длинном ответе React не успевал перерисовывать интерфейс с частотой 60 кадров в секунду. Решением стала мемоизация через React.memo и useCallback — стандартные инструменты React, которые предотвращают лишние перерендеры компонентов, не получивших новых данных.

Третье изменение — функция «Анализ проекта», позволяющая загрузить код для ревью с фильтрацией через.gitignore. Это удобно при работе с реальными репозиториями: ненужные файлы (зависимости, артефакты сборки) автоматически исключаются, и модели передаётся только релевантный код.

Проект развивается как практический инструмент для работы с локально развёрнутыми языковыми моделями через Ollama. Подобные клиенты востребованы в сценариях, где данные не должны покидать инфраструктуру компании — например, при ревью внутреннего кода или работе с конфиденциальными документами.

Разобраться глубже

Как внедрить ИИ в бизнес в 2026 году: пошаговый план для руководителя

Практический гайд для руководителя: как выбрать первый проект с ИИ, подготовить данные, посчитать экономику и довести пилот до рабочего процесса.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ