С ростом числа документов в корпоративных Wiki поиск нужной информации становится всё сложнее. Сотрудники тратят время на навигацию, повторяют одни и те же вопросы коллегам. В ЮMoney решили проблему с помощью собственного ИИ-ассистента Юджина, построенного на технологии RAG (Retrieval-Augmented Generation).

RAG — это подход, при котором модель не переобучается на корпоративных данных, а дополняет запрос релевантными фрагментами из поискового индекса. Документы разбиваются на чанки, векторизуются и хранятся в базе. По запросу система находит подходящие фрагменты и передаёт их в контекст LLM. Это позволяет быстро обновлять базу знаний без переобучения, снижает стоимость и даёт контроль над безопасностью. В ЮMoney остановились на собственном решении, так как готовые варианты не масштабировались под постоянно меняющуюся документацию и не гарантировали сохранность конфиденциальных данных.

Тип документаМетод разбиения
OpenAPI (.yml)Разворачивание $ref, удаление components, разбиение по эндпоинтам
Markdown (.md, .markdown)Построение дерева заголовков, добавление цепочки родительских разделов
AsciiDoc (.adoc, .asciidoc)Аналогично Markdown, извлечение метаданных документа
PlantUML (.puml, .plantuml, .uml)Учёт вложенности блоков по отступам, сохранение заголовка диаграммы
HTML (.html)Конвертация в Markdown, затем обработка пайплайном Markdown
ОстальноеРекурсивное разбиение по параграфам и предложениям

Архитектура Юджина включает непрерывную индексацию из Wiki, Bitbucket и внутренних документов. Для каждого типа файлов — свой чанкер. Например, OpenAPI-спецификации разбиваются по эндпоинтам, Markdown-файлы — по заголовкам с сохранением иерархии. Оптимальный размер чанка определили экспериментально: 1024 токена с перекрытием 200 токенов. Для эмбеддингов используется открытая модель FRIDA. Поиск ведётся параллельно: полнотекстовый (через OpenSearch) и векторный (по семантической близости). Это позволяет находить ответы даже на запросы, не совпадающие по формулировкам.

Интерфейс Юджина — чат с возможностью загружать документы размером до 5 МБ. Ассистент помогает с поиском информации, анализирует файлы, отвечает на вопросы по коду. Компания продолжает развивать платформу, добавляя поддержку новых источников и улучшая качество ответов.