Внутренний ИИ-помощник на RAG: как ЮMoney создал Юджина для поиска по корпоративной Wiki

ЮMoney создала внутреннего ИИ-ассистента Юджина на основе RAG, чтобы сотрудники тратили меньше времени на поиск информации в корпоративной документации. Илья, директор департамента разработки, рассказал о мотивации отказа от готовых решений и деталях архитектуры.

С ростом числа документов в корпоративных Wiki поиск нужной информации становится всё сложнее. Сотрудники тратят время на навигацию, повторяют одни и те же вопросы коллегам. В ЮMoney решили проблему с помощью собственного ИИ-ассистента Юджина, построенного на технологии RAG (Retrieval-Augmented Generation).

RAG — это подход, при котором модель не переобучается на корпоративных данных, а дополняет запрос релевантными фрагментами из поискового индекса. Документы разбиваются на чанки, векторизуются и хранятся в базе. По запросу система находит подходящие фрагменты и передаёт их в контекст LLM. Это позволяет быстро обновлять базу знаний без переобучения, снижает стоимость и даёт контроль над безопасностью. В ЮMoney остановились на собственном решении, так как готовые варианты не масштабировались под постоянно меняющуюся документацию и не гарантировали сохранность конфиденциальных данных.

Тип документа	Метод разбиения
OpenAPI (.yml)	Разворачивание $ref, удаление components, разбиение по эндпоинтам
Markdown (.md, .markdown)	Построение дерева заголовков, добавление цепочки родительских разделов
AsciiDoc (.adoc, .asciidoc)	Аналогично Markdown, извлечение метаданных документа
PlantUML (.puml, .plantuml, .uml)	Учёт вложенности блоков по отступам, сохранение заголовка диаграммы
HTML (.html)	Конвертация в Markdown, затем обработка пайплайном Markdown
Остальное	Рекурсивное разбиение по параграфам и предложениям

Архитектура Юджина включает непрерывную индексацию из Wiki, Bitbucket и внутренних документов. Для каждого типа файлов — свой чанкер. Например, OpenAPI-спецификации разбиваются по эндпоинтам, Markdown-файлы — по заголовкам с сохранением иерархии. Оптимальный размер чанка определили экспериментально: 1024 токена с перекрытием 200 токенов. Для эмбеддингов используется открытая модель FRIDA. Поиск ведётся параллельно: полнотекстовый (через OpenSearch) и векторный (по семантической близости). Это позволяет находить ответы даже на запросы, не совпадающие по формулировкам.

Интерфейс Юджина — чат с возможностью загружать документы размером до 5 МБ. Ассистент помогает с поиском информации, анализирует файлы, отвечает на вопросы по коду. Компания продолжает развивать платформу, добавляя поддержку новых источников и улучшая качество ответов.

Внутренний ИИ-помощник на RAG: как ЮMoney создал Юджина для поиска по корпоративной Wiki

Кратко

Читать дальше

Сравнение шести нейросетей для генерации изображений

Anthropic представила Claude Sonnet 5 на Amazon Bedrock

NVIDIA BioNeMo Agent Toolkit интегрирован в научный ИИ-воркбенч Claude Science