Команда цифровой трансформации девелопера Sminex под руководством Артёма два года выстраивала корпоративную инфраструктуру для работы с языковыми моделями. Вместо того чтобы последовательно запускать отдельных ботов, команда с самого начала сделала ставку на единую платформу — и только потом стала собирать на ней конкретные сценарии. В октябре 2025 года платформа открылась для всех сотрудников компании.

Типичный путь корпоративного ИИ-внедрения выглядит так: первый ассистент, аплодисменты руководства, второй, третий — и через год у каждого свои ключи, своя модель данных и своя точка отказа. Поддержка такого «зоопарка» дорожает нелинейно. Sminex решил не повторять этот сценарий: платформа строилась раньше, чем появились кейсы. Старт медленнее, первый результат виден не сразу, зато каждый следующий ассистент собирается за часы, а не за недели.

Слой платформыИнструментНазначение
Пользовательский интерфейсOpen WebUIЕдиное окно для сотрудников, SSO, RBAC, встроенный RAG
API-шлюзLiteLLMЕдиный endpoint для всех моделей, виртуальные ключи, бюджеты, fallback
Оркестрация сценариевLangflowВизуальная сборка цепочек LLM + инструменты, публикация как MCP-сервер

Архитектура платформы состоит из трёх основных слоёв. Пользовательский интерфейс — Open WebUI, open-source-решение, которое разворачивается на собственной инфраструктуре и выглядит для сотрудника как привычный ChatGPT-подобный чат. Из коробки поддерживаются LDAP/SSO-аутентификация, ролевая модель доступа (RBAC) и встроенный RAG для работы с документами. Встроенный конструктор Model Builder позволяет собирать кастомных ассистентов с преднастроенными промптами без написания кода.

Локальные модели суммарно обработали 219 млн токенов — меньше, чем внешние, но динамика роста схожая.

Центральный элемент архитектуры — LiteLLM, open-source API-шлюз, который предоставляет единый OpenAI-совместимый endpoint для более чем 100 провайдеров. Все сервисы платформы — Open WebUI, Langflow, внутренние скрипты — обращаются к моделям исключительно через него. Прямые вызовы к провайдерам запрещены. Это даёт несколько практических преимуществ: каждая команда получает виртуальный API-ключ с лимитом расходов, переключение между провайдерами не требует правки десятков сервисов, а при падении одного провайдера LiteLLM автоматически переключается на резервный. Через тот же шлюз централизовано подключение MCP-инструментов к корпоративным системам.

Для оркестрации сложных сценариев используется Langflow — визуальный конструктор цепочек «LLM + retrieval + инструменты + постобработка». Когда стандартных нодов не хватает, команда пишет кастомные компоненты на Python прямо внутри Langflow. Связка с Open WebUI реализована через протокол MCP: каждый инструмент собирается как отдельный flow в Langflow, публикуется как MCP-сервер и подключается к ассистентам в Open WebUI. Разработка и тестирование инструментов остаются в Langflow с его playground и нодовым дебагом, а пользователи работают через привычный интерфейс Open WebUI.

По данным команды, потребление токенов OpenAI после запуска платформы росло медленно первые два месяца, затем резко ускорилось — после появления первых полезных ассистентов и серии обучающих вебинаров. Локальные модели суммарно обработали 219 млн токенов. Рост органический: никаких директив сверху, только вебинары, обучающие материалы на основе реальных запросов и канал в мессенджере, где сотрудники делятся кейсами. Команда фиксирует: главный риск корпоративного ИИ — не качество модели, а управляемость внедрения.