Константин Крестников, управляющий директор и техлид команды GigaChain в Сбере, в интервью для Habr подробно рассказал, как менялась архитектура SDK для GigaChat — от форка популярного фреймворка до самостоятельного пакета интеграции, который сегодня используют как внутренние разработчики банка, так и внешние пользователи модели.

Когда в Сбере только запускали GigaChat, встал вопрос: как дать разработчикам инструмент для написания приложений на его основе. Писать всё с нуля означало риск «переизобрести велосипед» и столкнуться с дефицитом специалистов, незнакомых с проприетарным решением. Выбор пал на LangChain — на тот момент самый популярный в мире фреймворк для создания ИИ-агентов. Команда сделала форк и начала адаптировать его под русский язык: в эпоху промпт-инжиниринга LangChain содержал промпты, зашитые в код на английском, а GigaChat заметно лучше работал с русскоязычными инструкциями. Попытка договориться с владельцами LangChain о многоязычной поддержке не принесла результата — аналогичная история произошла и с китайскими партнёрами.

Проблема форка проявилась по мере роста популярности LLM-тематики. LangChain начал обновляться с огромной скоростью: команде приходилось еженедельно переносить к себе по 100–200 изменений из основного репозитория. Синхронизация поглощала почти всё рабочее время. Одновременно менялась и архитектура самого LangChain: промпты вынесли в отдельное хранилище, крупные вендоры стали выпускать собственные пакеты совместимости вместо того, чтобы оставаться внутри монолитного фреймворка. Это и подтолкнуло команду к смене подхода.

Команда тратила почти всё время на синхронизацию 100–200 изменений в неделю из основного репозитория

Константин Крестников, управляющий директор, лидирует направление ИИ-агентов в Сбере и активно участвует в развитии агентных возможностей моделей GigaChat (фото: Sber Conf: Open Source & AI Agents)
Константин Крестников, управляющий директор, лидирует направление ИИ-агентов в Сбере и активно участвует в развитии агентных возможностей моделей GigaChat (фото: Sber Conf: Open Source & AI Agents) · Источник: Habr AI

Вместо форка Сбер создал отдельный пакет интеграции, обеспечивающий полную совместимость GigaChat с чистым LangChain. Пул-реквест приняли: несколько месяцев GigaChat официально упоминался в документации LangChain. Позже запись убрали, однако архитектурное решение оказалось верным — пользователи ничего не заметили, поскольку пакет работает независимо. Сегодня рекомендованный стек для разработки агентов на GigaChat — это стандартный LangChain плюс пакет совместимости от команды GigaChain. По данным сервиса ClickPy, Python-библиотека для работы с GigaChat API входит в топ 1,5% самых скачиваемых пакетов на PyPI по месячным загрузкам.

Практический эффект от перехода на открытый стек ощутим и внутри Сбера. Все команды банка получили задачу внедрять агентные системы, и значимая часть этой работы ведётся на опенсорсном стеке GigaChain. Открытость позволяет нанимать разработчиков с готовым опытом работы с LangChain — без необходимости погружать их в закрытую внутреннюю документацию. Крестников отмечает, что проект начинался как R&D-инициатива одного человека и рос органически, без формальной координации. Именно это, по его словам, позволило удержать весь SDK для GigaChat в открытом доступе.

История GigaChain показательна для российского enterprise-сегмента: вместо того чтобы строить закрытую экосистему вокруг корпоративной модели, Сбер сделал ставку на совместимость с мировым стандартом де-факто в области агентных фреймворков. Схожим путём идут крупные западные вендоры — Anthropic, Google и другие, — которые также выпускают собственные пакеты интеграции для LangChain вместо того, чтобы поддерживать отдельные форки.