Российский стартап KodaCode, разрабатывающий интеллектуального помощника для программистов, перевел работу своих основных моделей на продукт «Турбо Облака» — Inference Platform. После перехода компания обрабатывает более 7 млрд токенов и около 95 тыс. пользовательских запросов ежедневно, оплачивая только фактически использованные вычислительные мощности. Сейчас сервисом пользуются 10 тыс. активных разработчиков, а до конца года планируется увеличить их число до 120 тыс.
Ранее KodaCode арендовал физические серверы с GPU, что создавало две основные проблемы: негибкость расходов и длительное время восстановления при сбоях. При низкой нагрузке компания все равно платила за аренду «железа» в полном объеме, а выход из строя одной GPU приводил к простою более суток. Inference Platform от «Турбо Облака» автоматически управляет ресурсами: в пиковые часы подключаются дополнительные GPU, при спаде активности они отключаются, и плата за них не взимается. Это позволило стартапу не держать мощность «про запас» и сосредоточиться на развитии продукта.
Особую важность переход приобрел на фоне появления крупных B2B-клиентов, требующих обработки данных исключительно в России. Платформа работает на базе дата-центров «РТК-ЦОД» уровня Tier III с высоким уровнем отказоустойчивости и имеет необходимые сертификации для обработки данных российских организаций. Таким образом, код и информация пользователей остаются в защищенном российском контуре.
Стартап сократил расходы, оплачивая только фактически использованные GPU.
Основатель KodaCode Дмитрий Змитрович отметил: «Для нас переход на Inference Platform — это смена философии. Раньше мы постоянно балансировали между рисками отказов и необходимостью экономить бюджет. Теперь инфраструктура перестала быть нашей “головной болью”». Александр Обухов, генеральный директор «Турбо Облако», добавил: «Мы создавали Inference Platform именно как инструмент для снятия барьеров, с которыми сталкиваются молодые компании».



