KodaCode перевел ИИ-модели на Inference Platform «Турбо Облака»

Российский стартап KodaCode, разработчик ИИ-помощника для программистов, перевел свои основные модели на Inference Platform от «Турбо Облака». Это позволило обрабатывать более 7 млрд токенов в день, платя только за фактические ресурсы, и подготовиться к росту аудитории с 10 тыс. до 120 тыс. пользователей.

Российский стартап KodaCode, разрабатывающий интеллектуального помощника для программистов, перевел работу своих основных моделей на продукт «Турбо Облака» — Inference Platform. После перехода компания обрабатывает более 7 млрд токенов и около 95 тыс. пользовательских запросов ежедневно, оплачивая только фактически использованные вычислительные мощности. Сейчас сервисом пользуются 10 тыс. активных разработчиков, а до конца года планируется увеличить их число до 120 тыс.

Ранее KodaCode арендовал физические серверы с GPU, что создавало две основные проблемы: негибкость расходов и длительное время восстановления при сбоях. При низкой нагрузке компания все равно платила за аренду «железа» в полном объеме, а выход из строя одной GPU приводил к простою более суток. Inference Platform от «Турбо Облака» автоматически управляет ресурсами: в пиковые часы подключаются дополнительные GPU, при спаде активности они отключаются, и плата за них не взимается. Это позволило стартапу не держать мощность «про запас» и сосредоточиться на развитии продукта.

Особую важность переход приобрел на фоне появления крупных B2B-клиентов, требующих обработки данных исключительно в России. Платформа работает на базе дата-центров «РТК-ЦОД» уровня Tier III с высоким уровнем отказоустойчивости и имеет необходимые сертификации для обработки данных российских организаций. Таким образом, код и информация пользователей остаются в защищенном российском контуре.

Стартап сократил расходы, оплачивая только фактически использованные GPU.

Основатель KodaCode Дмитрий Змитрович отметил: «Для нас переход на Inference Platform — это смена философии. Раньше мы постоянно балансировали между рисками отказов и необходимостью экономить бюджет. Теперь инфраструктура перестала быть нашей “головной болью”». Александр Обухов, генеральный директор «Турбо Облако», добавил: «Мы создавали Inference Platform именно как инструмент для снятия барьеров, с которыми сталкиваются молодые компании».

KodaCode перевел ИИ-модели на Inference Platform «Турбо Облака»

Кратко

Читать дальше

DeepSeek-R1 запустили на отечественных ARM-процессорах с NVIDIA A100

Правительственная комиссия одобрила доработанный законопроект об ИИ

Как венчурные инвесторы оценивают ИИ-стартапы в эпоху гиперроста