28 мая 2026 года «Яндекс» открыл бизнес-доступ к Alice ИИ LLM Flash через платформу Yandex ИИ Studio. Модель создавалась под конкретный запрос рынка: тексты и документы составляют около 60% всех B2B-обращений к моделям компании, и именно здесь новинка должна заменить более дорогие и медленные решения.

Flash — это облегчённая версия флагманской Alice ИИ LLM, оптимизированная под скорость и стоимость, а не под максимальное качество на всех типах задач. Такой подход стал стандартом в отрасли: Google выпускает Gemini Flash, Anthropic — Haiku, OpenAI — серию mini. Идея одна: для рутинных задач — модерации контента, классификации обращений в поддержку, диалогов с клиентами — не нужна полная мощность флагмана, но нужна низкая задержка и предсказуемая стоимость на миллион токенов.

СценарийДоля случаев, когда Alice AI LLM Flash лучше GPT-5.4 mini
Диалоговые сценарии73%
Обобщение и структуризация текста66%
Поиск по файлам и базам знаний61%
Бизнес-задачи в целом56%

По данным «Яндекса», Alice ИИ LLM Flash превосходит GPT-5.4 mini в 56% бизнес-задач в целом, а в диалоговых сценариях разрыв шире — 73% случаев в пользу российской модели. В обобщении и структуризации текста преимущество составляет 66%, в поиске по файлам и базам знаний — 61%. Стоимость при этом сопоставима с GPT-5.4 mini, тогда как по сравнению с предыдущими моделями «Яндекса» цена снизилась почти в пять раз. Руководитель Yandex ИИ Studio Артур Самигуллин подчеркнул, что модель прошла полный цикл обучения на данных «Яндекса» и обеспечивает обработку данных внутри российской инфраструктуры — аргумент, который для корпоративных клиентов нередко важнее бенчмарков.

В диалоговых сценариях модель превосходит GPT-5.4 mini в 73% случаев, в обобщении текста — в 66%.

Одновременно с запуском Flash на платформе открыли доступ к open-source модели DeepSeek V4 Flash. Это первая модель в российском облаке с контекстным окном в 1 млн токенов — объём, позволяющий анализировать целые корпоративные документы или длинные цепочки событий без разбивки на части. Модель позиционируется для разработки ИИ-агентов и многоэтапных аналитических задач. Цена на неё снижена в полтора раза относительно DeepSeek V3.2.

Для российского рынка запуск двух моделей одновременно — сигнал о том, что Yandex ИИ Studio пытается закрыть сразу несколько ниш: собственной быстрой моделью для массового B2B и открытой китайской моделью для разработчиков, которым нужен большой контекст. Конкуренты — Сбер с GigaChat и независимые провайдеры — пока не анонсировали сопоставимых по контекстному окну решений в публичном облаке.