Alibaba Cloud выпустила Qwen 3.7 — обновление семейства open-source языковых моделей. Qwen является семейством больших языковых моделей, которое развивает подразделение Alibaba Cloud. В отличие от OpenAI или Anthropic, для Alibaba нейросети — лишь одно из направлений экосистемы, включающей облачные сервисы, электронную коммерцию и корпоративные решения. Главная особенность проекта — большое количество открытых моделей, которые можно скачать и запускать локально. Для бизнеса это важно: компании получают возможность использовать нейросеть без зависимости от внешнего поставщика и полностью контролировать инфраструктуру.
Что нового появилось в Qwen 3.7? Alibaba улучшила практически все основные направления. Судя по первым обзорам и опубликованным результатам тестов, новые модели заметно прибавили в программировании, логических рассуждениях и агентных сценариях. Флагманская модель Qwen3.7-Max получила контекстное окно до миллиона токенов и демонстрирует сильные результаты в SWE-bench, Terminal-Bench и других тестах, связанных с кодированием и агентными системами. Многие пользователи отмечают, что новое поколение сократило отставание от Claude в задачах разработки.
| Модель | Тип | Контекстное окно | ScreenSpot Pro |
|---|---|---|---|
| Qwen3.7-Max | Флагманская | До 1 млн токенов | — |
| Qwen3.7-Plus | Мультимодальная (Computer Use) | — | 79 баллов |
Самая необычная функция — агент в браузере. Вместе с новыми моделями Alibaba представила Qwen3.7-Plus — мультимодальную систему, которая умеет работать с интерфейсами компьютера. Модель набрала 79 баллов в тесте ScreenSpot Pro — одном из главных бенчмарков для оценки способности ИИ ориентироваться в интерфейсах. Для сравнения, результаты выше 75 считаются уровнем лучших агентных систем рынка. Фактически модель видит экран, перемещает курсор, нажимает кнопки и принимает решения на основе происходящего. На демо показано, как агент ищет и оформляет самый дешевый облачный сервер, переходя между страницами, сравнивая конфигурации и заполняя поля.
Флагманская модель Qwen3.7-Max имеет контекстное окно до 1 млн токенов и превосходит предшественников в программировании.
Ограничения агента: пользователь определяет, к каким сайтам и приложениям агент получает доступ, а критически важные действия — например, оформление заказа — требуют отдельного подтверждения. Речь идет не о полном захвате браузера, а о продвинутом автопилоте, выполняющем рутинные действия под наблюдением. Такие сценарии сегодня объединяют термином Computer Use.
Первые отзывы о Qwen 3.7 позитивные. Build Fast With ИИ похвалил модель за высокий результат в ScreenSpot Pro. При этом отмечается, что, несмотря на прогресс, Qwen все еще уступает лидерам в некоторых сценариях. Тем не менее для бизнеса Qwen 3.7 — мощная open-source альтернатива, позволяющая сократить затраты на ИИ-инфраструктуру и сохранить контроль над данными.
