За одну неделю сразу несколько крупных игроков обновили свои модели и инструменты. Mistral выпустила Medium 3.5 — модель на 128 млрд параметров с контекстным окном в 256 тыс. токенов. Веса доступны на Hugging Face, лицензия открыта для коммерческого использования с оговорками для компаний с большой выручкой. На бенчмарке SWE-Bench Verified, который измеряет способность модели решать реальные задачи из GitHub-репозиториев, Medium 3.5 набрала 77,6% — выше, чем Qwen3.5 397B A17B. На агентном бенчмарке τ³-Telecom результат составил 91,4%. Отдельная EAGLE-версия позволяет запускать модель на четырёх GPU через vLLM или SGLang. Вместе с релизом Mistral обновила Vibe-агентов: они переехали в облако, умеют работать асинхронно и переносить локальную CLI-сессию без потери истории.
OpenAI сменила дефолтную модель в ChatGPT: теперь по умолчанию отвечает GPT-5.5 Instant — быстрая модель без режима размышлений. По внутренним тестам компании, на чувствительных запросах про право и медицину новая модель выдала на 52,5% меньше галлюцинаций по сравнению с GPT-5.3 Instant, а на сложных диалогах число фактических ошибок сократилось на 37,3%. Обновление распространяется на платных и бесплатных пользователей. Параллельно ChatGPT появился в Google Таблицах — теперь модель можно вызывать прямо из ячеек.
| Модель | Параметры | Контекст | Ключевой результат |
|---|---|---|---|
| Mistral Medium 3.5 | 128B | 256 тыс. токенов | 77,6% SWE-Bench Verified |
| Xiaomi MiMo-V2.5-Pro | 1,02 трлн / 42B активных | 1 млн токенов | MoE, открытая лицензия MIT |
| Xiaomi MiMo-V2.5 | 310B / 15B активных | 1 млн токенов | Омнимодальность: текст, фото, видео, аудио |
| Talkie | 13B | — | Обучена только на текстах до 1931 года, 260 млрд токенов |
Сбер выпустил Kandinsky 6.0 Image Pro — единую модель для генерации и редактирования изображений, которая заменила связку Kandinsky 5 Text-to-Image и Image Editing Lite. Скорость выросла более чем на 40% за счёт перехода на архитектуру MoE (Mixture of Experts), при которой активируется только часть параметров сети — это снижает вычислительную нагрузку без потери качества. Среди функций — удаление объектов, замена предметов с сохранением стиля, стилизация портретов, реставрация старых фото и генерация интерьеров по плану помещения. Отдельная фича — Image RAG: модель подтягивает референсы из базы знаний, чтобы точнее попадать в конкретные стили и персонажей. Сбер сравнивал Kandinsky 6.0 с Flux 2 Max и GPT Image 1.5 и утверждает, что модель не уступает им, а местами выигрывает.
Kandinsky 6.0 Image Pro от Сбера заменил две предыдущие модели, скорость выросла на 40%.
Антропик выпустила MCP-коннекторы, через которые Claude напрямую подключается к творческим инструментам: Blender, Photoshop, Premiere, Autodesk Fusion, Ableton, SketchUp и ещё нескольким программам. MCP (Model Context Protocol) — открытый протокол, который позволяет языковым моделям получать доступ к внешним приложениям и их документации. В Blender Claude может разбирать сцену, писать скрипты, массово менять объекты и добавлять инструменты прямо в интерфейс. В Adobe коннектор охватывает 50+ инструментов Creative Cloud, включая Photoshop, Premiere и Express. Это часть более широкой стратегии Anthropic по встраиванию Claude в профессиональные рабочие процессы.
Xiaomi выпустила MiMo-V2.5-Pro — открытую модель с MoE-архитектурой на 1,02 трлн параметров и 42 млрд активных. Модель поддерживает контекст до 1 млн токенов, умеет самостоятельно вызывать инструменты и проверять результат кода. Лицензия MIT. Есть облегчённая версия MiMo-V2.5 на 310 млрд параметров с нативной омнимодальностью — работает с текстом, изображениями, видео и аудио.
ElevenLabs запустила ElevenMusic — платформу, где можно слушать треки, делать ремиксы через ИИ и публиковать их с выплатой роялти авторам. На старте каталог насчитывает 4 000+ артистов. Компания заранее заключила лицензионные соглашения с Merlin и Kobalt, что отличает её от большинства генераторов музыки, работающих в правовой серой зоне.
Отдельного внимания заслуживает Talkie — языковая модель на 13 млрд параметров, обученная исключительно на англоязычных текстах до 1 января 1931 года: книгах, газетах, патентах и судебных делах. Проект создан при участии Алека Рэдфорда, одного из создателей первой GPT. Цель — исследовательская: проверить, где модель применяет логику, а где воспроизводит паттерны из обучающих данных, и измерить, насколько события будущего выглядели бы неожиданными для человека из 1930-х. Летом команда планирует масштабировать Talkie до уровня GPT-3.



