Mistral Medium 3.5, Kandinsky 6.0 и ChatGPT в таблицах: главные ИИ-новости недели

Подготовлено редакцией Malakhov AI

Habr AI·10 мая·3 минРоссияКод

Mistral выпустила Medium 3.5 на 128 млрд параметров с результатом 77,6% на SWE-Bench Verified, Сбер обновил Kandinsky до версии 6.0 с архитектурой MoE, а OpenAI сменила дефолтную модель в ChatGPT на GPT-5.5 Instant — всё это произошло за одну неделю. Параллельно Anthropic подключила Claude к Blender, Adobe и Ableton через MCP, а ElevenLabs открыла платформу ElevenMusic с роялти для авторов.

Кратко

—Mistral Medium 3.5: 128B параметров, контекст 256 тыс. токенов, 91,4% на агентном бенчмарке τ³-Telecom.
—Kandinsky 6.0 Image Pro от Сбера заменил две предыдущие модели, скорость выросла на 40%.
—GPT-5.5 Instant стал дефолтной моделью ChatGPT: на 52,5% меньше галлюцинаций на чувствительных запросах.
—Claude подключён к Blender, Photoshop, Premiere, Ableton и Autodesk Fusion через MCP-коннекторы.
—ElevenLabs запустила ElevenMusic — платформу с 4 000+ артистами, ремиксами и выплатой роялти.

Глоссарий · 6 терминов▾

MoE (Mixture of Experts): Архитектура нейросети, при которой на каждый запрос активируется только часть параметров — это снижает вычислительные затраты при сохранении качества.
MCP (Model Context Protocol): Открытый протокол от Anthropic, позволяющий языковым моделям подключаться к внешним приложениям и получать доступ к их функциям и документации.
SWE-Bench Verified: Benchmark для оценки способности ИИ-моделей решать реальные задачи из открытых GitHub-репозиториев — исправлять баги и реализовывать фичи.
Image RAG: Техника, при которой модель генерации изображений подтягивает визуальные референсы из базы знаний для точного воспроизведения стилей и объектов.
vLLM / SGLang: Фреймворки для эффективного запуска больших языковых моделей на GPU — ускоряют инференс и снижают потребление памяти.
Омнимодальность: Способность модели работать одновременно с несколькими типами данных: текстом, изображениями, видео и аудио.

За одну неделю сразу несколько крупных игроков обновили свои модели и инструменты. Mistral выпустила Medium 3.5 — модель на 128 млрд параметров с контекстным окном в 256 тыс. токенов. Веса доступны на Hugging Face, лицензия открыта для коммерческого использования с оговорками для компаний с большой выручкой. На бенчмарке SWE-Bench Verified, который измеряет способность модели решать реальные задачи из GitHub-репозиториев, Medium 3.5 набрала 77,6% — выше, чем Qwen3.5 397B A17B. На агентном бенчмарке τ³-Telecom результат составил 91,4%. Отдельная EAGLE-версия позволяет запускать модель на четырёх GPU через vLLM или SGLang. Вместе с релизом Mistral обновила Vibe-агентов: они переехали в облако, умеют работать асинхронно и переносить локальную CLI-сессию без потери истории.

OpenAI сменила дефолтную модель в ChatGPT: теперь по умолчанию отвечает GPT-5.5 Instant — быстрая модель без режима размышлений. По внутренним тестам компании, на чувствительных запросах про право и медицину новая модель выдала на 52,5% меньше галлюцинаций по сравнению с GPT-5.3 Instant, а на сложных диалогах число фактических ошибок сократилось на 37,3%. Обновление распространяется на платных и бесплатных пользователей. Параллельно ChatGPT появился в Google Таблицах — теперь модель можно вызывать прямо из ячеек.

Модель	Параметры	Контекст	Ключевой результат
Mistral Medium 3.5	128B	256 тыс. токенов	77,6% SWE-Bench Verified
Xiaomi MiMo-V2.5-Pro	1,02 трлн / 42B активных	1 млн токенов	MoE, открытая лицензия MIT
Xiaomi MiMo-V2.5	310B / 15B активных	1 млн токенов	Омнимодальность: текст, фото, видео, аудио
Talkie	13B	—	Обучена только на текстах до 1931 года, 260 млрд токенов

Сбер выпустил Kandinsky 6.0 Image Pro — единую модель для генерации и редактирования изображений, которая заменила связку Kandinsky 5 Text-to-Image и Image Editing Lite. Скорость выросла более чем на 40% за счёт перехода на архитектуру MoE (Mixture of Experts), при которой активируется только часть параметров сети — это снижает вычислительную нагрузку без потери качества. Среди функций — удаление объектов, замена предметов с сохранением стиля, стилизация портретов, реставрация старых фото и генерация интерьеров по плану помещения. Отдельная фича — Image RAG: модель подтягивает референсы из базы знаний, чтобы точнее попадать в конкретные стили и персонажей. Сбер сравнивал Kandinsky 6.0 с Flux 2 Max и GPT Image 1.5 и утверждает, что модель не уступает им, а местами выигрывает.

Kandinsky 6.0 Image Pro от Сбера заменил две предыдущие модели, скорость выросла на 40%.

Антропик выпустила MCP-коннекторы, через которые Claude напрямую подключается к творческим инструментам: Blender, Photoshop, Premiere, Autodesk Fusion, Ableton, SketchUp и ещё нескольким программам. MCP (Model Context Protocol) — открытый протокол, который позволяет языковым моделям получать доступ к внешним приложениям и их документации. В Blender Claude может разбирать сцену, писать скрипты, массово менять объекты и добавлять инструменты прямо в интерфейс. В Adobe коннектор охватывает 50+ инструментов Creative Cloud, включая Photoshop, Premiere и Express. Это часть более широкой стратегии Anthropic по встраиванию Claude в профессиональные рабочие процессы.

Xiaomi выпустила MiMo-V2.5-Pro — открытую модель с MoE-архитектурой на 1,02 трлн параметров и 42 млрд активных. Модель поддерживает контекст до 1 млн токенов, умеет самостоятельно вызывать инструменты и проверять результат кода. Лицензия MIT. Есть облегчённая версия MiMo-V2.5 на 310 млрд параметров с нативной омнимодальностью — работает с текстом, изображениями, видео и аудио.

ElevenLabs запустила ElevenMusic — платформу, где можно слушать треки, делать ремиксы через ИИ и публиковать их с выплатой роялти авторам. На старте каталог насчитывает 4 000+ артистов. Компания заранее заключила лицензионные соглашения с Merlin и Kobalt, что отличает её от большинства генераторов музыки, работающих в правовой серой зоне.

Отдельного внимания заслуживает Talkie — языковая модель на 13 млрд параметров, обученная исключительно на англоязычных текстах до 1 января 1931 года: книгах, газетах, патентах и судебных делах. Проект создан при участии Алека Рэдфорда, одного из создателей первой GPT. Цель — исследовательская: проверить, где модель применяет логику, а где воспроизводит паттерны из обучающих данных, и измерить, насколько события будущего выглядели бы неожиданными для человека из 1930-х. Летом команда планирует масштабировать Talkie до уровня GPT-3.

Разобраться глубже

Как внедрить ИИ в бизнес в 2026 году: пошаговый план для руководителя

Практический гайд для руководителя: как выбрать первый проект с ИИ, подготовить данные, посчитать экономику и довести пилот до рабочего процесса.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ