19 февраля 2026 года Google выпустил Gemini 3.1 Pro — и результаты тестирования оказались неожиданными даже для тех, кто следит за отраслью. Модель набрала 77,1% в ARC-AGI-2, тесте на способность к логическому рассуждению с новыми паттернами, тогда как предыдущая версия показывала 31,1%. Прирост в 46 процентных пунктов за одно поколение — крупнейший в истории передовых моделей по этому показателю. При этом Gemini 3.1 Pro оказался примерно в 6,5 раза дешевле Claude Opus 4.6, который ещё в начале февраля занимал верхние строчки рейтингов.

Главное техническое новшество Gemini 3.1 Pro — трёхуровневая система управления глубиной рассуждений. Режим Low даёт молниеносные ответы для классификации и автодополнения, Medium закрывает большинство рабочих задач — ревью кода, анализ документов, ответы на вопросы, High запускает параллельный перебор нескольких путей решения. По данным экспериментов, около 80% запросов выполняются в первых двух режимах, что сокращает расходы на API на 50–70%. Технология deep think, прежде доступная только в отдельном режиме, теперь встроена в основу модели по умолчанию. Дополнительная особенность — генерация анимированных SVG-файлов по текстовому описанию: модель возвращает чистый код, готовый к размещению на сайте без дополнительных инструментов.

ТарифВключеноДля кого
Free (по ссылке)300 000 capsПервые шаги, тестирование
Basic2 000 000 caps / 3 $Повседневные задачи
Premium5 000 000 caps / 7 $Регулярный контент
Deluxe10 000 000 caps / 14 $Командная работа
Elite35 000 000 caps / 49 $Крупные проекты
EnterpriseИндивидуальноКорпоративные клиенты

На фоне флагманов заметно выделяется Gemini 3 Flash, вышедший в декабре 2025 года. Это облегчённая версия, обученная методом knowledge distillation — на ответах более мощного Pro. Контекстное окно составляет 1 000 000 токенов, что соответствует примерно 750 000 словам: в него помещается целый рабочий репозиторий или годовой архив переписки. Flash отвечает в несколько раз быстрее Pro и подходит для задач, где важна скорость: суммирование документов, перевод, массовая генерация контента для соцсетей.

Grok 4.20 построен на архитектуре из нескольких параллельных агентов — это принципиально иной подход по сравнению с классическими LLM.

Какую языковую модель выбрать в 2026 году: обзор 12 актуальных решений
· Источник: Habr AI

Архитектурно иначе устроен Grok 4.20, анонсированный Илоном Маском 17 февраля 2026 года. Это не одна модель, а система из нескольких параллельных агентов, работающих совместно. Такой подход принципиально отличается от классической схемы, где один LLM последовательно обрабатывает запрос. Детали архитектуры на момент публикации раскрыты частично — модель находится в стадии беты.

Отдельного внимания заслуживает вопрос доступа к этим инструментам из России. Большинство перечисленных сервисов требуют иностранной карты или недоступны напрямую. BotHub — российский агрегатор, собравший под одним интерфейсом Gemini 3 Flash, ChatGPT 5.4 Pro, Claude Opus 4.7, Claude Sonnet 4.6, Grok 4.20, DeepSeek v3.2, Perplexity Sonar и десятки других моделей. Для разработчиков платформа предоставляет API, совместимый с форматом OpenAI: конечные точки идентичны, документация на русском языке, переход с существующей интеграции занимает минуты. Внутренняя валюта — капсы — не сгорает, срок действия пакета не ограничен. Бесплатный тариф даёт 300 000 капсов, платные начинаются от 3 долларов за 2 000 000 капсов.

Для тех, кто не готов передавать данные на внешние серверы, существуют локальные open-source варианты. Gemma 4 26B A4B от Google запускается на потребительском ноутбуке. GPT-OSS-120B — модель OpenAI с открытыми весами, 120 миллиардов параметров, которую компания выпустила в открытый доступ. Оба решения позволяют работать полностью офлайн, что критично для задач с конфиденциальными данными.

Среди специализированных решений выделяется Perplexity Sonar — модель, ориентированная на поиск с актуальными данными из интернета, а не на генерацию по обучающей выборке. DeepSeek v3.2 — китайская open-source модель, которая по ряду benchmark-показателей конкурирует с закрытыми западными флагманами при значительно меньшей стоимости использования. Claude Sonnet 4.6, по данным тестирования GDPval-AA, опережает Gemini 3.1 Pro почти на 300 пунктов Эло в задачах финансового моделирования и юридического анализа — это аргумент в пользу Anthropic для экспертных профессиональных сценариев.