19 февраля 2026 года Google выпустил Gemini 3.1 Pro — и результаты тестирования оказались неожиданными даже для тех, кто следит за отраслью. Модель набрала 77,1% в ARC-AGI-2, тесте на способность к логическому рассуждению с новыми паттернами, тогда как предыдущая версия показывала 31,1%. Прирост в 46 процентных пунктов за одно поколение — крупнейший в истории передовых моделей по этому показателю. При этом Gemini 3.1 Pro оказался примерно в 6,5 раза дешевле Claude Opus 4.6, который ещё в начале февраля занимал верхние строчки рейтингов.
Главное техническое новшество Gemini 3.1 Pro — трёхуровневая система управления глубиной рассуждений. Режим Low даёт молниеносные ответы для классификации и автодополнения, Medium закрывает большинство рабочих задач — ревью кода, анализ документов, ответы на вопросы, High запускает параллельный перебор нескольких путей решения. По данным экспериментов, около 80% запросов выполняются в первых двух режимах, что сокращает расходы на API на 50–70%. Технология deep think, прежде доступная только в отдельном режиме, теперь встроена в основу модели по умолчанию. Дополнительная особенность — генерация анимированных SVG-файлов по текстовому описанию: модель возвращает чистый код, готовый к размещению на сайте без дополнительных инструментов.
| Тариф | Включено | Для кого |
|---|---|---|
| Free (по ссылке) | 300 000 caps | Первые шаги, тестирование |
| Basic | 2 000 000 caps / 3 $ | Повседневные задачи |
| Premium | 5 000 000 caps / 7 $ | Регулярный контент |
| Deluxe | 10 000 000 caps / 14 $ | Командная работа |
| Elite | 35 000 000 caps / 49 $ | Крупные проекты |
| Enterprise | Индивидуально | Корпоративные клиенты |
На фоне флагманов заметно выделяется Gemini 3 Flash, вышедший в декабре 2025 года. Это облегчённая версия, обученная методом knowledge distillation — на ответах более мощного Pro. Контекстное окно составляет 1 000 000 токенов, что соответствует примерно 750 000 словам: в него помещается целый рабочий репозиторий или годовой архив переписки. Flash отвечает в несколько раз быстрее Pro и подходит для задач, где важна скорость: суммирование документов, перевод, массовая генерация контента для соцсетей.
Grok 4.20 построен на архитектуре из нескольких параллельных агентов — это принципиально иной подход по сравнению с классическими LLM.

Архитектурно иначе устроен Grok 4.20, анонсированный Илоном Маском 17 февраля 2026 года. Это не одна модель, а система из нескольких параллельных агентов, работающих совместно. Такой подход принципиально отличается от классической схемы, где один LLM последовательно обрабатывает запрос. Детали архитектуры на момент публикации раскрыты частично — модель находится в стадии беты.
Отдельного внимания заслуживает вопрос доступа к этим инструментам из России. Большинство перечисленных сервисов требуют иностранной карты или недоступны напрямую. BotHub — российский агрегатор, собравший под одним интерфейсом Gemini 3 Flash, ChatGPT 5.4 Pro, Claude Opus 4.7, Claude Sonnet 4.6, Grok 4.20, DeepSeek v3.2, Perplexity Sonar и десятки других моделей. Для разработчиков платформа предоставляет API, совместимый с форматом OpenAI: конечные точки идентичны, документация на русском языке, переход с существующей интеграции занимает минуты. Внутренняя валюта — капсы — не сгорает, срок действия пакета не ограничен. Бесплатный тариф даёт 300 000 капсов, платные начинаются от 3 долларов за 2 000 000 капсов.
Для тех, кто не готов передавать данные на внешние серверы, существуют локальные open-source варианты. Gemma 4 26B A4B от Google запускается на потребительском ноутбуке. GPT-OSS-120B — модель OpenAI с открытыми весами, 120 миллиардов параметров, которую компания выпустила в открытый доступ. Оба решения позволяют работать полностью офлайн, что критично для задач с конфиденциальными данными.
Среди специализированных решений выделяется Perplexity Sonar — модель, ориентированная на поиск с актуальными данными из интернета, а не на генерацию по обучающей выборке. DeepSeek v3.2 — китайская open-source модель, которая по ряду benchmark-показателей конкурирует с закрытыми западными флагманами при значительно меньшей стоимости использования. Claude Sonnet 4.6, по данным тестирования GDPval-AA, опережает Gemini 3.1 Pro почти на 300 пунктов Эло в задачах финансового моделирования и юридического анализа — это аргумент в пользу Anthropic для экспертных профессиональных сценариев.


