Minimax, Kimi и GPT: какие подписки выдерживают реальную агентную нагрузку

Подготовлено редакцией Malakhov AI

Habr AI·1 мая·3 минРоссияКод

Разработчик с 15-летним стажем протестировала подписки от $20 до $200 в условиях многонедельных агентных сессий — и выяснила, что Claude Max и Google банят за сторонние инструменты, а Minimax за $40 даёт практически неограниченный лимит. Личный опыт без синтетических тестов: сборка PyTorch под Adreno 530, миграция PHP 7.4 → 8.0 и десятки параллельных сессий.

Кратко

—Anthropic заблокировал аккаунт с подпиской за $200 без объяснений; Google делает то же при использовании сторонних агентов вроде OpenCode.
—Minimax за $40 даёт около 5000 запросов в 5-часовом окне без недельного лимита — автор фиксирует 90–95% остатка при 10 параллельных сессиях.
—Kimi 2.6 за $40 работает часами без команды «Продолжай» и, по оценке автора, ведёт сложные задачи осмысленнее, чем GPT 5.4.
—Итоговая связка из Minimax, Kimi, Mistral Vibe и Ollama обходится автору в $120 в месяц при высоких лимитах.
—Локальный инференс двух разных моделей параллельно на M4 замедляет обе до 0,1 токена в секунду; одна модель на устройство — рабочая схема.

Глоссарий · 6 терминов▾

агентный кодинг: Подход к разработке, при котором языковая модель выступает исполнителем задач, а разработчик управляет процессом, проверяет результат и вносит правки.
токен: Единица текста, которую обрабатывает языковая модель; примерно соответствует слогу или короткому слову; лимиты подписок измеряются в токенах или запросах.
инференс: Процесс генерации ответа языковой моделью на основе входного запроса; при локальном запуске выполняется на собственном оборудовании пользователя.
Highspeed: Режим подписки Minimax с приоритетным доступом к вычислительным ресурсам, обеспечивающий более высокую скорость генерации.
git diff: Команда системы контроля версий Git, показывающая изменения в коде между двумя состояниями; используется для проверки того, что сделала модель.
open-source: Программное обеспечение с открытым исходным кодом, доступное для свободного использования и модификации.

После блокировки аккаунта Anthropic — подписки Claude Max за $200 — разработчик и амбассадор ИИ с 15-летним стажем в коммерческой разработке провела несколько месяцев, тестируя альтернативные платформы в условиях реальной работы: многонедельные агентные сессии, десятки параллельных чатов, задачи уровня сборки PyTorch под Adreno 530 на Android 9 и миграции крупной кодовой базы с PHP 7.4 на PHP 8.0.

Агентный кодинг — это подход, при котором разработчик не пишет код вручную, а направляет языковую модель как исполнителя: ставит задачи, проверяет git diff, корректирует результат. Такой режим работы потребляет токены на порядок интенсивнее, чем разовые запросы в чат, поэтому лимиты подписок становятся критическим параметром.

Подписка	Цена	Лимит	Риск блокировки	Оценка автора
Minimax 2.7 Highspeed	$40/мес	~5000 запросов / 5 ч, без недельного лимита	Нет	Основной рабочий инструмент
Kimi 2.6	$40/мес	Большой, ~5% окна в час при нагрузке	Нет	Сложные многошаговые задачи
Mistral Vibe	Не указана	Большой	Нет	Высокая скорость
Ollama	20 евро/мес	Зависит от модели; Gemini Flash через Ollama тратит быстро	Нет	Эксперименты и разнообразие моделей
GPT Pro (Codex)	$200/мес	Недельный лимит, заканчивается за 2–3 дня при нагрузке	Нет	Рабочие задачи, высокое качество
Claude Pro/Max	$200/мес	Высокий, но риск бана	Да	Не рекомендуется
Google (Gemini)	Не указана	Высокий, но риск бана за сторонние инструменты	Да	Не рекомендуется

Первой проблемой оказались сами платформы. Anthropic заблокировал аккаунт без объяснений. Google, по словам автора, аналогично блокирует пользователей за применение сторонних агентных инструментов — таких как OpenCode. Подписка Codex за $200 оказалась рабочей альтернативой, но недельный лимит при интенсивной работе заканчивался за 2–3 дня, и автор постоянно рисковала остаться без основной модели в середине рабочей недели.

Minimax за $40 даёт около 5000 запросов в 5-часовом окне без недельного лимита — автор фиксирует 90–95% остатка при 10 параллельных сессиях.

Решением стала подписка Minimax 2.7 Highspeed за $40. Платформа не устанавливает недельного лимита: доступно около 5000 запросов в пятичасовом окне, которое сбрасывается каждые пять часов. При десяти параллельных сессиях автор фиксирует остаток на уровне 90–95% — то есть реального упора в лимит при обычной работе не происходит. Есть и более дешёвый вариант за $20, но без режима Highspeed, что, предположительно, сказывается на скорости генерации.

Вторым ключевым инструментом стал Kimi 2.6 за $40. Его главное практическое преимущество перед GPT 5.4 — непрерывность работы: модель не останавливается каждые несколько действий с ожиданием команды «Продолжай». Автор описывает сессии, в которых Kimi 2.6 max работал самостоятельно более двух часов и доходил до результата без ручного вмешательства. При этом подписка за $40 потребляла около 5% пятичасового окна в час при интенсивной нагрузке — существенно экономичнее, чем GPT Pro, который тратил недельный лимит за 2–3 дня на аналогичных задачах.

Отдельный блок наблюдений касается локальных моделей. Запуск двух разных моделей параллельно через llama на MacBook M4 (не Pro) замедляет обе до 0,1 токена в секунду — работать в таком режиме невозможно. Параллельные чаты с одной и той же моделью, напротив, работают быстро. Вывод: если нужны несколько локальных моделей одновременно, лучше выделять по одному устройству на модель или ограничиться одной качественной — например, Gemma 4 или Qwen 3.5 9b.

По итогам экспериментов автор сформировала связку из четырёх подписок общей стоимостью $120 в месяц: Minimax (основной рабочий инструмент с максимальными лимитами), Kimi (сложные многошаговые задачи), Mistral Vibe (высокая скорость, большие лимиты) и Ollama (доступ к разнообразным моделям для экспериментов). GPT 5.4 остаётся в арсенале для рабочих задач через корпоративный доступ, но уже не как основной инструмент.

Для задач, требующих глубокой экспертизы — психология, юриспруденция, медицина — автор рекомендует не экономить и использовать модели уровня Claude Sonnet/Opus или GPT 5.4 хотя бы через бесплатные веб-интерфейсы. Для технических задач средней сложности Minimax справляется сопоставимо с топовыми моделями, просто медленнее и с необходимостью периодически подталкивать сессию вручную.

Разобраться глубже

ИИ-агенты для бизнеса: что это и где применять

ИИ-агенты для бизнеса простыми словами: чем агент отличается от чат-бота, из каких четырёх частей собирается, какие бывают уровни автономности, карта из 10 сценариев применения, кейс сервисной компании и расчёт окупаемости агента поддержки.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ

По теме

Palantir внедряет NVIDIA Nemotron для ИИ в госучреждениях США

Продолжить по разделам

Minimax, Kimi и GPT: какие подписки выдерживают реальную агентную нагрузку

Кратко

Читать дальше

VK вылетел из App Store, а в России готовят регулирование ИИ

«Яндекс» запустил платформу для создания ИИ-агентов в «Алисе ИИ»

Palantir внедряет NVIDIA Nemotron для ИИ в госучреждениях США