После блокировки аккаунта Anthropic — подписки Claude Max за $200 — разработчик и амбассадор ИИ с 15-летним стажем в коммерческой разработке провела несколько месяцев, тестируя альтернативные платформы в условиях реальной работы: многонедельные агентные сессии, десятки параллельных чатов, задачи уровня сборки PyTorch под Adreno 530 на Android 9 и миграции крупной кодовой базы с PHP 7.4 на PHP 8.0.
Агентный кодинг — это подход, при котором разработчик не пишет код вручную, а направляет языковую модель как исполнителя: ставит задачи, проверяет git diff, корректирует результат. Такой режим работы потребляет токены на порядок интенсивнее, чем разовые запросы в чат, поэтому лимиты подписок становятся критическим параметром.
| Подписка | Цена | Лимит | Риск блокировки | Оценка автора |
|---|---|---|---|---|
| Minimax 2.7 Highspeed | $40/мес | ~5000 запросов / 5 ч, без недельного лимита | Нет | Основной рабочий инструмент |
| Kimi 2.6 | $40/мес | Большой, ~5% окна в час при нагрузке | Нет | Сложные многошаговые задачи |
| Mistral Vibe | Не указана | Большой | Нет | Высокая скорость |
| Ollama | 20 евро/мес | Зависит от модели; Gemini Flash через Ollama тратит быстро | Нет | Эксперименты и разнообразие моделей |
| GPT Pro (Codex) | $200/мес | Недельный лимит, заканчивается за 2–3 дня при нагрузке | Нет | Рабочие задачи, высокое качество |
| Claude Pro/Max | $200/мес | Высокий, но риск бана | Да | Не рекомендуется |
| Google (Gemini) | Не указана | Высокий, но риск бана за сторонние инструменты | Да | Не рекомендуется |
Первой проблемой оказались сами платформы. Anthropic заблокировал аккаунт без объяснений. Google, по словам автора, аналогично блокирует пользователей за применение сторонних агентных инструментов — таких как OpenCode. Подписка Codex за $200 оказалась рабочей альтернативой, но недельный лимит при интенсивной работе заканчивался за 2–3 дня, и автор постоянно рисковала остаться без основной модели в середине рабочей недели.
Minimax за $40 даёт около 5000 запросов в 5-часовом окне без недельного лимита — автор фиксирует 90–95% остатка при 10 параллельных сессиях.
Решением стала подписка Minimax 2.7 Highspeed за $40. Платформа не устанавливает недельного лимита: доступно около 5000 запросов в пятичасовом окне, которое сбрасывается каждые пять часов. При десяти параллельных сессиях автор фиксирует остаток на уровне 90–95% — то есть реального упора в лимит при обычной работе не происходит. Есть и более дешёвый вариант за $20, но без режима Highspeed, что, предположительно, сказывается на скорости генерации.
Вторым ключевым инструментом стал Kimi 2.6 за $40. Его главное практическое преимущество перед GPT 5.4 — непрерывность работы: модель не останавливается каждые несколько действий с ожиданием команды «Продолжай». Автор описывает сессии, в которых Kimi 2.6 max работал самостоятельно более двух часов и доходил до результата без ручного вмешательства. При этом подписка за $40 потребляла около 5% пятичасового окна в час при интенсивной нагрузке — существенно экономичнее, чем GPT Pro, который тратил недельный лимит за 2–3 дня на аналогичных задачах.
Отдельный блок наблюдений касается локальных моделей. Запуск двух разных моделей параллельно через llama на MacBook M4 (не Pro) замедляет обе до 0,1 токена в секунду — работать в таком режиме невозможно. Параллельные чаты с одной и той же моделью, напротив, работают быстро. Вывод: если нужны несколько локальных моделей одновременно, лучше выделять по одному устройству на модель или ограничиться одной качественной — например, Gemma 4 или Qwen 3.5 9b.
По итогам экспериментов автор сформировала связку из четырёх подписок общей стоимостью $120 в месяц: Minimax (основной рабочий инструмент с максимальными лимитами), Kimi (сложные многошаговые задачи), Mistral Vibe (высокая скорость, большие лимиты) и Ollama (доступ к разнообразным моделям для экспериментов). GPT 5.4 остаётся в арсенале для рабочих задач через корпоративный доступ, но уже не как основной инструмент.
Для задач, требующих глубокой экспертизы — психология, юриспруденция, медицина — автор рекомендует не экономить и использовать модели уровня Claude Sonnet/Opus или GPT 5.4 хотя бы через бесплатные веб-интерфейсы. Для технических задач средней сложности Minimax справляется сопоставимо с топовыми моделями, просто медленнее и с необходимостью периодически подталкивать сессию вручную.



