Kimi K2.7 Code: триллион параметров и цена в 12 раз ниже GPT-5.5

Подготовлено редакцией Malakhov AI

The Decoder·13 июн.·3 минИсследованияИндустрия

Moonshot ИИ выпустила Kimi K2.7 Code — open-weights модель с триллионом параметров, заточенную под программирование и агентные сценарии. При цене $0,95 за миллион входящих токенов она обходится в 5–12 раз дешевле GPT-5.5 и Claude Opus 4.8, хотя по ряду бенчмарков уступает западным конкурентам.

Кратко

—Kimi K2.7 Code использует архитектуру Mixture-of-Experts: 1 трлн параметров, из которых активны лишь 32 млрд на токен.
—На бенчмарке MCPMark Verified модель набирает 81,1 балла — выше, чем Claude Opus 4.8 (76,4), но ниже GPT-5.5 (92,9).
—Цена API: $0,95 / $4,00 за млн токенов (вход/выход) против $5,00 / $30,00 у GPT-5.5 и $10,00 / $50,00 у Claude Fable 5.
—Модель потребляет на 30% меньше «думающих» токенов по сравнению с K2.6, снижая затраты на длинные агентные сессии.
—Веса доступны на Hugging Face под модифицированной лицензией MIT с оговоркой для крупных коммерческих продуктов.

Глоссарий · 6 терминов▾

Mixture-of-Experts (MoE): Архитектура нейросети, при которой модель состоит из множества «экспертных» подсетей, но для каждого входного токена активируется лишь небольшое их подмножество — это снижает вычислительные затраты при сохранении большой общей ёмкости модели.
Open-weights: Модель, веса которой публично доступны для скачивания и локального запуска, в отличие от закрытых API-моделей, доступных только через облачный сервис.
Агентный сценарий: Режим работы ИИ-модели, при котором она самостоятельно планирует и выполняет многошаговые задачи: вызывает инструменты, анализирует результаты и принимает следующие действия без участия человека на каждом шаге.
MCPMark Verified: Бенчмарк, оценивающий работу ИИ-агентов в пяти реальных программных средах: Notion, GitHub, файловые системы, базы данных Postgres и браузерная автоматизация через Playwright.
INT4-квантизация: Метод сжатия весов модели до 4-битного представления, позволяющий запускать крупные модели на менее мощном или дешёвом оборудовании за счёт небольшого снижения точности.
vLLM / SGLang: Открытые inference-движки для эффективного запуска больших языковых моделей на GPU, оптимизированные под высокую пропускную способность и низкую задержку.

Moonshot ИИ — китайская лаборатория, известная прежде всего потребительским ИИ-ассистентом Kimi, — выпустила специализированную модель Kimi K2.7 Code. Это прямой преемник K2.6, оптимизированный под длительные задачи программирования и агентные рабочие процессы, где модель самостоятельно выполняет цепочки действий: пишет код, запускает тесты, взаимодействует с внешними инструментами.

Архитектурно K2.7 Code построена на принципе Mixture-of-Experts (MoE): общее число параметров составляет 1 трлн, однако при обработке каждого токена активируются лишь 32 млрд из 384 экспертов — конкретно восемь на токен. Такой подход позволяет держать вычислительные затраты на уровне значительно меньшей модели, сохраняя ёмкость большой. Контекстное окно — 256 тысяч токенов. Модель мультимодальна: помимо текста принимает изображения и видео через собственный энкодер MoonViT на 400 млн параметров. Архитектура идентична K2.5 и K2.6, что позволяет переиспользовать существующие конфигурации развёртывания без изменений.

Модель	Входящие, $ / млн токенов	Исходящие, $ / млн токенов
Kimi K2.7 Code	$0,95	$4,00
Kimi K2.6	$0,95	$4,00
Claude Opus 4.8	$5,00	$25,00
GPT-5.5	$5,00	$30,00
Claude Fable 5	$10,00	$50,00

Ключевое улучшение по сравнению с предшественником — эффективность рассуждений. K2.7 Code тратит примерно на 30% меньше «думающих» токенов, что снижает проблему избыточного «обдумывания» простых задач. Модель поддерживает режим preserve_thinking, сохраняющий полную цепочку рассуждений между ходами диалога — это критично для многошаговых агентных сценариев.

На бенчмарке MCPMark Verified модель набирает 81,1 балла — выше, чем Claude Opus 4.8 (76,4), но ниже GPT-5.5 (92,9).

K2.7 Code shows strong agent performance: while it still trails competitors on pure coding benchmarks, it holds its own on agent-focused tests. | Image: Kimi · Источник: The Decoder

На собственных бенчмарках Moonshot ИИ прогресс заметен: Kimi Code Bench v2 вырос с 50,9 до 62,0, Program Bench — с 48,3 до 53,6, MLS Bench Lite — с 26,7 до 35,1. На агентных тестах модель набирает 76,0 на MCP Atlas (было 69,4) и 81,1 на MCPMark Verified (было 72,8). MCPMark Verified проверяет работу агентов в пяти реальных программных средах: Notion, GitHub, файловые системы, базы данных Postgres и браузерная автоматизация через Playwright. Здесь K2.7 Code превосходит Claude Opus 4.8 (76,4), хотя GPT-5.5 остаётся впереди с результатом 92,9.

На чисто кодовых бенчмарках картина менее лестная. Program Bench — особенно жёсткий тест: агент должен воспроизвести поведение программы, имея только скомпилированный бинарник и документацию, без исходного кода, декомпиляции и доступа в интернет. GPT-5.5 набирает здесь 69,1 против 53,6 у K2.7 Code. На Kimi Code Bench v2 разрыв меньше: 69,0 против 62,0.

Главный аргумент Moonshot ИИ — цена. API-тарификация K2.7 Code составляет $0,95 за миллион входящих токенов и $4,00 за миллион выходящих; при кэш-хитах входящие токены обходятся в $0,19. Для сравнения: GPT-5.5 стоит $5,00 / $30,00, Claude Opus 4.8 — $5,00 / $25,00, а Claude Fable 5 (модель Anthropic, временно приостановленная) — $10,00 / $50,00. По выходным токенам разрыв с Fable 5 достигает 12,5 раза. Это означает, что при одинаковом бюджете K2.7 Code можно вызывать на порядок чаще — что принципиально меняет экономику агентных систем, где модель совершает десятки итераций на одну задачу.

Модель доступна через Kimi API, CLI-инструмент Kimi Code и inference-движки vLLM и SGLang. Веса опубликованы на Hugging Face; доступна нативная квантизация INT4 для запуска на менее мощном оборудовании. Лицензия — модифицированный MIT: свободное использование и распространение разрешены, однако компании с более чем 100 млн ежемесячных активных пользователей или выручкой свыше $20 млн в месяц обязаны явно указывать «Kimi K2.7 Code» в интерфейсе продукта.

Стоит учитывать, что Kimi уже присутствует в коммерческих продуктах: инструмент для программирования Cursor перепродаёт модифицированную версию Kimi. Это говорит о том, что разрыв в бенчмарках с западными лидерами не мешает практическому применению — особенно там, где важна стоимость масштабирования, а не абсолютный потолок качества.

Разобраться глубже

ИИ-агенты для бизнеса: что это и где применять

ИИ-агенты для бизнеса простыми словами: чем агент отличается от чат-бота, из каких четырёх частей собирается, какие бывают уровни автономности, карта из 10 сценариев применения, кейс сервисной компании и расчёт окупаемости агента поддержки.

Внедряю ИИ в бизнес — обсудим задачу

Аудит, пилотные проекты, полное внедрение. Начинаем с консультации.

Перейти к услугам

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ

По теме

Толстый и тонкий харнесс: принципы маршрутизации запросов ИИ-ассистента

Продолжить по разделам

Kimi K2.7 Code: триллион параметров и цена в 12 раз ниже GPT-5.5

Кратко

Читать дальше

ИИ-агенты ускорили научный софт в 60 раз, но не проверяют корректность науки

NFC-ключ за $9: физический блокиратор отвлекающих приложений

Толстый и тонкий харнесс: принципы маршрутизации запросов ИИ-ассистента