Китайская компания Meituan завершила обучение языковой модели LongCat-2.0, содержащей 1,6 трлн параметров. В отличие от большинства крупных ИИ-моделей, обучение проводилось исключительно на отечественных чипах — кластере из более чем 50 000 ASIC-ускорителей китайского производства. Это первый случай, когда модель такого масштаба создана без использования графических процессоров Nvidia, на которые с 2022 года действуют экспортные ограничения США.

Проект LongCat существует с 2023 года, первая версия была выпущена в конце прошлого года. По данным Meituan, LongCat-2.0 обучалась на 35 трлн токенов. Компания утверждает, что модель демонстрирует «способность обучать крупномасштабные модели на отечественных вычислительных кластерах». На ряде бенчмарков LongCat-2.0 показывает конкурентоспособные результаты. На SWE-bench Pro (59,5 балла) и SWE-bench Multilingual (77,3) она превосходит Gemini 3.1 Pro и GPT-5.5, однако уступает Claude Opus 4.7 и 4.8. На других тестах, таких как IFEval (90,0), IMO-AnswerBench (81,8) и GPQA-diamond (88,9), модель отстаёт от Gemini и GPT-5.5 с заметным разрывом.

БенчмаркРезультат LongCat-2.0
SWE-bench Pro59,5
SWE-bench Multilingual77,3
IFEval90,0
IMO-AnswerBench81,8
GPQA-diamond88,9

Несмотря на достигнутые результаты, к анонсам Meituan стоит относиться с осторожностью. LongCat-2.0 пока не опубликована на HuggingFace, а компания не раскрыла производителя используемых чипов — это затрудняет независимую проверку заявленных показателей. Тем не менее, сам факт появления модели такого масштаба, обученной без Nvidia, сигнализирует о прогрессе Китая в области создания собственной ИИ-инфраструктуры в условиях технологических ограничений.

Модель прошла обучение на 35 трлн токенов, что сопоставимо с западными аналогами.

Bild: Longcat
Bild: Longcat · Источник: The Decoder

Для китайской индустрии ИИ LongCat-2.0 — важная демонстрация возможностей. Ранее считалось, что для обучения моделей с триллионом параметров необходимы кластеры Nvidia H100 или их аналоги. Использование альтернативных ASIC-чипов с меньшей производительностью, но большим количеством, показывает, что Китай способен компенсировать отсутствие доступа к передовым графическим процессорам за счёт масштабирования. Однако открытым остаётся вопрос энергоэффективности и стоимости такого подхода. Meituan, известная прежде всего как сервис доставки и заказа услуг, неожиданно для многих вошла в число лидеров ИИ-разработок в Китае. Посыл властям США очевиден: экспортные ограничения не остановили развитие китайского ИИ, а лишь подстегнули поиск альтернатив.