Ровно год назад DeepSeek опубликовала модель R1 и спровоцировала панику на американских биржах: акции Nvidia за один день потеряли около 17% капитализации, инвесторы усомнились в том, что гонка за дорогостоящими GPU оправдана. Теперь компания выпустила превью следующего поколения — V4, снова позиционируя его как open-source систему, способную тягаться с закрытыми флагманами из США.

V4 — это большая языковая модель, которую DeepSeek распространяет в открытом доступе: исходный код и веса модели доступны для скачивания и самостоятельного развёртывания. Это принципиально отличает её от GPT-4o, Claude 3.5 Sonnet и Gemini 2.5 Pro, которые доступны только через API или интерфейсы компаний-разработчиков. Открытость снижает порог входа для бизнеса и исследователей, но одновременно означает, что модель может использоваться без каких-либо ограничений со стороны создателя.

Ключевое улучшение в V4, по словам DeepSeek, — возможности в области кодирования. Этот навык стал одним из главных критериев оценки современных LLM: именно на нём строятся ИИ-агенты, способные самостоятельно писать, тестировать и отлаживать программный код. Конкуренты активно развивают это направление — ChatGPT Codex от OpenAI и Claude Code от Anthropic уже используются в корпоративной разработке.

Главное улучшение по сравнению с предыдущими версиями — возможности в области кодирования.

Robert Hart
Robert Hart · Источник: The Verge AI

Отдельного внимания заслуживает упоминание чипов Huawei. DeepSeek прямо указала на совместимость V4 с оборудованием китайского производителя — это первый подобный сигнал от компании. На фоне американских санкций, ограничивающих экспорт передовых GPU Nvidia в Китай, такая совместимость приобретает стратегическое значение: она демонстрирует, что китайская полупроводниковая промышленность способна обеспечить обучение конкурентоспособных моделей.

При этом DeepSeek не раскрыла ни стоимость обучения V4, ни полный список использованного оборудования. Год назад именно заявленная дешевизна R1 стала главным информационным поводом. Сейчас компания молчит — возможно, намеренно, учитывая давление со стороны американских регуляторов. Министерство торговли США обвиняет DeepSeek в обходе экспортных ограничений через использование запрещённых чипов Nvidia. Anthropic, в свою очередь, утверждает, что DeepSeek получила доступ к Claude и использовала его для улучшения собственных продуктов — практика, известная как дистилляция знаний.

V4 выходит в момент, когда конкуренция между открытыми и закрытыми моделями обострилась. Meta активно развивает Llama 3.1, Mistral публикует собственные open-source решения, а крупные технологические компании всё активнее встраивают открытые модели в корпоративные продукты. DeepSeek в этом контексте — не просто китайский игрок, а один из немногих, кто системно бросает вызов американским лидерам по соотношению возможностей и доступности.