DeepSeek-V4 на 1,6 трлн параметров запустили на бытовом железе через SVD-декомпозицию

Habr AI·27 апр.·1 минРоссияКод

Команда разработчиков показала запуск DeepSeek-V4 с 1,6 трлн параметров на потребительском оборудовании, применив SVD-декомпозицию весов — метод позволяет значительно снизить объём памяти за счёт потери части точности.

Кратко

—DeepSeek-V4 (1,6T параметров) запустили на потребительском оборудовании
—Метод: SVD-декомпозиция весов матриц, снижающая требования к памяти в несколько раз
—SVD вносит контролируемую погрешность в веса, что даёт проигрыш по качеству
—Эксперимент показывает технический предел и одновременно — направление для квантизации
—Авторы опубликовали код и инструкции воспроизведения

Глоссарий · 2 термина▾

SVD (сингулярное разложение): Метод разложения матрицы на три составляющие; используется для аппроксимации матриц меньшего ранга с потерей части информации
квантизация: Снижение числовой точности весов модели для уменьшения требований к памяти и ускорения вычислений

Автор Habr-публикации описывает технический эксперимент по запуску DeepSeek-V4 — модели с 1,6 трлн параметров — на оборудовании, которое в норме не справилось бы с такой нагрузкой. Ключевой инструмент — сингулярное разложение (SVD) весовых матриц модели, позволяющее приблизительно представить каждую матрицу произведением матриц меньшего ранга.

Суть метода: SVD раскладывает матрицу весов A на три компоненты (U, Σ, V^T), после чего авторы оставляют только k наибольших сингулярных значений и отбрасывают остальные. Это снижает объём хранимых данных и вычислительную нагрузку пропорционально k, но вносит контролируемую ошибку аппроксимации. Чем агрессивнее усечение — тем меньше памяти требуется и тем ниже качество вывода.

Авторы протестировали несколько степеней компрессии и замерили итоговое качество на стандартных бенчмарках. При умеренной компрессии модель сохраняла большую часть полезных свойств при сокращении памяти в 2–4 раза. При агрессивном усечении качество деградировало значительно.

Метод: SVD-декомпозиция весов матриц, снижающая требования к памяти в несколько раз

Эксперимент интересен не как производственное решение (SVD-компрессия уступает специализированным методам квантизации вроде GPTQ или AWQ), а как демонстрация принципа: линейная алгебра позволяет «сжать» модель прямо на лету без дообучения. Это может быть полезно для исследований и быстрых прототипов.

Код и инструкции воспроизведения опубликованы в открытом доступе.

Получать анонсы в Telegram

Ежедневный дайджест лучших материалов об ИИ

DeepSeek-V4 на 1,6 трлн параметров запустили на бытовом железе через SVD-декомпозицию

Кратко

Читать также

Как ИИ берёт на себя тестирование сотрудников: кейс и готовый промпт

«Архитех ИИ» выпустила российский аналог OpenRouter с защитой персональных данных

Брокман раскрыл долю в OpenAI на $30 млрд — в ходе суда по иску Маска