Готовый домашний ИИ-сервер можно купить за 1,3 млн руб., но для энтузиастов DIY-сборка обещает не только экономию, но и участие в процессе. Автор Habr предложил конфигурацию в бюджет до 400 тыс. руб., основанную на четырёх видеокартах AMD RX 7900 XTX (по 24 ГБ каждая) и 128 ГБ оперативной памяти (б/у). В качестве процессора используется обычная материнская плата, а для подключения всех GPU требуется сплиттер PCIe x16 на 4 x4 или 2 x8 — при условии поддержки бифуркации в BIOS.

Ключевое ограничение такой сборки: видеокарты работают последовательно, а не параллельно. Для полноценного тензорного параллелизма нужен серверный процессор с 128 линиями PCIe (например, AMD Threadripper) или специальные серверные GPU с мостиками для прямого соединения. В текущей конфигурации нагрузка распределяется между картами, но без одновременного расчёта — это снижает пиковую производительность, но для многих задач по-прежнему пригодно.

Практический тест проводился на Qwen3.6-27b в квантовании Q8 с контекстом 250 тыс. токенов и встроенным MTP (draft-модель внутри основной). Результат — около 30 токенов в секунду, что автор считает достаточным для комфортного использования в качестве чат-бота или агента для «вайб-кодинга». MTP-ускорение даёт прирост примерно в 2 раза.

Из софта рекомендуется Ubuntu 26 server с KDE и llama.cpp (с бэкендами ROCm или Vulkan для AMD). Установка графического интерфейса на серверную версию может потребовать дополнительных усилий. Альтернативы вроде vLLM, по словам автора, работают на потребительских AMD-картах нестабильно, поэтому

Помимо собственно компонентов, стоит учесть механические доработки: некоторые райзеры и корпуса требуют подгонки болгаркой или ножницами по металлу. Автор предупреждает о необходимости «колхоза» для совместимости деталей. Итоговая масса сервера — около 10 кг.