Inference-сервер на Threadripper: TRX40 vs TRX50, GPU и бюджет на 2026 год | AiManual
AiManual Logo Ai / Manual.
11 Фев 2026 Гайд

Как собрать inference-сервер на Threadripper для 24/7 работы с большими моделями: сравнение TRX40 vs TRX50, GPU и бюджета

Практический гайд по сборке сервера для 24/7 инференса больших моделей на Threadripper. Сравнение TRX40 и TRX50, выбор GPU (RTX 6000 Pro, A40, L40S), бюджет от

Зачем Threadripper для инференса? Потому что PCIe lanes — это валюта

В 2026 году все еще думают, что для запуска больших моделей нужны серверные процессоры за $5000. Это миф. Threadripper Pro — это золотая середина между бытовыми Ryzen и монструозными EPYC. Но даже среди Threadripper есть два лагеря: старый добрый TRX40 и новый TRX50. И выбор между ними определяет, сколько денег вы оставите в магазине и сколько нервов — в процессе сборки.

Важное уточнение: когда я говорю "большие модели", я имею в виду Qwen2.5-72B, Llama 3.3-405B, DeepSeek-V4 и им подобных монстров. Для 7B-13B моделей хватит и Ryzen 9. Но если вы планируете держать модель в памяти неделями и обслуживать запросы 24/7 — читайте дальше.

TRX40 против TRX50: битва платформ, где побеждает кошелек

Давайте сразу к цифрам, потому что маркетинговые слоганы нам не нужны.

Параметр TRX40 (2019-2022) TRX50 (2023-2026)
Процессоры Threadripper 3000/5000 серии Threadripper 7000/8000 серии
PCIe lanes (CPU) 64 линии PCIe 4.0 48 линий PCIe 5.0 + 16 линий PCIe 4.0
Макс. память 256 ГБ DDR4 1 ТБ DDR5
Стоимость платы $300-600 (б/у) $700-1200 (новая)
Процессор (пример) Threadripper 3960X: $800 б/у Threadripper 7960X: $1800 новая

Вот что эти цифры значат на практике. На TRX40 вы можете поставить 4 видеокарты по x16 PCIe 4.0. На TRX50 — тоже 4 карты, но уже по x16 PCIe 5.0. Звучит круто? Теперь плохие новости.

PCIe 5.0 для инференса — это overkill. Большинство моделей загружаются в VRAM один раз и живут там неделями. Пропускная способность между CPU и GPU важна только при загрузке модели. PCIe 4.0 x16 дает 32 ГБ/с, PCIe 5.0 x16 — 64 ГБ/с. Загрузка Llama 3.3-405B (80 ГБ) займет 2.5 секунды вместо 5. Стоит ли переплачивать $1000 за экономию 2.5 секунды раз в неделю? Решайте сами.

1 Выбор платформы: когда TRX40 выигрывает без вариантов

Бюджет до $5000. Вы хотите максимум VRAM за минимальные деньги. Вам не нужны последние 5% производительности. Вы готовы копаться с б/у железом.

Собирайте на TRX40. Возьмите б/у Threadripper 3960X (24 ядра, $800), материнскую плату ASUS ROG Zenith II Extreme ($400 б/у), 128 ГБ DDR4-3200 ($250). Общая стоимость платформы: $1450. На сэкономленные деньги купите дополнительную видеокарту.

2 Когда TRX50 оправдан

Бюджет от $8000. Вы планируете апгрейд до Threadripper 8000 серии (когда она выйдет). Вам нужна DDR5 для больших датасетов в RAM. Вы работаете с моделями, которые постоянно подгружают веса из системной памяти (очень редкий сценарий).

ASUS Pro WS TRX50-SAGE WIFI ($900) + Threadripper 7960X ($1800) + 256 ГБ DDR5-5600 ($800). Платформа: $3500. В два с половиной раза дороже за DDR5 и PCIe 5.0.

Видеокарты: RTX 6000 Pro, A40, L40S или б/у 3090?

Здесь математика простая: вам нужна VRAM. Много VRAM. Производительность в TFLOPS вторична.

Карта VRAM Цена (2026) TDP Для кого
RTX 3090 (б/у) 24 ГБ $800-1000 350 Вт Бюджетные сборки
RTX 4090 (б/у) 24 ГБ $1400-1600 450 Вт Не рекомендую
RTX 6000 Pro 48 ГБ $4500-5000 300 Вт Профессиональные сборки
A40 48 ГБ $4000-4500 300 Вт Серверные стойки
L40S 48 ГБ $5500-6000 350 Вт Только если деньги не проблема

RTX 3090 б/у — король бюджетных сборок. Две карты дают 48 ГБ за $2000. Четыре — 96 ГБ за $4000. Да, они греются. Да, им нужна хорошая вентиляция. Но они работают. Я собрал ферму на 8x RTX 3090 и она работает месяцами без перебоев.

💡
A40 и RTX 6000 Pro — по сути одна и та же карта в разных корпусах. A40 — для серверных стоек (пассивное охлаждение), RTX 6000 Pro — для рабочих станций (активное охлаждение). Для Threadripper-сборки берите RTX 6000 Pro, если не планируете ставить серверные вентиляторы.

Сборка по бюджетам: от $3000 до бесконечности

3 Бюджетный вариант: $3000-4000

  • Threadripper 3960X (б/у): $800
  • Материнская плата TRX40 (б/у): $400
  • 128 ГБ DDR4-3200: $250
  • 2x RTX 3090 (б/у): $1800
  • Блок питания 1200 Вт: $200
  • Корпус с хорошей вентиляцией: $150
  • Накопитель 2 ТБ NVMe: $150

Итого: $3750 за 48 ГБ VRAM. Хватит для Qwen2.5-72B в 4-битном квантовании или двух 30B-моделей одновременно.

4 Оптимальный вариант: $7000-9000

  • Threadripper 7960X: $1800
  • Материнская плата TRX50: $900
  • 256 ГБ DDR5-5600: $800
  • RTX 6000 Pro: $4500
  • Блок питания 1000 Вт: $250
  • Корпус Fractal Design Meshify 2 XL: $300
  • Накопитель 4 ТБ NVMe: $350

Итого: $8900 за 48 ГБ VRAM профессионального уровня. Плюс возможность добавить вторую карту позже.

5 Максимальный вариант: $15000+

  • Threadripper 7980X: $2500
  • ASUS Pro WS TRX50-SAGE WIFI: $900
  • 512 ГБ DDR5-6000: $1600
  • 2x RTX 6000 Pro: $9000
  • Блок питания 1600 Вт Titanium: $500
  • Корпус с поддержкой водяного охлаждения: $500
  • Накопители 8 ТБ NVMe в RAID: $1200

Итого: $16200 за 96 ГБ VRAM. Для Llama 3.3-405B в полной точности или одновременной работы десятков меньших моделей.

Где покупать в 2026 году: eBay уже не король

Рынок б/у железа изменился. Вот актуальные источники на февраль 2026:

  1. Micro Center — появились в Европе, цены на 10-15% ниже, чем у конкурентов. Часто проводят акции на Threadripper.
  2. Amazon Renewed — профессиональные карты с гарантией. RTX 6000 Pro за $4200 вместо $5000.
  3. Специализированные магазины AI-железа — например, Lambda Labs или Colfax. Дороже, но с поддержкой и тестированием.
  4. Локальные форумы — майнеры окончательно распродают остатки. 3090 по $700 — реальность.

Никогда не покупайте профессиональные карты (RTX 6000, A40) с рук без тестирования. Их часто используют для рендеринга 24/7, и ресурс VRAM может быть исчерпан. Просите скриншоты GPU-Z с временем работы и температурой памяти.

Охлаждение: тихая смерть для инференс-сервера

Threadripper + 2-4 видеокарты = 800-1500 Вт тепла. В маленьком офисе это превратится в сауну. Решения:

  • Корпус Fractal Design Meshify 2 XL — лучшая вентиляция на рынке. $300, но стоит каждой копейки.
  • Noctua NH-U14S TR4-SP3 — кулер для Threadripper, который реально работает. Не берите водяное охлаждение для 24/7 работы — помпы ломаются.
  • Дополнительные вентиляторы 140 мм — минимум 4 штуки: 2 на вдув спереди, 1 на выдув сверху, 1 на выдув сзади.
  • Управление оборотами через BIOS — выставьте кривую, чтобы вентиляторы не выли на 100% при 60°C.

Если планируете гибридную сборку (NVIDIA + AMD), прочитайте мой гайд про оптимизацию AI-станции на Threadripper. Там все тонкости драйверов и охлаждения.

Софт: что ставить в 2026 году

Список проверенного ПО для инференса:

  1. Ubuntu 24.04 LTS — стабильность важнее новых фич. 22.04 уже устарела для новых драйверов.
  2. Docker + NVIDIA Container Toolkit — изолируйте каждую модель в контейнер. Так проще управлять версиями.
  3. vLLM — лучший inference engine на февраль 2026. Поддерживает continuous batching, PagedAttention, tensor parallelism.
  4. Ollama — для быстрого тестирования моделей. Не для продакшена, но для проверки идеально.
  5. Prometheus + Grafana — мониторинг температуры, загрузки GPU, памяти. Обязательно для 24/7 работы.
# Базовая установка на Ubuntu 24.04
sudo apt update
sudo apt install -y docker.io nvidia-driver-580
sudo systemctl enable docker

# vLLM через Docker
docker run --gpus all \
  -p 8000:8000 \
  -v ~/models:/models \
  vllm/vllm-openai:latest \
  --model /models/qwen2.5-72b \
  --tensor-parallel-size 2  # Для 2 GPU

Ошибки, которые убьют ваш сервер

  • Экономия на блоке питания — берите на 30% больше, чем расчетная мощность. 1200 Вт для системы на 900 Вт.
  • Плохая вентиляция в корпусе — карты будут троттлить уже через час работы.
  • Неправильные PCIe слоты — на многих платах только первые два слота работают на x16. Проверяйте мануал.
  • Отсутствие мониторинга — однажды проснетесь от запаха гари. Графана — ваш друг.
  • Обновление драйверов "потому что вышла новая версия" — если работает, не трогайте.

А что насчет альтернатив?

Threadripper не единственный вариант. Если нужен максимальный бюджетный VRAM, посмотрите на Radeon R9700 — 128 ГБ за разумные деньги. Или соберите систему на нескольких старых серверных картах.

Но если нужен баланс между PCIe lanes, поддержкой и ценой — Threadripper пока вне конкуренции. В 2026 году AMD анонсировала Threadripper 8000 серию с поддержкой PCIe 6.0, но цены будут космическими. TRX40/TRX50 — золотая середина.

💡
Самый неочевидный совет: не гонитесь за максимальным количеством ядер. Для инференса важна не многопоточность, а PCIe lanes и кэш. Threadripper 3960X (24 ядра) часто работает лучше, чем 5970X (32 ядра) из-за лучшего теплопакета и более высокой частоты.

Собирайте под задачу. Не под будущий апгрейд. Не под гипотетические потребности. Возьмите модель, которую будете запускать (Qwen2.5-72B требует ~45 ГБ в 4-битном), умножьте на 1.5 (для буфера и одновременных запросов) — и получите необходимый объем VRAM. Все остальное — оптимизация.

P.S. Если через полгода после сборки захотите добавить пятую видеокарту — не получится. Threadripper дает максимум 64-80 линий PCIe. Четыре карты по x16 — это предел. Планируйте сразу.