Питание GPU фермы на 120V: гайд для США 2026 | AiManual
AiManual Logo Ai / Manual.
23 Янв 2026 Гайд

120V - не приговор: как собрать ферму для локальных LLM в США без переделки проводки

Практические решения для питания фермы под локальные LLM на американской электросети 120V. Расчеты, схемы подключения, выбор PSU и распределение нагрузки.

Американская дилемма: хотите 4 GPU, а розетка говорит "нет"

Вы посмотрели наш гайд по сборке мощной станции, выбрали железо, но столкнулись с суровой реальностью: американская розетка на 15А и 120V физически не может отдать больше 1800W. А четыре RTX 4090 под нагрузкой съедают уже 1600W. Добавьте процессор, память, диски - и вы уперлись в потолок.

Нет, ваш дом не сгорит. Сработает автоматический выключатель. Но ферма внезапно отключится в середине инференса 70B-параметровой модели. А это бесит.

Математика против физики: почему 120V - это не шутка

Давайте без иллюзий. Стандартная американская розетка NEMA 5-15:

  • 120V переменного тока
  • 15А максимальный ток
  • 1800W теоретический максимум (120 × 15)
  • На практике - 1440W для длительной нагрузки (80% от максимума)

Теперь посмотрим на современные GPU для LLM на начало 2026:

Видеокарта TDP (макс) Пиковая нагрузка Кол-во на одной розетке
NVIDIA RTX 4090 450W до 600W 2, максимум 3 с undervolting
NVIDIA RTX 5080 (ожидается Q1 2026) ~400W ~500W 2-3
AMD Radeon RX 8900 XTX 430W до 550W 2, максимум 3

Самый популярный вариант - бюджетная 4-GPU ферма - на американской сети требует минимум две отдельных линии питания. И это если не считать остальные компоненты.

Три стратегии для выживания на 120V

1 Распределенная нагрузка: когда розеток много, а денег мало

Самый простой способ - не запихивать все в один системный блок. Современные фреймворки для локальных LLM поддерживают распределенные вычисления.

💡
Соберите 2-3 отдельных компьютера с 1-2 GPU в каждом. Подключите к разным розеткам (в идеале - на разных автоматических выключателях). Используйте vLLM или llama.cpp с распределением модели по сети.

Плюсы:

  • Не требует изменений в электропроводке
  • Можно использовать б/у железо, как в нашем гайде по сборке из б/у карт
  • Отказоустойчивость - если один узел отключится, остальные работают

Минусы:

  • Задержки при обмене данными между узлами
  • Сложнее в настройке
  • Больше точек отказа

2 Две линии питания: когда нужна одна ферма

Если вы хотите одну ферму с 4+ GPU, придется тянуть вторую линию. Это не так страшно, как кажется.

Что вам понадобится:

  1. Два блока питания (например, 1200W + 1000W)
  2. Два отдельных кабеля от разных розеток (обязательно на разных автоматических выключателях!)
  3. Add2PSU или аналогичный адаптер для синхронизации запуска БП
  4. Материнская плата с достаточным количеством PCIe слотов

Никогда не подключайте два БП к одной розетке через разветвитель. Это гарантированное срабатывание защиты при пиковой нагрузке.

Как это работает на практике:

# В llama.cpp конфигурация для двух PSU будет выглядеть так:
./main -m mixtral-8x22b.Q4_K_M.gguf \
  -ngl 99 \
  --split-mode layer \
  --tensor-split "0:24,1:24,2:24,3:24" \
  -c 8192

Первый БП питает первую пару GPU, второй - вторую пару. Процессор и материнка запитываются от основного БП.

3 Промышленные решения: когда бюджет не ограничен

Для серьезных проектов с 6-8 GPU есть два варианта:

Вариант A: Серверный блок питания 240V. В каждом американском доме есть 240V для сушилки или плиты. Можно установить розетку NEMA 6-15 или 6-20 и использовать серверный БП на 2400W+.

Вариант B: PDU (Power Distribution Unit) с входом на 240V и выходами на 120V. Подключаете одну линию 240V, а PDU распределяет нагрузку на несколько 120V выходов для отдельных БП.

Выбор блока питания: не все W одинаковы

На 120V эффективность БП падает. Серьезно. Блок питания на 80 Plus Platinum при 230V показывает 94% эффективности, а на 120V - всего 90-92%.

Что искать в 2026 году для фермы под LLM:

Критерий Минимум Рекомендуется Почему
Сертификация 80 Plus Gold Platinum или Titanium На 120V разница в эффективности критична
Мощность 1200W 1600W+ Запас для пиковых нагрузок
Количество 12VHPWR 2 4 Для современных GPU с разъемом 12V-2×6
Одиночная шина 12V Да Обязательно Многожильные БП не подходят для GPU ферм

Личный совет: не экономьте на БП. Плохой блок на 120V сгорит с вероятностью 90%, если нагрузить его на 80%+ мощности на протяжении часов инференса больших моделей.

Кабели и соединения: где рождаются проблемы

Самая частая ошибка - использование переходников и разветвителей. На 120V при высоком токе (15А+) это пожароопасно.

Что должно быть в вашем чек-листе:

  • Кабель 14 AWG для подключения БП к розетке (не 16 AWG!)
  • Розетка с заземлением (NEMA 5-15R), не старше 10 лет
  • Отдельные кабели PCIe для каждого 8-пинового разъема GPU
  • Никаких переходников Molex-to-PCIe или SATA-to-PCIe
  • Для 12VHPWR - только родные кабели или сертифицированные замены
💡
Используйте ваттметр типа Kill-A-Watt для мониторинга реального потребления. Цифры в спецификациях GPU - это TDP, а реальная нагрузка при инференсе LLM может быть на 20-30% выше в пиках.

Оптимизация потребления: когда каждый ватт на счету

На 120V ограничение по току заставляет оптимизировать все. Вот что реально работает в 2026:

Undervolting GPU: Современные карты NVIDIA и AMD позволяют снизить напряжение на 50-100mV без потери производительности в LLM задачах. Экономия - до 20% мощности.

# Пример для NVIDIA через nvidia-smi (требует перезагрузки драйверов)
sudo nvidia-smi -pl 350  # Ограничение мощности до 350W для RTX 4090

Выбор эффективных моделей LLM: Некоторые архитектуры 2025-2026 годов (особенно с поддержкой Tool Calling) оптимизированы под инференс и требуют меньше вычислений.

Квантование на лету: Современные фреймворки типа llama.cpp 2026 версии позволяют загружать модель в 8-битном формате, а вычислять в 4-битном, экономя память и снижая нагрузку.

Реальная сборка: 4x RTX 4090 на американской сети

Давайте посчитаем на примере самой популярной конфигурации:

  1. 4 × RTX 4090: 4 × 450W = 1800W (пиковые значения до 2400W!)
  2. Процессор AMD Threadripper: 280W
  3. Материнская плата, память, диски: 150W
  4. Итого: 2230W минимум, 2830W в пике

Это явно не влезает в 1800W от одной розетки. Решение:

  • Используйте два БП: 1600W + 1200W
  • Подключите каждый к отдельной розетке на разных автоматических выключателях
  • Распределите GPU: 2 карты на первый БП, 2 карты + процессор на второй
  • Установите ограничение мощности на GPU до 380W
  • Используйте эффективный софт для локального запуска

Не пытайтесь использовать один БП на 2000W+ на 120V. Даже если найдете такой, он будет потреблять 18-20А, что гарантированно выбьет автомат на 15А. Физику не обманешь.

Когда стоит вызывать электрика

Если вам нужно больше 2-3 GPU, лучше не экспериментировать. Вызовите электрика для:

  • Установки отдельной линии 20А (2400W доступно вместо 1800W)
  • Подключения розетки 240V (удваивает доступную мощность при том же токе)
  • Проверки состояния проводки в старых домах (проводка 1960-х не рассчитана на современные нагрузки)

Стоимость работ: $200-500 в зависимости от региона. Дешевле, чем сгоревшая ферма за $10,000+.

Мониторинг и безопасность

Ферма на пределе возможностей сети требует мониторинга. Что должно быть обязательно:

  1. Умные розетки с мониторингом потребления (например, TP-Link Kasa)
  2. Температурные датчики в районе розеток и БП
  3. Автоматическое отключение при превышении порога (через Home Assistant или аналоги)
  4. Регулярная проверка соединений на нагрев (раз в месяц)

Настройка простого мониторинга:

#!/bin/bash
# Мониторинг температуры и отключение при перегреве
GPU_TEMP=$(nvidia-smi --query-gpu=temperature.gpu --format=csv,noheader)
if [ "$GPU_TEMP" -gt 85 ]; then
  echo "GPU перегревается, отключаю..."
  shutdown -h now
fi

Будущее: что нас ждет в 2026-2027

Производители уже реагируют на проблему 120V:

  • NVIDIA анонсировала RTX 50 серию с улучшенной энергоэффективностью (больше FLOPS на ватт)
  • Появляются специализированные БП для майнинга и AI на 120V с PFC коррекцией
  • Новые стандарты квантования LLM снижают требования к памяти и вычислениям
  • Фреймворки типа llama.cpp оптимизируются под ограниченные системы

Мой прогноз: к концу 2026 мы увидим готовые решения "ферма в коробке" с оптимизированным питанием для американского рынка. Пока же приходится собирать самим.

Последний совет: начните с малого. Соберите систему на 2 GPU, протестируйте с разными промптами для тестирования LLM, поймите реальное потребление. И только потом масштабируйтесь. Электричество в США дешевле, чем в Европе, но законы физики одинаковы везде.