Американская дилемма: хотите 4 GPU, а розетка говорит "нет"

Вы посмотрели наш гайд по сборке мощной станции, выбрали железо, но столкнулись с суровой реальностью: американская розетка на 15А и 120V физически не может отдать больше 1800W. А четыре RTX 4090 под нагрузкой съедают уже 1600W. Добавьте процессор, память, диски - и вы уперлись в потолок.

Нет, ваш дом не сгорит. Сработает автоматический выключатель. Но ферма внезапно отключится в середине инференса 70B-параметровой модели. А это бесит.

Математика против физики: почему 120V - это не шутка

Давайте без иллюзий. Стандартная американская розетка NEMA 5-15:

120V переменного тока
15А максимальный ток
1800W теоретический максимум (120 × 15)
На практике - 1440W для длительной нагрузки (80% от максимума)

Теперь посмотрим на современные GPU для LLM на начало 2026:

Видеокарта	TDP (макс)	Пиковая нагрузка	Кол-во на одной розетке
NVIDIA RTX 4090	450W	до 600W	2, максимум 3 с undervolting
NVIDIA RTX 5080 (ожидается Q1 2026)	~400W	~500W	2-3
AMD Radeon RX 8900 XTX	430W	до 550W	2, максимум 3

Самый популярный вариант - бюджетная 4-GPU ферма - на американской сети требует минимум две отдельных линии питания. И это если не считать остальные компоненты.

Три стратегии для выживания на 120V

1 Распределенная нагрузка: когда розеток много, а денег мало

Самый простой способ - не запихивать все в один системный блок. Современные фреймворки для локальных LLM поддерживают распределенные вычисления.

💡

Соберите 2-3 отдельных компьютера с 1-2 GPU в каждом. Подключите к разным розеткам (в идеале - на разных автоматических выключателях). Используйте vLLM или llama.cpp с распределением модели по сети.

Плюсы:

Не требует изменений в электропроводке
Можно использовать б/у железо, как в нашем гайде по сборке из б/у карт
Отказоустойчивость - если один узел отключится, остальные работают

Минусы:

Задержки при обмене данными между узлами
Сложнее в настройке
Больше точек отказа

2 Две линии питания: когда нужна одна ферма

Если вы хотите одну ферму с 4+ GPU, придется тянуть вторую линию. Это не так страшно, как кажется.

Что вам понадобится:

Два блока питания (например, 1200W + 1000W)
Два отдельных кабеля от разных розеток (обязательно на разных автоматических выключателях!)
Add2PSU или аналогичный адаптер для синхронизации запуска БП
Материнская плата с достаточным количеством PCIe слотов

Никогда не подключайте два БП к одной розетке через разветвитель. Это гарантированное срабатывание защиты при пиковой нагрузке.

Как это работает на практике:

# В llama.cpp конфигурация для двух PSU будет выглядеть так:
./main -m mixtral-8x22b.Q4_K_M.gguf \
  -ngl 99 \
  --split-mode layer \
  --tensor-split "0:24,1:24,2:24,3:24" \
  -c 8192

Первый БП питает первую пару GPU, второй - вторую пару. Процессор и материнка запитываются от основного БП.

3 Промышленные решения: когда бюджет не ограничен

Для серьезных проектов с 6-8 GPU есть два варианта:

Вариант A: Серверный блок питания 240V. В каждом американском доме есть 240V для сушилки или плиты. Можно установить розетку NEMA 6-15 или 6-20 и использовать серверный БП на 2400W+.

Вариант B: PDU (Power Distribution Unit) с входом на 240V и выходами на 120V. Подключаете одну линию 240V, а PDU распределяет нагрузку на несколько 120V выходов для отдельных БП.

Выбор блока питания: не все W одинаковы

На 120V эффективность БП падает. Серьезно. Блок питания на 80 Plus Platinum при 230V показывает 94% эффективности, а на 120V - всего 90-92%.

Что искать в 2026 году для фермы под LLM:

Критерий	Минимум	Рекомендуется	Почему
Сертификация 80 Plus	Gold	Platinum или Titanium	На 120V разница в эффективности критична
Мощность	1200W	1600W+	Запас для пиковых нагрузок
Количество 12VHPWR	2	4	Для современных GPU с разъемом 12V-2×6
Одиночная шина 12V	Да	Обязательно	Многожильные БП не подходят для GPU ферм

Личный совет: не экономьте на БП. Плохой блок на 120V сгорит с вероятностью 90%, если нагрузить его на 80%+ мощности на протяжении часов инференса больших моделей.

Кабели и соединения: где рождаются проблемы

Самая частая ошибка - использование переходников и разветвителей. На 120V при высоком токе (15А+) это пожароопасно.

Что должно быть в вашем чек-листе:

Кабель 14 AWG для подключения БП к розетке (не 16 AWG!)
Розетка с заземлением (NEMA 5-15R), не старше 10 лет
Отдельные кабели PCIe для каждого 8-пинового разъема GPU
Никаких переходников Molex-to-PCIe или SATA-to-PCIe
Для 12VHPWR - только родные кабели или сертифицированные замены

💡

Используйте ваттметр типа Kill-A-Watt для мониторинга реального потребления. Цифры в спецификациях GPU - это TDP, а реальная нагрузка при инференсе LLM может быть на 20-30% выше в пиках.

Оптимизация потребления: когда каждый ватт на счету

На 120V ограничение по току заставляет оптимизировать все. Вот что реально работает в 2026:

Undervolting GPU: Современные карты NVIDIA и AMD позволяют снизить напряжение на 50-100mV без потери производительности в LLM задачах. Экономия - до 20% мощности.

# Пример для NVIDIA через nvidia-smi (требует перезагрузки драйверов)
sudo nvidia-smi -pl 350  # Ограничение мощности до 350W для RTX 4090

Выбор эффективных моделей LLM: Некоторые архитектуры 2025-2026 годов (особенно с поддержкой Tool Calling) оптимизированы под инференс и требуют меньше вычислений.

Квантование на лету: Современные фреймворки типа llama.cpp 2026 версии позволяют загружать модель в 8-битном формате, а вычислять в 4-битном, экономя память и снижая нагрузку.

Реальная сборка: 4x RTX 4090 на американской сети

Давайте посчитаем на примере самой популярной конфигурации:

4 × RTX 4090: 4 × 450W = 1800W (пиковые значения до 2400W!)
Процессор AMD Threadripper: 280W
Материнская плата, память, диски: 150W
Итого: 2230W минимум, 2830W в пике

Это явно не влезает в 1800W от одной розетки. Решение:

Используйте два БП: 1600W + 1200W
Подключите каждый к отдельной розетке на разных автоматических выключателях
Распределите GPU: 2 карты на первый БП, 2 карты + процессор на второй
Установите ограничение мощности на GPU до 380W
Используйте эффективный софт для локального запуска

Не пытайтесь использовать один БП на 2000W+ на 120V. Даже если найдете такой, он будет потреблять 18-20А, что гарантированно выбьет автомат на 15А. Физику не обманешь.

Когда стоит вызывать электрика

Если вам нужно больше 2-3 GPU, лучше не экспериментировать. Вызовите электрика для:

Установки отдельной линии 20А (2400W доступно вместо 1800W)
Подключения розетки 240V (удваивает доступную мощность при том же токе)
Проверки состояния проводки в старых домах (проводка 1960-х не рассчитана на современные нагрузки)

Стоимость работ: $200-500 в зависимости от региона. Дешевле, чем сгоревшая ферма за $10,000+.

Мониторинг и безопасность

Ферма на пределе возможностей сети требует мониторинга. Что должно быть обязательно:

Умные розетки с мониторингом потребления (например, TP-Link Kasa)
Температурные датчики в районе розеток и БП
Автоматическое отключение при превышении порога (через Home Assistant или аналоги)
Регулярная проверка соединений на нагрев (раз в месяц)

Настройка простого мониторинга:

#!/bin/bash
# Мониторинг температуры и отключение при перегреве
GPU_TEMP=$(nvidia-smi --query-gpu=temperature.gpu --format=csv,noheader)
if [ "$GPU_TEMP" -gt 85 ]; then
  echo "GPU перегревается, отключаю..."
  shutdown -h now
fi

Будущее: что нас ждет в 2026-2027

Производители уже реагируют на проблему 120V:

NVIDIA анонсировала RTX 50 серию с улучшенной энергоэффективностью (больше FLOPS на ватт)
Появляются специализированные БП для майнинга и AI на 120V с PFC коррекцией
Новые стандарты квантования LLM снижают требования к памяти и вычислениям
Фреймворки типа llama.cpp оптимизируются под ограниченные системы

Мой прогноз: к концу 2026 мы увидим готовые решения "ферма в коробке" с оптимизированным питанием для американского рынка. Пока же приходится собирать самим.

Последний совет: начните с малого. Соберите систему на 2 GPU, протестируйте с разными промптами для тестирования LLM, поймите реальное потребление. И только потом масштабируйтесь. Электричество в США дешевле, чем в Европе, но законы физики одинаковы везде.

120V - не приговор: как собрать ферму для локальных LLM в США без переделки проводки