Американская дилемма: хотите 4 GPU, а розетка говорит "нет"
Вы посмотрели наш гайд по сборке мощной станции, выбрали железо, но столкнулись с суровой реальностью: американская розетка на 15А и 120V физически не может отдать больше 1800W. А четыре RTX 4090 под нагрузкой съедают уже 1600W. Добавьте процессор, память, диски - и вы уперлись в потолок.
Нет, ваш дом не сгорит. Сработает автоматический выключатель. Но ферма внезапно отключится в середине инференса 70B-параметровой модели. А это бесит.
Математика против физики: почему 120V - это не шутка
Давайте без иллюзий. Стандартная американская розетка NEMA 5-15:
- 120V переменного тока
- 15А максимальный ток
- 1800W теоретический максимум (120 × 15)
- На практике - 1440W для длительной нагрузки (80% от максимума)
Теперь посмотрим на современные GPU для LLM на начало 2026:
| Видеокарта | TDP (макс) | Пиковая нагрузка | Кол-во на одной розетке |
|---|---|---|---|
| NVIDIA RTX 4090 | 450W | до 600W | 2, максимум 3 с undervolting |
| NVIDIA RTX 5080 (ожидается Q1 2026) | ~400W | ~500W | 2-3 |
| AMD Radeon RX 8900 XTX | 430W | до 550W | 2, максимум 3 |
Самый популярный вариант - бюджетная 4-GPU ферма - на американской сети требует минимум две отдельных линии питания. И это если не считать остальные компоненты.
Три стратегии для выживания на 120V
1 Распределенная нагрузка: когда розеток много, а денег мало
Самый простой способ - не запихивать все в один системный блок. Современные фреймворки для локальных LLM поддерживают распределенные вычисления.
Плюсы:
- Не требует изменений в электропроводке
- Можно использовать б/у железо, как в нашем гайде по сборке из б/у карт
- Отказоустойчивость - если один узел отключится, остальные работают
Минусы:
- Задержки при обмене данными между узлами
- Сложнее в настройке
- Больше точек отказа
2 Две линии питания: когда нужна одна ферма
Если вы хотите одну ферму с 4+ GPU, придется тянуть вторую линию. Это не так страшно, как кажется.
Что вам понадобится:
- Два блока питания (например, 1200W + 1000W)
- Два отдельных кабеля от разных розеток (обязательно на разных автоматических выключателях!)
- Add2PSU или аналогичный адаптер для синхронизации запуска БП
- Материнская плата с достаточным количеством PCIe слотов
Никогда не подключайте два БП к одной розетке через разветвитель. Это гарантированное срабатывание защиты при пиковой нагрузке.
Как это работает на практике:
# В llama.cpp конфигурация для двух PSU будет выглядеть так:
./main -m mixtral-8x22b.Q4_K_M.gguf \
-ngl 99 \
--split-mode layer \
--tensor-split "0:24,1:24,2:24,3:24" \
-c 8192
Первый БП питает первую пару GPU, второй - вторую пару. Процессор и материнка запитываются от основного БП.
3 Промышленные решения: когда бюджет не ограничен
Для серьезных проектов с 6-8 GPU есть два варианта:
Вариант A: Серверный блок питания 240V. В каждом американском доме есть 240V для сушилки или плиты. Можно установить розетку NEMA 6-15 или 6-20 и использовать серверный БП на 2400W+.
Вариант B: PDU (Power Distribution Unit) с входом на 240V и выходами на 120V. Подключаете одну линию 240V, а PDU распределяет нагрузку на несколько 120V выходов для отдельных БП.
Выбор блока питания: не все W одинаковы
На 120V эффективность БП падает. Серьезно. Блок питания на 80 Plus Platinum при 230V показывает 94% эффективности, а на 120V - всего 90-92%.
Что искать в 2026 году для фермы под LLM:
| Критерий | Минимум | Рекомендуется | Почему |
|---|---|---|---|
| Сертификация 80 Plus | Gold | Platinum или Titanium | На 120V разница в эффективности критична |
| Мощность | 1200W | 1600W+ | Запас для пиковых нагрузок |
| Количество 12VHPWR | 2 | 4 | Для современных GPU с разъемом 12V-2×6 |
| Одиночная шина 12V | Да | Обязательно | Многожильные БП не подходят для GPU ферм |
Личный совет: не экономьте на БП. Плохой блок на 120V сгорит с вероятностью 90%, если нагрузить его на 80%+ мощности на протяжении часов инференса больших моделей.
Кабели и соединения: где рождаются проблемы
Самая частая ошибка - использование переходников и разветвителей. На 120V при высоком токе (15А+) это пожароопасно.
Что должно быть в вашем чек-листе:
- Кабель 14 AWG для подключения БП к розетке (не 16 AWG!)
- Розетка с заземлением (NEMA 5-15R), не старше 10 лет
- Отдельные кабели PCIe для каждого 8-пинового разъема GPU
- Никаких переходников Molex-to-PCIe или SATA-to-PCIe
- Для 12VHPWR - только родные кабели или сертифицированные замены
Оптимизация потребления: когда каждый ватт на счету
На 120V ограничение по току заставляет оптимизировать все. Вот что реально работает в 2026:
Undervolting GPU: Современные карты NVIDIA и AMD позволяют снизить напряжение на 50-100mV без потери производительности в LLM задачах. Экономия - до 20% мощности.
# Пример для NVIDIA через nvidia-smi (требует перезагрузки драйверов)
sudo nvidia-smi -pl 350 # Ограничение мощности до 350W для RTX 4090
Выбор эффективных моделей LLM: Некоторые архитектуры 2025-2026 годов (особенно с поддержкой Tool Calling) оптимизированы под инференс и требуют меньше вычислений.
Квантование на лету: Современные фреймворки типа llama.cpp 2026 версии позволяют загружать модель в 8-битном формате, а вычислять в 4-битном, экономя память и снижая нагрузку.
Реальная сборка: 4x RTX 4090 на американской сети
Давайте посчитаем на примере самой популярной конфигурации:
- 4 × RTX 4090: 4 × 450W = 1800W (пиковые значения до 2400W!)
- Процессор AMD Threadripper: 280W
- Материнская плата, память, диски: 150W
- Итого: 2230W минимум, 2830W в пике
Это явно не влезает в 1800W от одной розетки. Решение:
- Используйте два БП: 1600W + 1200W
- Подключите каждый к отдельной розетке на разных автоматических выключателях
- Распределите GPU: 2 карты на первый БП, 2 карты + процессор на второй
- Установите ограничение мощности на GPU до 380W
- Используйте эффективный софт для локального запуска
Не пытайтесь использовать один БП на 2000W+ на 120V. Даже если найдете такой, он будет потреблять 18-20А, что гарантированно выбьет автомат на 15А. Физику не обманешь.
Когда стоит вызывать электрика
Если вам нужно больше 2-3 GPU, лучше не экспериментировать. Вызовите электрика для:
- Установки отдельной линии 20А (2400W доступно вместо 1800W)
- Подключения розетки 240V (удваивает доступную мощность при том же токе)
- Проверки состояния проводки в старых домах (проводка 1960-х не рассчитана на современные нагрузки)
Стоимость работ: $200-500 в зависимости от региона. Дешевле, чем сгоревшая ферма за $10,000+.
Мониторинг и безопасность
Ферма на пределе возможностей сети требует мониторинга. Что должно быть обязательно:
- Умные розетки с мониторингом потребления (например, TP-Link Kasa)
- Температурные датчики в районе розеток и БП
- Автоматическое отключение при превышении порога (через Home Assistant или аналоги)
- Регулярная проверка соединений на нагрев (раз в месяц)
Настройка простого мониторинга:
#!/bin/bash
# Мониторинг температуры и отключение при перегреве
GPU_TEMP=$(nvidia-smi --query-gpu=temperature.gpu --format=csv,noheader)
if [ "$GPU_TEMP" -gt 85 ]; then
echo "GPU перегревается, отключаю..."
shutdown -h now
fi
Будущее: что нас ждет в 2026-2027
Производители уже реагируют на проблему 120V:
- NVIDIA анонсировала RTX 50 серию с улучшенной энергоэффективностью (больше FLOPS на ватт)
- Появляются специализированные БП для майнинга и AI на 120V с PFC коррекцией
- Новые стандарты квантования LLM снижают требования к памяти и вычислениям
- Фреймворки типа llama.cpp оптимизируются под ограниченные системы
Мой прогноз: к концу 2026 мы увидим готовые решения "ферма в коробке" с оптимизированным питанием для американского рынка. Пока же приходится собирать самим.
Последний совет: начните с малого. Соберите систему на 2 GPU, протестируйте с разными промптами для тестирования LLM, поймите реальное потребление. И только потом масштабируйтесь. Электричество в США дешевле, чем в Европе, но законы физики одинаковы везде.