Когда Gemini советует железо: стоит ли доверять?
В начале 2026 года Gemini опубликовала "идеальную" сборку ПК за $1300 для локального ИИ. Идея заманчивая: за скромные деньги получить машину, которая потянет 70B-модели. Но когда нейросеть начинает рекомендовать железо, у меня включается паранойя. Я десять лет собираю серверы и знаю: между списком компонентов и работающей системой - пропасть.
Оригинальная сборка от Gemini выглядела так: RTX 3090, Ryzen 7 5700X, 64GB DDR4, БП 850W. Цифры красивые, но я сразу увидел три проблемы: совместимость слотов, реальная цена на 3090 в 2026 году и охлаждение этой печки.
Что на самом деле нужно для локального ИИ в 2026
Забудьте про TFLOPS. Для LLM важны три вещи:
- VRAM, только VRAM, и еще раз VRAM. Модель не влезла в память? Все, производительность падает в 10-20 раз. Для 70B в 4-битном квантовании нужно 35-40 ГБ. Для FP16 - все 140.
- Пропускная способность памяти. GDDR6X у 3090 дает 936 ГБ/с. DDR4 у процессора - в 5 раз меньше. Если модель не помещается в VRAM и начинает свапаться в ОЗУ - это катастрофа.
- PCIe полоса. На бюджетной материнке слоты x16 часто работают в x4 режиме при установке нескольких карт. Для vLLM или ExLlamaV2 это смерть.
Разбираем сборку Gemini по косточкам
Я загрузил их список в PCPartPicker. Результат предсказуемый: "Potential Issues: 1".
1 Проблема с видеокартой
RTX 3090 - карта 2020 года. В 2026 году найти новую за разумные деньги невозможно. Б/у экземпляры на eBay идут от $700, и это лотерея. Майнили ли на ней? Как охлаждалась? Гарантия? Ноль.
2 Проблема с блоком питания
850W для системы с RTX 3090 - это на грани. Карта в пике берет 350-400W. Процессор - 65W. Остальное - еще 100W. Запас всего 15-20%. При длительных инференс-сессиях (а они длятся часами) блок будет работать на пределе, греться и шуметь.
3 Проблема с охлаждением
RTX 3090 Founders Edition - паровой каток. Она выдувает горячий воздух прямо на боковую стенку корпуса. В дешевом корпусе с плохой вентиляцией GPU будет троттлить уже через 10 минут работы. Температура уйдет за 85°C, частота упадет.
| Компонент | Рекомендация Gemini | Реальная проблема | Альтернатива на 2026 |
|---|---|---|---|
| Видеокарта | NVIDIA RTX 3090 | Цена $700+, б/у, нет гарантии | RTX 4070 Ti Super 16GB ($800) или б/у 3090 с проверкой |
| Процессор | AMD Ryzen 7 5700X | PCIe 4.0 только x16, нет PCIe 5.0 | Ryzen 5 7600 (PCIe 5.0, лучше для будущего) |
| Память | 64GB DDR4-3200 | DDR4 устаревает, дороже апгрейд | 32GB DDR5-6000 (дешевле апгрейда позже) |
| Блок питания | 850W 80+ Gold | Мало для 3090 при нагрузке | 1000W 80+ Gold (запас для будущей карты) |
Моя сборка за $1300: что можно сделать реально
После недели поисков на eBay, мониторинга r/buildapcsales и переговоров с местными магазинами, я составил рабочую конфигурацию. Она не идеальна, но собирается и работает.
Ядро системы: видеокарта
RTX 4070 Ti Super 16GB за $800 - новая, с гарантией. Да, у нее меньше памяти чем у 3090 (16GB против 24GB), но:
- Энергоэффективность в 2 раза лучше (285W против 350W)
- DLSS 3.5 и новые тензорные ядра
- Поддержка PCIe 5.0 (будущее-прочность)
- Можно запускать 34B модели в 4-битном квантовании
Если нашли б/у RTX 3090 за $600-650 и готовы рискнуть - берите. Но проверьте: запустите Furmark на 30 минут, посмотрите температуру (должна быть ниже 80°C), проверьте в GPU-Z - не меняли ли память на дешевую.
Процессор и память
Ryzen 5 7600 за $200. Почему не 5700X? Потому что AM5 сокет. Через год можно будет поставить Ryzen 7 9700X без смены материнки. DDR5-6000 32GB за $100 - достаточно для большинства задач. 64GB DDR5 стоят $200, выходят за бюджет.
Материнская плата
B650 с двумя слотами PCIe x16 (реально x8/x8 при двух картах). Зачем два? Потому что через год можно добавить вторую RTX 4070 Ti Super и получить 32GB VRAM. Для 70B моделей это уже серьезно.
Блок питания и корпус
1000W 80+ Gold - $150. Кажется избыточным, но: во-первых, КПД выше при 50% нагрузке, во-вторых, запас для второй карты. Корпус с mesh-фасадом и 4-5 вентиляторами - $80. Не экономьте на airflow.
Что можно запустить на такой системе
С 16GB VRAM в 2026 году:
- DeepSeek Coder 33B в 4-битном квантовании - 20 токенов/сек
- Llama 3.2 11B Vision - полная скорость, до 40 токенов/сек
- Qwen 2.5 32B в 4-битах - 15-18 токенов/сек
- 70B модели в GGUF формате с частичной загрузкой в VRAM - 3-5 токенов/сек (медленно, но работает)
Если добавите вторую карту (еще $800), то 70B в 4-битах будут летать на 25+ токенов/сек. Это уже уровень систем за $15000, но за $2100.
Ловушки, которых не видит Gemini
Ловушка №1: PCIe линиях. На B650 чипсете от процессора идет 24 линии PCIe 5.0. Одна видеокарта забирает 16, NVMe SSD - 4, остается 4 на вторую карту. Она будет работать в x4 режиме. Для ИИ это приемлемо, но не идеально.
Ловушка №2: память. DDR5 в 2026 году все еще дороже DDR4. 64GB DDR5-6000 стоят $200, а DDR4-3200 - $120. Но DDR4 - тупиковая ветка. Через год вы не поставите в эту систему новый процессор.
Ловушка №3: охлаждение VRAM. У RTX 3090 память расположена с обеих сторон платы. Дешевые модели (Zotac, некоторые Palit) имеют плохое охлаждение тыльной памяти. При длительной нагрузке она греется до 100°C+, начинаются ошибки. У RTX 4070 Ti Super этой проблемы нет.
А если хочется больше VRAM прямо сейчас?
Есть грязный хак: вместо одной RTX 4070 Ti Super за $800 взять две RTX 4060 Ti 16GB за $400 каждая. Итого $800, 32GB VRAM. Но:
- Производительность одной карты в 2 раза ниже
- PCIe x8 каждая (на B650)
- Сложнее с охлаждением двух карт в корпусе
- Больше потребление (320W против 285W)
Для чистого инференса (не обучения) этот вариант имеет право на жизнь. Особенно если использовать техники из статьи про 3× RTX 3090.
Пошаговая инструкция: как не облажаться при сборке
1 Проверка совместимости
Не верьте никому. Зайдите на PCPartPicker, вбейте все компоненты. Система покажет несовместимости: размер видеокарты vs корпус, высота кулера vs оперативка, разъемы блока питания.
2 Сборка и первый запуск
Соберите систему вне корпуса (на картонной коробке). Подключите только материнку, процессор, одну планку памяти, видеокарту. Запустите. Если POST прошел - отлично. Если нет - проще искать проблему.
3 Тест стабильности
Установите Windows/Linux, драйверы. Запустите Furmark на 30 минут + Prime95 на процессор. Температура GPU не выше 80°C, CPU не выше 85°C. Если выше - проблемы с охлаждением.
4 Тест ИИ-нагрузки
Установите Ollama или LM Studio. Загрузите Llama 3.2 11B. Запустите инференс на 1000 токенов. Следите за использованием VRAM (GPU-Z), температурой. Должно быть стабильно.
Бюджетные альтернативы, о которых молчат
Если $1300 все еще много, посмотрите на эти варианты:
| Бюджет | Конфигурация | Что запустит | Минусы |
|---|---|---|---|
| $800 | RTX 4060 Ti 16GB, i5-13400, 32GB DDR4 | Модели до 20B, некоторые 32B в 4-битах | Медленный PCIe 4.0 x8, слабый процессор |
| $1000 | RTX 4070 Super 12GB, Ryzen 5 7600, 32GB DDR5 | Модели до 13B, некоторые 20B | Всего 12GB VRAM, маловато |
| $600 (б/у) | RTX 3080 10GB, Ryzen 5 5600, 64GB DDR4 | Модели до 13B, 7B быстро | 10GB VRAM в 2026 - уже мало |
Что будет через год?
В 2027 году NVIDIA выпустит RTX 5000 серию. Ожидаю RTX 5070 с 20GB GDDR7 за $600. Сегодняшняя сборка на AM5 позволит просто поменять видеокарту и получить прирост в 2 раза.
Но главный тренд 2026 года - оптимизация. Модели становятся умнее при том же размере. Llama 3.2 11B по качеству близка к Llama 2 34B. Значит, можно обойтись меньшей VRAM.
Мой совет: не гонитесь за максимальной VRAM сегодня. Соберите сбалансированную систему на современной платформе (AM5), с хорошим блоком питания и охлаждением. Видеокарту можно поменять через год-два. А вот материнку с процессором - нет.
И последнее: перед покупкой проверьте, что хотите запускать. Если вам нужен только coding assistant (DeepSeek Coder 6.7B), хватит и RTX 4060 Ti 16GB за $400. Не переплачивайте за то, что не будете использовать.