Облака — это дорого. И медленно

Вы смотрите на счет за AWS. $1200 за три дня обучения модели. Или ждёте своей очереди в корпоративном кластере. Или просто устали от Colab, который ресетит сессию каждые 12 часов. Знакомо?

Локальная станция — не про экономию. Это про контроль. Вы запускаете эксперимент в 3 ночи, не думая о бюджете. Меняете гиперпараметры на лету. И знаете, что ваши данные никуда не утекают.

Обучение LLM локально в 2026 году — уже не фантастика. Модели стали эффективнее, а железо — доступнее. Но собрать систему, которая не взорвётся через неделю непрерывной нагрузки — это искусство.

Железо: где деньги умирают по-настоящему

Забудьте про игровые видеокарты. Серьёзно. RTX 4090 — отлична для инференса, но для обучения? Её 24 ГБ VRAM съедает Llama 3.1-70B за завтраком. Вам нужно что-то с большей памятью и стабильностью.

Видеокарты: священная война VRAM против TFLOPS

На февраль 2026 года у вас три реальных варианта:

Вариант	VRAM	Цена (примерно)	Для чего	Боль
2× NVIDIA RTX 5090 Ti (если выйдет)	48 ГБ (2×24)	$5000+	Модели до 30B, fine-tuning	NVLink мёртв, связь через PCIe
NVIDIA RTX 6000 Ada	48 ГБ	$6800	Серьёзные исследования	Цена как у подержанной машины
Б/у Tesla V100 32GB	32 ГБ	$1500-2000	Бюджетное обучение	Греется как плита, нет DLSS
AMD MI250X	128 ГБ HBM2e	$5000+ б/у	Гигантские модели	Поддержка в PyTorch — молитва и надежда

Мой выбор? Если деньги есть — RTX 6000 Ada. Одна карта с 48 ГБ лучше, чем две по 24. Меньше головной боли с multi-GPU. Если денег нет — ищите б/у V100 на eBay. Они отработают своё, но готовьтесь к шуму и теплу.

💡

Ключевой параметр — пропускная способность памяти. У RTX 6000 Ada — 960 ГБ/с. У V100 — 900 ГБ/с. Разница в 6% на бумаге, на практике — в стабильности и поддержке новых оптимизаторов. Не ведитесь на терафлопсы, смотрите на память.

Всё остальное: скучно, но важно

Процессор: Не нужен ядерный реактор. Ryzen 9 7950X или Intel Core i9-14900K хватит. Главное — PCIe 5.0 и много линий для нескольких карт.
Оперативка: 128 ГБ DDR5 — минимум. 256 ГБ — комфортно. Когда модель не влезает в VRAM, данные идут в RAM. Медленно, но работает.
SSD: NVMe PCIe 5.0. 2 ТБ. Датасеты весят сотни гигабайтов. Жёсткие диски — это 2010 год.
Блок питания: 1600W 80+ Platinum. Одна RTX 6000 Ada ест 300W под нагрузкой. Плюс процессор, плюс всё остальное. Экономить на питании — сжечь $7000 за раз.
Охлаждение: Жидкостное. Воздухом вы охладите одну карту. Две — уже погранично. Три — нет.

Если не хотите собирать сами, посмотрите мою статью про сборку станции за $15,000. Там подробно про корпуса, материнки и почему не стоит брать серверное железо.

Софт: где всё ломается в первый же день

Установили Windows? Переустанавливайте. Для обучения LLM в 2026 году нужен Linux. Ubuntu 24.04 LTS — безопасный выбор. Или Rocky Linux 9, если любите enterprise.

1 Драйверы и CUDA: первый круг ада

На февраль 2026 актуальная версия CUDA — 12.5. Но проверяйте, что требует ваш фреймворк.

# Добавляем репозиторий NVIDIA
curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg

# Устанавливаем драйвер (версия 560+)
sudo apt install nvidia-driver-560

# Перезагружаемся. Серьёзно, перезагрузитесь.
sudo reboot

# Проверяем
nvidia-smi

Если видите таблицу с видеокартой — хорошо. Если видите ошибку — добро пожаловать в клуб. Гуглите ошибку, обычно проблема в Secure Boot или старом ядре.

2 PyTorch с правильными флагами

Не ставьте PyTorch через pip. Соберите из исходников или используйте pre-built с поддержкой CUDA 12.5.

# Для CUDA 12.5 и Python 3.11
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu125

# Проверяем
python3 -c "import torch; print(torch.cuda.is_available()); print(torch.__version__)"

Самая частая ошибка: mismatch версий CUDA. PyTorch собрали под CUDA 12.4, а у вас 12.5. Или наоборот. Работать будет, но с падением производительности на 20-30%. Проверяйте совместимость.

3 Фреймворки для дообучения: Unsloth и другие

В 2026 году Unsloth — де-факто стандарт для эффективного дообучения. Они выжимают из железа всё, что можно.

pip install unsloth

Альтернативы? Hugging Face PEFT, Axolotl, Lit-GPT. Но Unsloth проще для старта. Если нужно кастомное — смотрите в сторону кастомных CUDA ядер, но это для хардкорщиков.

Гранты: как получить железо за чужой счёт

У вас нет $10,000? У университетов и исследовательских фондов — есть.

Источник	Что дают	Условия	Сложность
NVIDIA Academic Hardware Grant	Видеокарты (A100, H100)	Публикации, открытый код	Высокая
Google Cloud Research Credits	$5000-100,000 в облаке	Использовать только GCP	Средняя
AWS Cloud Credits for Research	До $20,000 кредитов	Новые аккаунты, проекты	Низкая
Kaggle Notebooks	P100 16GB, 30 часов/неделю	Бесплатно, но с ограничениями	Очень низкая
Lambda Labs Grants	Скидки на аренду	Стартапы, исследователи	Средняя

Как получить? Пишите proposal. Не «хочу обучать LLM», а «исследую влияние sparse attention на convergence rate в multilingual моделях». Конкретика. Метрики. План публикации.

💡

Гранты на железо (физические карты) получают единицы. Гранты на облачные кредиты — многие. Начните с малого: получите $5000 от Google, обучите модель, опубликуйте результат. С этим результатом идите за железом.

А если вообще без денег?

Есть варианты. Плохие, но работающие.

Google Colab Pro+: $50/месяц. V100 или A100 на 24 часа. Хватит для дообучения моделей до 7B. Главное — пишите скрипты, которые сохраняют чекпоинты каждые 100 шагов. Сессия прервётся. Всегда.
Kaggle: Бесплатно. P100 16GB. Медленно, но стабильно. Идеально для экспериментов с архитектурами, а не для обучения с нуля.
Национальные облака: В России — Cloud.ru (гранты для вузов). В ЕС — Gaia-X. Ищите локальные инициативы.
Объединяйтесь: Четыре исследователя = четыре RTX 4090. Собираете кластер в одной комнате. Шумно, горячо, но работает. Инструкции по настройке есть в статье про локальную LLM-инфраструктуру.

Типичные ошибки, которые сломают вашу систему

Экономия на блоке питания: Купили 1200W вместо 1600W. При пиковой нагрузке система выключается. Или хуже — сгорает карта.
Охлаждение корпуса: Положили две карты в стандартный корпус. Температура VRM — 110°C. Троттлинг через 10 минут обучения.
Сборка PyTorch без флагов: Не указали архитектуру. Получили бинарник для всех GPU, но на 15% медленнее.
Файловая система ext4: Для датасетов из миллионов файлов нужна XFS или Btrfs. Ext4 умрёт на операции создания чекпоинтов.
Резервное копирование? Какое резервное копирование?: Обучали модель 2 недели. Отключили свет. Чекпоинт не сохранился. Начинайте сначала.

Что в итоге?

Собрать станцию для обучения LLM в 2026 — реально. Дорого, но реально. Начните с малого: одна карта, 128 ГБ RAM. Обучите модель на 7B параметров. Публикуйте код. Получайте гранты. Масштабируйтесь.

И помните: самое дорогое в обучении LLM — не железо, а время. Ваше время. Система, которая экономит вам неделю отладки, стоит своих денег.

Следующий шаг: выберите модель для экспериментов. В 2026 году актуальны Llama 3.2, Qwen 2.5 и открытые Mixtral-последователи. Не гонитесь за размером. 7B параметров с качественным датасетом бьёт 70B с мусором.

Как собрать локальную рабочую станцию для обучения и дообучения LLM с нуля: железо, ПО и гранты