RTX 5090 подорожала: альтернативы для LLM в 2026

Флагман дорожает вопреки логике

Казалось бы, прошло полгода с релиза RTX 5090. Цены должны были устаканиться, спрос насытиться — но нет. В мае 2026 года средняя стоимость флагмана NVIDIA в Европе перевалила за 3200 евро, а в некоторых магазинах карту не найти дешевле 3500. Это на 10-15% выше рекомендованной цены. И тренд не собирается разворачиваться.

Мы уже писали об этом в мониторинге цен на GPU в EU — RTX 5090 дорожает, остальные дешевеют. Ситуация неслучайна.

Для энтузиастов локальных LLM это удар ниже пояса. Карта, которая должна была стать идеальной платформой для запуска моделей 70B и выше (32 ГБ GDDR7, новая архитектура), превращается в предмет роскоши. Что делать тем, кто собирал билд именно под неё? Или тем, кто ещё только планирует апгрейд?

Почему цена растёт, а не падает?

Три фактора, которые бесят.

Дефицит GDDR7. Производство памяти нового поколения загружено корпоративными заказами под Blackwell для дата-центров. NVIDIA отгружает львиную долю чипов под HGX и DGX — потребительские карты остаются на голодном пайке. Подробнее — в нашем материале NVIDIA замедляет релизы игровых карт.
Спрос со стороны AI-стартапов. Локальный инференс Llama-3 70B и её клонов требует много VRAM. RTX 5090 с 32 ГБ оказывается самой доступной профессиональной картой для таких задач — её скупают небольшие команды и исследователи.
Сознательное сдерживание. NVIDIA не выгодно наращивать выпуск игровых карт, когда каждая единица GDDR7 может уйти в B2B-сектор по цене в 3-4 раза выше. И пока рынок не заставят конкуренты (AMD? Intel?), дефицит будет сохраняться.

В итоге — идеальный шторм. RTX 5090 де-факто перестала быть «народной AI-картой» и превратилась в нишевый инструмент для тех, у кого бюджет не ограничен.

Как это бьёт по типичным сборкам

Представьте: вы откладывали деньги, выбрали корпус, блок питания, материнку. Упирались в RTX 5090 как в единственный вариант для запуска Qwen2.5-32B в Q4_K_M с приличным контекстом. И вдруг карта подорожала ещё на 300-500 евро. Бюджет ломается.

На практике это означает, что из конфигурации приходится выкидывать либо саму карту, либо другие компоненты. Но если вырезать память или процессор — будет дисбаланс. А если брать RTX 5090 — придётся жертвовать охлаждением или накопителями, что чревато троттлингом и потерей данных.

Не советую так делать: экономить на блоке питания или корпусе ради одной карты. RTX 5090 жрёт до 600 Вт. Плохой БП может сжечь всю систему.

И тут встаёт главный вопрос: а может, не стоит вешаться на флагман? Есть альтернативы, которые в мае 2026 выглядят куда разумнее.

Альтернатива №1: RTX 4090 (б/у или новая со скидкой)

Пока RTX 5090 дорожает, RTX 4090 дешевеет. Новые карты можно купить за 1400-1500 евро, б/у — за 1100-1200. Да, у неё «всего» 24 ГБ GDDR6X, но для моделей до 34B в 4-битном квантовании этого хватает с запасом.

Если вам нужна именно производительность инференса (токенов/сек), RTX 4090 почти не уступает 5090 — разница в 10-15% при вдвое меньшей цене. А сэкономленные 2000 евро можно потратить на вторую такую же карту для параллельного запуска или на облачный API для редких задач.

Да, 24 ГБ — это ограничение. Но как мы уже разбирали в статье «Сколько VRAM реально нужно для локальных LLM», многие переоценивают свои потребности. Для тьюториалов, написания кода, агентов с тул-коллингом — более чем достаточно.

Альтернатива №2: RTX Pro 6000 — когда важен объём

Следующий логичный шаг — профессиональная карта с 48 ГБ VRAM. У нас есть подробное сравнение RTX Pro 6000 vs RTX 4090. Вывод: если вам нужно запускать Llama-3 70B в 16-битном формате без квантования — Pro 6000 безальтернативна. Но цена — 6500-7000 евро. Это в два раза дороже RTX 5090 даже по завышенной цене.

Pro 6000 оправдана только для продакшн-инференса или работы с очень большими контекстами. Для хобби-проектов — жирновато.

Альтернатива №3: Сборка «3х RTX 3090» или eGPU

Старый, но рабочий трюк: взять три дешёвые RTX 3090 (каждая по 24 ГБ, итого 72 ГБ) и объединить их через NVLink или просто распределённым инференсом (например, через exllama или tensor parallel). Мы описывали эту схему в материале «Собираем ПК для локальных LLM за копейки».

Сейчас три б/у RTX 3090 обойдутся в 2000-2400 евро — столько же, сколько одна новая RTX 5090. Но вы получаете в три раза больше VRAM. Скорость будет ниже (из-за шины PCIe и объединения), зато модель 70B спокойно поместится целиком. Минус — потребление электроэнергии (три карты суммарно ~1050 Вт) и необходимость в массивном блоке питания.

Альтернатива — eGPU-бокс с одной RTX 4090. Потеря в производительности из-за Thunderbolt/USB4 составляет около 10-15%, зато мобильность. Но для LLM это не так критично — узким местом чаще является пропускная способность памяти, а не шина.

Альтернатива №4: RTX 5080 — неожиданный компромисс

RTX 5080 вышла раньше 5090 и позиционировалась как средне-верхний сегмент. У неё 16-24 ГБ GDDR7 (зависит от версии), цена — около 1800-2000 евро (и не дорожает, так как её не скупают AI-стартапы). Мы тестировали на ней лучшие локальные LLM с тул-коллингом: Qwen2.5-32B, Llama-3-70B (в Q4) работают отлично. По сути, 5080 — это RTX 4090 на новой памяти, но дешевле.

Если у вас уже есть RTX 5080 — можете выдохнуть. Если выбираете между 5080 и подорожавшей 5090 — берите 5080 и сэкономьте 1200-1500 евро. На эти деньги можно купить второй SSD для датасетов или оплатить API для редких тяжёлых моделей.

Вариант для нетерпеливых: облачные инстансы

Звучит как ересь для фанатов локального AI. Но если RTX 5090 стоит как подержанный автомобиль, может, проще арендовать? A100 80 ГБ на RunPod стоит ~1.5 евро/час. За 2000 евро вы получаете 1333 часа — почти два месяца непрерывной работы. Для экспериментов — норм.

Но если вам нужна конфиденциальность, низкая задержка или вы тренируете модель — локальное железо необходимо. Тогда возвращаемся к альтернативам выше.

Так что же брать в мае 2026?

Мой прогноз: RTX 5090 останется дорогой как минимум до выхода RTX 5090 Super (а её, судя по слухам, отложили до 2027). Флагман стал жертвой собственного успеха. NVIDIA пойдёт по пути дата-центров, а потребители — по пути компромиссов.

Практический совет: не покупайте RTX 5090 сейчас, если вы не монетизируете свой AI напрямую. Берите RTX 4090 (б/у в отличном состоянии) или RTX 5080. Если нужно больше VRAM — собирайте ферму из 3090 или присмотритесь к Radeon RX 7900 XTX (24 ГБ, но с оговорками по софту). Или подождите: цены на RTX 4090 продолжат падать, и к осени 2026 можно будет взять её за 1000 евро. Тогда и соберёте билд.

Ну а если душа просит именно RTX 5090 — готовьтесь раскошелиться. Или, как говорят в народе, «продайте почку». Но про ROI тоже не забывайте: иногда сборка ПК для LLM — ошибка, выгоднее арендовать.

Подписаться на канал

RTX 5090 подорожала: как это ломает LLM-сборки и что брать вместо