Флагман дорожает вопреки логике
Казалось бы, прошло полгода с релиза RTX 5090. Цены должны были устаканиться, спрос насытиться — но нет. В мае 2026 года средняя стоимость флагмана NVIDIA в Европе перевалила за 3200 евро, а в некоторых магазинах карту не найти дешевле 3500. Это на 10-15% выше рекомендованной цены. И тренд не собирается разворачиваться.
Мы уже писали об этом в мониторинге цен на GPU в EU — RTX 5090 дорожает, остальные дешевеют. Ситуация неслучайна.
Для энтузиастов локальных LLM это удар ниже пояса. Карта, которая должна была стать идеальной платформой для запуска моделей 70B и выше (32 ГБ GDDR7, новая архитектура), превращается в предмет роскоши. Что делать тем, кто собирал билд именно под неё? Или тем, кто ещё только планирует апгрейд?
Почему цена растёт, а не падает?
Три фактора, которые бесят.
- Дефицит GDDR7. Производство памяти нового поколения загружено корпоративными заказами под Blackwell для дата-центров. NVIDIA отгружает львиную долю чипов под HGX и DGX — потребительские карты остаются на голодном пайке. Подробнее — в нашем материале NVIDIA замедляет релизы игровых карт.
- Спрос со стороны AI-стартапов. Локальный инференс Llama-3 70B и её клонов требует много VRAM. RTX 5090 с 32 ГБ оказывается самой доступной профессиональной картой для таких задач — её скупают небольшие команды и исследователи.
- Сознательное сдерживание. NVIDIA не выгодно наращивать выпуск игровых карт, когда каждая единица GDDR7 может уйти в B2B-сектор по цене в 3-4 раза выше. И пока рынок не заставят конкуренты (AMD? Intel?), дефицит будет сохраняться.
В итоге — идеальный шторм. RTX 5090 де-факто перестала быть «народной AI-картой» и превратилась в нишевый инструмент для тех, у кого бюджет не ограничен.
Как это бьёт по типичным сборкам
Представьте: вы откладывали деньги, выбрали корпус, блок питания, материнку. Упирались в RTX 5090 как в единственный вариант для запуска Qwen2.5-32B в Q4_K_M с приличным контекстом. И вдруг карта подорожала ещё на 300-500 евро. Бюджет ломается.
На практике это означает, что из конфигурации приходится выкидывать либо саму карту, либо другие компоненты. Но если вырезать память или процессор — будет дисбаланс. А если брать RTX 5090 — придётся жертвовать охлаждением или накопителями, что чревато троттлингом и потерей данных.
Не советую так делать: экономить на блоке питания или корпусе ради одной карты. RTX 5090 жрёт до 600 Вт. Плохой БП может сжечь всю систему.
И тут встаёт главный вопрос: а может, не стоит вешаться на флагман? Есть альтернативы, которые в мае 2026 выглядят куда разумнее.
Альтернатива №1: RTX 4090 (б/у или новая со скидкой)
Пока RTX 5090 дорожает, RTX 4090 дешевеет. Новые карты можно купить за 1400-1500 евро, б/у — за 1100-1200. Да, у неё «всего» 24 ГБ GDDR6X, но для моделей до 34B в 4-битном квантовании этого хватает с запасом.
Если вам нужна именно производительность инференса (токенов/сек), RTX 4090 почти не уступает 5090 — разница в 10-15% при вдвое меньшей цене. А сэкономленные 2000 евро можно потратить на вторую такую же карту для параллельного запуска или на облачный API для редких задач.
Да, 24 ГБ — это ограничение. Но как мы уже разбирали в статье «Сколько VRAM реально нужно для локальных LLM», многие переоценивают свои потребности. Для тьюториалов, написания кода, агентов с тул-коллингом — более чем достаточно.
Альтернатива №2: RTX Pro 6000 — когда важен объём
Следующий логичный шаг — профессиональная карта с 48 ГБ VRAM. У нас есть подробное сравнение RTX Pro 6000 vs RTX 4090. Вывод: если вам нужно запускать Llama-3 70B в 16-битном формате без квантования — Pro 6000 безальтернативна. Но цена — 6500-7000 евро. Это в два раза дороже RTX 5090 даже по завышенной цене.
Pro 6000 оправдана только для продакшн-инференса или работы с очень большими контекстами. Для хобби-проектов — жирновато.
Альтернатива №3: Сборка «3х RTX 3090» или eGPU
Старый, но рабочий трюк: взять три дешёвые RTX 3090 (каждая по 24 ГБ, итого 72 ГБ) и объединить их через NVLink или просто распределённым инференсом (например, через exllama или tensor parallel). Мы описывали эту схему в материале «Собираем ПК для локальных LLM за копейки».
Сейчас три б/у RTX 3090 обойдутся в 2000-2400 евро — столько же, сколько одна новая RTX 5090. Но вы получаете в три раза больше VRAM. Скорость будет ниже (из-за шины PCIe и объединения), зато модель 70B спокойно поместится целиком. Минус — потребление электроэнергии (три карты суммарно ~1050 Вт) и необходимость в массивном блоке питания.
Альтернатива — eGPU-бокс с одной RTX 4090. Потеря в производительности из-за Thunderbolt/USB4 составляет около 10-15%, зато мобильность. Но для LLM это не так критично — узким местом чаще является пропускная способность памяти, а не шина.
Альтернатива №4: RTX 5080 — неожиданный компромисс
RTX 5080 вышла раньше 5090 и позиционировалась как средне-верхний сегмент. У неё 16-24 ГБ GDDR7 (зависит от версии), цена — около 1800-2000 евро (и не дорожает, так как её не скупают AI-стартапы). Мы тестировали на ней лучшие локальные LLM с тул-коллингом: Qwen2.5-32B, Llama-3-70B (в Q4) работают отлично. По сути, 5080 — это RTX 4090 на новой памяти, но дешевле.
Если у вас уже есть RTX 5080 — можете выдохнуть. Если выбираете между 5080 и подорожавшей 5090 — берите 5080 и сэкономьте 1200-1500 евро. На эти деньги можно купить второй SSD для датасетов или оплатить API для редких тяжёлых моделей.
Вариант для нетерпеливых: облачные инстансы
Звучит как ересь для фанатов локального AI. Но если RTX 5090 стоит как подержанный автомобиль, может, проще арендовать? A100 80 ГБ на RunPod стоит ~1.5 евро/час. За 2000 евро вы получаете 1333 часа — почти два месяца непрерывной работы. Для экспериментов — норм.
Но если вам нужна конфиденциальность, низкая задержка или вы тренируете модель — локальное железо необходимо. Тогда возвращаемся к альтернативам выше.
Так что же брать в мае 2026?
Мой прогноз: RTX 5090 останется дорогой как минимум до выхода RTX 5090 Super (а её, судя по слухам, отложили до 2027). Флагман стал жертвой собственного успеха. NVIDIA пойдёт по пути дата-центров, а потребители — по пути компромиссов.
Практический совет: не покупайте RTX 5090 сейчас, если вы не монетизируете свой AI напрямую. Берите RTX 4090 (б/у в отличном состоянии) или RTX 5080. Если нужно больше VRAM — собирайте ферму из 3090 или присмотритесь к Radeon RX 7900 XTX (24 ГБ, но с оговорками по софту). Или подождите: цены на RTX 4090 продолжат падать, и к осени 2026 можно будет взять её за 1000 евро. Тогда и соберёте билд.
Ну а если душа просит именно RTX 5090 — готовьтесь раскошелиться. Или, как говорят в народе, «продайте почку». Но про ROI тоже не забывайте: иногда сборка ПК для LLM — ошибка, выгоднее арендовать.