Замедление релизов NVIDIA RTX и локальные LLM: прогноз на 2026-2028

Тишина в игровом сегменте: что происходит с NVIDIA?

Если вы ждали RTX 6060 или 6070 в 2026 году — расслабьтесь. Их не будет. Инсайдерские сливы и аналитики рынка сходятся в одном: NVIDIA решила сосредоточиться на корпоративном сегменте и AI-ускорителях, оставив игровые релизы на второй план. RTX 60 серия, которая традиционно обновлялась каждые 2-3 года, теперь отложена до 2028. Это не просто «немного подождать» — это три года без новых бюджетных и среднебюджетных решений для локального AI.

Факт: По данным источников в цепочке поставок, NVIDIA не планирует новых игровых GPU на архитектуре Blackwell после RTX 5090. Следующее поколение игровых карт (предположительно архитектура Rubin) появится не раньше конца 2027-начала 2028.

Почему это важно для локальных LLM?

Игровые карты NVIDIA — это кислород для сообщества локальных LLM. Именно на них работают 80% домашних AI-сборок. RTX 3060 с её 12 ГБ VRAM стала культовой картой для запуска 7B-13B моделей. RTX 4060 Ti 16GB — текущий стандарт для 34B параметров. RTX 5080, как мы писали в обзоре моделей для RTX 5080, открывает новые возможности. А что дальше?

Задержка новых релизов означает одно: текущее железо будет служить дольше. Значительно дольше. Ваш RTX 4060 Ti или 4070 Super останется актуальным до 2028 года. Звучит неплохо, пока не вспомнишь, как быстро растут модели.

Модели растут, VRAM стоит на месте

Вот где начинаются реальные проблемы. Пока мы обсуждаем, запускать ли Llama 3.2 11B или Qwen2.5 32B, разработчики Meta, Google и Microsoft готовят модели на 400B+ параметров. Да, они в основном облачные. Но локальное сообщество всегда стремилось запускать самые мощные модели, которые только помещаются в VRAM.

💡

Помните нашу статью про сколько VRAM реально нужно для локальных LLM? Мы тогда говорили: «24 ГБ хватит всем». Сейчас это утверждение выглядит наивным. Модели на 70B+ параметров стали обыденностью, а 100B+ уже на горизонте.

С заморозкой игрового сегмента NVIDIA создает интересную ситуацию:

Профессиональные карты (Blackwell Pro серия) получают все обновления и новые функции
Игровые карты остаются на месте на 3+ года
Разрыв между «про» и «игровым» сегментом растет экспоненциально

Что будет с ценами на вторичном рынке?

Здесь начинается самое интересное. Без новых релизов текущие карты не будут дешеветь так быстро. RTX 4090, которая уже стала легендой для локальных LLM (спасибо её 24 ГБ GDDR6X), может получить вторую жизнь на вторичном рынке. Особенно учитывая, что RTX Pro 6000 стоит в 3-4 раза дороже при схожей производительности в инференсе.

Ожидайте:

RTX 4090 будет держаться в цене до 2027 года
Карты с большим VRAM (3060 12GB, 4060 Ti 16GB) станут дефицитными
Люди начнут активнее комбинировать карты через NVLink (да, это всё еще работает для некоторых задач)

Альтернативы: куда смотреть кроме NVIDIA?

Когда один игрок замедляется, другие ускоряются. И 2026-2028 годы могут стать временем для альтернатив:

Вендор	Что предлагают	Проблемы для LLM	Перспективы на 2026-2028
AMD	RDNA 4/5, большой VRAM	Слабая поддержка в llama.cpp, ROCm всё еще боль	Могут захватить бюджетный сегмент
Intel	Battlemage, Celestial архитектуры	Как показал наш тест Intel Arc, драйверы убивают всё	Если починят софт — станут реальной альтернативой
Groq & другие	Специализированные AI-ускорители	Дорого, сложно для домашнего использования	Нишевое решение для энтузиастов

AMD особенно интересна: если они смогут наконец-то довести до ума ROCm и оптимизировать поддержку в llama.cpp, их карты с 16-24 ГБ VRAM по доступной цене могут стать спасением. Но пока что, честно говоря, каждый раз когда я пробую запустить что-то на AMD, вспоминаю все матерные слова которые знаю.

Профессиональный сегмент: единственный путь вперёд?

NVIDIA явно показывает направление: хотите самые новые технологии — покупайте профессиональные карты. Blackwell Pro 6000 уже здесь, с её рекордными 192 ГБ HBM3e памяти. Проблема одна: цена. За $10-15k вы получаете возможности, которые игровым картам даже не снились.

Но вот что интересно: даже профессиональный сегмент замедляется. Между релизами Quadro/RTX Pro теперь тоже больше времени. NVIDIA сосредоточена на чипах для дата-центров (B100, B200, GB200), которые приносят 80% прибыли. Потребительское железо стало побочным продуктом.

Что делать энтузиастам локальных LLM?

План на ближайшие три года:

Не спешите продавать текущие карты. RTX 4090, 4080 Super, 4070 Ti Super — это теперь долгосрочные инвестиции. Особенно модели с большим VRAM.
Изучайте альтернативы. Да, AMD пока не идеальна, но к 2027 году ситуация может измениться. Следите за Battlemage от Intel.
Рассматривайте профессиональные карты предыдущего поколения. RTX A6000 (48 ГБ) или даже A100 (40/80 ГБ) на вторичном рынке могут стать выгодной покупкой.
Оптимизируйте, оптимизируйте, оптимизируйте. Без новых аппаратных апгрейдов единственный путь — лучшее использование того что есть. Изучайте новые форматы квантования, оптимизации через TensorRT, эффективное распределение слоев моделей.

Прогноз: К 2028 году мы увидим две крайности: с одной стороны — сверхоптимизированные маленькие модели (3-7B параметров), которые работают на чем угодно. С другой — гигантские модели (200B+), доступные только в облаке или на серверном железе за $50k+. Средний сегмент (30-70B параметров), который сейчас самый популярный, может пострадать больше всего.

Серебряная подкладка: софт догоняет железо

Есть и хорошие новости. Пока железо стоит на месте, софт развивается семимильными шагами. За последний год мы увидели:

EXL2 квантование — сжатие моделей с минимальной потерей качества
Улучшенную поддержку много-GPU конфигураций в llama.cpp
TensorRT-LLM от NVIDIA — серьезный прирост скорости на том же железе
Новые форматы хранения моделей (Safetensors, GGUF v3)

Возможно, эти три года застоя в железе станут временем золотого века оптимизаций. Когда нельзя просто купить новую карту и решить проблему, приходится думать.

Итог: готовьтесь к долгой зиме

2026-2028 годы будут временем консолидации, а не прорывов. Ваша текущая сборка — это то, с чем придется жить ближайшие три года. NVIDIA сделала выбор в пользу прибыли от дата-центров, и потребители расплачиваются за это замедлением прогресса.

Но это не конец локальных LLM. Это просто новый вызов. Вместо того чтобы ждать следующего релиза RTX, сообществу придется стать умнее: лучше оптимизировать код, эффективнее использовать память, разрабатывать новые техники квантования. И кто знает — возможно, именно эта пауза даст шанс AMD, Intel или даже совершенно новым игрокам войти на рынок.

Лично я уже присматриваюсь к сборкам с двумя RTX 3090 через NVLink. Потому что если новых карт не будет, придется комбинировать старые. Железный век локального AI продолжается — просто стал немного медленнее.

NVIDIA замедляет релизы игровых карт: что ждет локальные LLM в 2026-2028?