Когда процессор становится быстрее видеокарты
Представьте: вы запускаете Llama 3 70B в 16-битном формате на процессоре, который стоит как RTX 4090, но без видеокарты. Звучит как фантастика? Утечка спецификаций Nvidia N1X говорит, что это может стать реальностью.
Согласно сливу из китайских соцсетей (да, опять они), Nvidia готовит монструозный процессор с 16-канальной DDR5. Суммарная пропускная способность — под 550 ГБ/с. Это почти как у RTX 4090, только без ограничения VRAM в 24 ГБ. В теории можно загрузить модель объемом 256 ГБ без квантования — и работать с контекстом в миллион токенов.
Важно: это утечка, а не официальный анонс. N1X может быть ARM-процессором для серверов или частью линейки Grace Hopper. Однако характеристики выглядят правдоподобно — Nvidia уже не раз показывала, что может обойти Intel и AMD в многоканальной памяти.
16 каналов DDR5: что это значит для AI-энтузиастов
Сейчас стандартный десктопный CPU поддерживает 2 канала памяти. Даже топовые Threadripper — 4 канала. N1X предлагает 16 каналов. При частоте DDR5-6400 это даёт ~819 ГБ/с в идеале, но утечка говорит о реальных 550-600 ГБ/с. Этого хватит, чтобы кормить модель в 70B параметров без узкого горлышка.
Главный бенефит — вы перестаёте быть заложником VRAM. Вместо того чтобы выбирать между RTX Pro 6000 за $7000 или RTX 4090 с её 24 ГБ, вы покупаете один процессор и горы оперативки. 128 ГБ DDR5-6400 стоит около $300, а не $6000. И это не шутка.
Но есть нюанс: CPU инференс медленнее GPU. Даже с такой пропускной способностью, N1X будет проигрывать в скорости генерации токенов. Зато сможет держать огромные батчи и контексты. Для задач, где важна точность, а не скорость (RAG, анализ документов), это идеально.
Как N1X меняет правила сборки домашнего AI-сервера
Раньше, чтобы запустить модель 70B в хорошем качестве, нужно было либо ставить две RTX 3090 с NVLink, либо брать профессиональную карту. N1X с 16 каналами DDR5 позволяет обойтись без GPU вообще. Достаточно материнской платы с поддержкой 16 слотов памяти (как у серверных платформ) и блока питания.
Конечно, для интерактивного чат-бота на 70B модель с 200 токенов/с GPU остаётся королём. Но для фоновой обработки данных, индексации или работы с контекстами в 100К+ токенов N1X может быть дешевле и удобнее. Особенно если учесть, что современные LLM требуют всё больше контекста.
Когда ждать и сколько просить?
Утечка указывает на 2027 год. N1X позиционируется как конкурент Intel Granite Rapids и AMD EPYC Turin. Цена, скорее всего, будет в районе $2000-3000 за процессор. Дорого для домашнего ПК, но дёшево для рабочей станции AI.
Для сравнения: сборка из двух RTX 5060 Ti стоит $1600, но даёт всего 32 ГБ VRAM. А N1X с 128 ГБ памяти обойдётся в $2300 за процессор + память. И вы сможете запустить Mixtral 8x22B без квантования, а не только 7B модели.
Скептики скажут: "CPU никогда не догонит GPU в инференсе". И будут правы. Но N1X не пытается догнать — он пытается обойти по объёму памяти. И если Nvidia реализует аппаратное ускорение для transformer-операций в самом процессоре (как Apple M4 Ultra), то разрыв в скорости сократится.
Я уже вижу сценарий: два N1X в одной системе, 32 канала DDR5, 256 ГБ памяти, и вы запускаете локальный кластер для обучения LoRA. Это может убить рынок десктопных GPU для AI, если Nvidia сама же не подрежет производительность драйверами. Но пока это только утечка.
Если N1X действительно выйдет, то уже в 2027 году мы увидим революцию в локальном AI — и, возможно, последние RTX 5090 уйдут в руки геймеров, а энтузиасты AI пересядут на "железо для бедных" — N1X с DDR5. Только не забудьте про вентиляцию: 16 планок памяти греются как печка.