Intel Crescent Island: Xe3P GPU + 160GB LPDDR5X для AI без HBM

160 ГБ на плате — это как?

В сети всплыла фотография печатной платы Intel с маркировкой "Crescent Island". Под восемью массивными радиаторами — не HBM, а привычная LPDDR5X. 160 гигабайт. На одном чипе. Комьюнити, которое привыкло, что для серьезного AI нужно стаскивать по четыре 4090 или покупать серверный H100, внезапно получило надежду: можно не танцевать с бубном вокруг дефицитного HBM, а просто взять больше дешевой универсальной памяти.

Утечка показывает восемь кристаллов Xe3P, окруженных 16 модулями LPDDR5X. Суммарно — 160 ГБ на частоте ~8.5 Гбит/с на контакт. Судя по разводке, контроллер памяти встроен прямо в GPU, без отдельного моста.

Звучит логично, но есть нюанс: LPDDR5X медленнее HBM по пропускной способности. Однако для инференса, где узким местом часто становится объем, а не скорость (модели 70B+ легко съедают 40+ ГБ), 160 ГБ — это жирный аргумент. Вы сможете держать в уме Llama-3-70B (q4) целиком, а не гонять ее через PCIe в стиле «сортировочная станция».

Почему HBM больше не нужен?

Дефицит HBM3e душит рынок: TSMC печатает, но не успевает, SK Hynix поднимает цены, а дата-центры скупают все стеки подряд. Мы уже писали, как IPO SK Hynix может повлиять на цены, и как TSMC называет спрос на AI-чипы «бесконечным». Intel, похоже, решила не стоять в очереди за HBM, а использовать то, чего на складах навалом — LPDDR5X. Примерно 30-40% от пропускной способности HBM, зато вчетверо дешевле и без бутылочного горлышка в цепочке поставок.

Это не первый заход Intel на территорию AI: Microsoft Maia 200 тоже использует собственную память, но у Microsoft это серверный чип с абстракциями. Crescent Island, судя по PCB, рассчитан на вставку в обычный серверный слот. Никакого водяного охлаждения, никаких NVLink — просто плата с PCIe Gen5 интерфейсом.

Intel играет в другую игру

Посмотрите на 100 самых популярных сборок на Hugging Face: там 65% используют один мощный GPU с 24+ ГБ. Остальные — multi-GPU. И те, и другие упираются либо в объем памяти, либо в межсоединения. Crescent Island с 160 ГБ на одной плате — это прямой удар по потребности в кластеризации. Хотите запустить Mixtral 8x22B или свежую MOE-модель от SK Hynix? Одна плата — и поехали.

Конечно, для тренировки это не годится — там без HBM высокого потолка не пробить. Но инференс, тонкий тюнинг и даже RAG — идеальная ниша. А учитывая, что NVIDIA Groq 3 переводит инференс на LPU, Intel не хочет отдавать и этот рынок. Crescent Island — их ответ на вопрос «а что, если сделать большую память на дешевых чипах?».

💡

По слухам, финальные спецификации Crescent Island появятся к Q4 2026, а первые образцы уже развозят партнерам. Цена? Если Intel уложится в $15-20k за карту — это перевернет рынок бюджетного AI-инференса.

Самое смешное: пока все говорили, что без HBM никуда, Intel тихо сделала ставку на самую массовую память в мире. LPDDR5X штампуют Samsung, Micron, SK Hynix — конкуренция высокая, цены низкие. Если Crescent Island взлетит, это может стать рецептом для всех: берите LPDDR, сыпьте побольше, забывайте про HBM. И тогда AI станет дешевле ровно настолько, насколько дешевле DRAM по сравнению со стековой памятью.

Но не обольщайтесь раньше времени: микрофлюидика охлаждает чипы в разы эффективнее, но 160 ГБ, упакованные рядом с GPU — это серьезный тепловой вызов. Intel придется решать, как не расплавить карту под нагрузкой. Если охлаждение будет шумным — в дата-центры не пропустят, если тихим — дорого.

Кому это нужно прямо сейчас

Тем, кто собирает локальные LLM-фермы. Вспомните AMD Strix Halo с 128 ГБ — там аплодировали, но это APU, а не выделенный GPU. Crescent Island — полноценный ускоритель с 160 ГБ на борту. Одна плата = 100+ токенов/с для Llama-3-70B. Две платы = запуск Falcon-180B без квантизации. Для исследовательских инференс-кластеров это может стать стандартом де-факто.

Intel, конечно, не обещает чудес. Xe3P — архитектура третьего поколения, и её реальная производительность в AI пока под вопросом. Но если утечка верна, а LPDDR5X действительно даст ~1.5 ТБ/с (8 каналов * 16 бит * 8.5 Гбит/с) — это уже уровень A100, только в 2-3 раза дешевле.

Прогноз: к концу 2026 года Intel может занять 10-15% рынка AI-инференс ускорителей просто за счет того, что не будет зависеть от HBM. Аналитики уже пересматривают прогнозы: оказывается, можно не ждать дефицит, а просто использовать то, что уже есть — и получать почти то же самое. Забавно, как индустрия обходит сама себя.

Подписаться на канал

Intel Crescent Island: утечка PCB с Xe3P GPU и 160 ГБ LPDDR5X — обход дефицита HBM для AI-инференса

160 ГБ на плате — это как?

Почему HBM больше не нужен?

Intel играет в другую игру

Кому это нужно прямо сейчас

Подписывайтесь на наш канал!