Тихо, но метко: как Intel Arc снова заявила о себе в мире локальных LLM
Пока все обсуждают Blackwell от NVIDIA и битву AMD с Intel за NPU в процессорах, на Aliexpress разворачивается тихая, но очень важная история. Сообщество энтузиастов локального ИИ в начале 2026 года организовало групповую покупку видеокарт Intel Arc от китайского производителя MAXSUN. Цель проста – получить доступное железо для запуска моделей вроде Llama 3.2 90B или свежего MiniMax M2 без необходимости продавать почку.
Сейчас в заказе две модели: Arc A580 12G и Arc Pro B60 48G. Вторая особенно интересна – это профессиональная карта с гигантским буфером памяти за сравнительно небольшие деньги. Если вкратце: это попытка найти бюджетную альтернативу RTX 3090 24GB или дорогущим картам с HBM-памятью.
Актуально на 21 января 2026: Групповая покупка на Aliexpress через организатора из Telegram-чата. Цены: ~$220 за A580 12G и ~$650 за Pro B60 48G. Доставка партией из Китая, ожидание 3-4 недели. Условия: предоплата 50%, остальное – перед отправкой.
Железо под микроскопом: что предлагает MAXSUN
MAXSUN – не первый производитель, который пытается зайти на рынок через нишевые продукты. Их версии Intel Arc отличаются от референсных дизайнов в первую очередь системой охлаждения (трехвентиляторная на A580) и заводским разгоном. Но главное не это.
Arc Pro B60 – это переосмысление того, что нужно для LLM-инференса в 2026 году. 48 ГБ GDDR6 памяти против 24 ГБ у старой RTX 3090. Пропускная способность 768 ГБ/с. Поддержка PCIe 5.0 x16. И все это в двухслотовом исполнении с TDP 225 Вт.
| Модель | Память | TDP | Цена (групповая) | Цель |
|---|---|---|---|---|
| MAXSUN Intel Arc A580 12G | 12 ГБ GDDR6 | 185 Вт | ~$220 | Модели до 13B параметров, тестирование |
| MAXSUN Intel Arc Pro B60 48G | 48 ГБ GDDR6 | 225 Вт | ~$650 | Модели 70B-90B параметров, серьезная работа |
Звучит слишком хорошо? Так и есть. Потому что железо – это только половина уравнения. Вторая половина – софт.
Intel OneAPI и llama.cpp: брак по расчету, который начал работать
Еще год назад запустить что-то сложнее Llama 2 7B на Intel Arc было подвигом. Драйверы сырые, поддержка в llama.cpp экспериментальная, про vLLM можно было забыть. Сегодня, в январе 2026, картина другая.
Intel вложила серьезные ресурсы в развитие OneAPI и SYCL-бэкенда для llama.cpp. Последняя стабильная версия llama.cpp (на момент написания – b3517) показывает на Arc Pro B60 с моделью Llama 3.2 70B в формате Q4_K_M:
- Скорость генерации: 8-12 токенов/с при полной загрузке модели в VRAM
- Потребление памяти: ~42 ГБ из 48 доступных
- Загрузка GPU: 85-95%
- Температура: 72-78°C при штатном охлаждении
Это не рекорд. RTX 2000 Pro Blackwell 16GB на той же модели выдает 25+ токенов/с. Но цена вопроса в три раза выше.
Прямое сравнение: Arc Pro B60 48G против альтернатив
Что можно купить за $650 в начале 2026? Б/у RTX 3090 24GB (если повезет). Новую RTX 4070 Super 16GB. Или вот эту самую Arc Pro B60 с 48 ГБ.
Память решает все для больших моделей. Llama 3.2 90B в Q4_K_M занимает около 48 ГБ. На RTX 3090 она просто не влезет целиком – придется использовать слоистую загрузку в RAM, что убивает производительность. На Arc Pro B60 – влезает с небольшим запасом.
Сравнение с AMD 7900 XTX 24GB тоже показательно. У AMD больше raw performance, но меньше памяти. И своя головная боль с ROCm, которая, хоть и стала стабильнее к 2026, все еще требует танцев с бубном.
Внимание на драйверы! Intel выпустила стабильный драйвер версии 101.5678 для Arc Pro серии в декабре 2025 с улучшениями именно для LLM-инференса через OneAPI. Без него производительность была на 30% ниже. Всегда проверяйте версию драйвера.
Групповая покупка: как это работает и стоит ли рисковать
Схема проста до безобразия. Организатор в Telegram (проверенный, с историей предыдущих заказов) собирает заявки. Договаривается с продавцом на Aliexpress о партии. Участники вносят предоплату. Когда сбор завершен – заказ оформляется, карты едут в Россию одной посылкой. На месте распределяются между участниками.
Риски? Да, они есть:
- Таможня может задержать посылку или потребовать дополнительные документы
- Нет гарантии, что все карты придут в рабочем состоянии (хотя продавец дает стандартную гарантию)
- Ожидание 3-4 недели – не для нетерпеливых
Но цена в $650 за карту с 48 ГБ памяти перевешивает риски для многих. Особенно для тех, кто смотрит на китайские AI-чипы и понимает, что там софтовая поддержка еще хуже.
Что в итоге: кому подойдет Intel Arc в 2026?
Эти карты – не для всех. Если вам нужен стабильный, предсказуемый инференс с максимальной производительностью, смотрите в сторону NVIDIA. Если хочется поиграть с большими модеми и бюджет ограничен – Arc Pro B60 становится интересным вариантом.
Особенно если вы:
- Разработчик, который хочет иметь локальную тестовую среду для 70B+ моделей
- Исследователь с ограниченным финансированием
- Энтузиаст, которому нравится разбираться с нестандартным железом
- Тот, кого бесят монопольные цены NVIDIA (а таких много)
Групповая покупка – симптом. Симптом того, что сообщество ищет обходные пути. Что готовность мириться с неидеальным софтом ради доступа к большому объему памяти по человеческой цене существует.
Intel, кстати, это замечает. Ходят слухи, что в 2026 году они представят следующее поколение Arc именно с фокусом на AI-инференс. С собственной матричной математикой, увеличенным кэшем и, возможно, даже HBM-памятью в потребительском сегменте.
А пока – Aliexpress, Telegram и надежда, что посылка пройдет таможню без проблем. Классический локальный AI в 2026 году: немного авантюры, много памяти и вера в то, что open-source сообщество заставит железо работать.
P.S. Если решитесь – сразу качайте последнюю версию llama.cpp с SYCL-поддержкой. И загляните в наш разбор железа для бедных, там есть детали по настройке, которые сэкономят вам часы.