Публикация AiManual

GMKtec EVO-X3 mini PC: сможет ли эта кроха запустить локальные LLM? Разбор характеристик и ожидания от реальной производительности

Разбираем, способен ли GMKtec EVO-X3 с Ryzen AI MAX+ 495 и 192 ГБ ОЗУ запускать современные локальные LLM. Анализ OCuLink, eGPU, практические оценки.

5 мин чтения 07.06.2026

Коротко

Что будет в материале

01
Маленький корпус, большие аппетиты
02
Что внутри: сухие цифры и жирные возможности
03
Какие LLM потянет EVO-X3 без внешней карты?
04
OCuLink — это не роскошь, а необходимость

Маленький корпус, большие аппетиты

GMKtec EVO-X3 — это не очередной офисный кубик для «Ворда» и браузера. Производитель заявляет, что новинка способна тянуть локальные LLM. Звучит как оксюморон: карманный ПК и тяжелая нейросеть. Но давайте разберемся, что на самом деле под капотом.

Сердце девайса — AMD Ryzen AI MAX+ 495. Это не просто APU, а настоящий гибрид с мощным нейронным процессором (NPU) до 55 TOPS. Но для LLM важнее другое: поддержка до 192 ГБ оперативной памяти LPDDR5X-8000. Да, в мини-ПК можно воткнуть 192 ГБ. Это уже серьезная заявка. Ведь именно объем ОЗУ часто становится узким местом при запуске больших моделей на потребительском железе.

Но хватит цифр. Вопрос в другом: как быстро эта кроха будет генерировать токены на реальных моделях? Сразу оговоримся — независимых бенчмарков пока нет, но мы можем сделать прикидки, опираясь на спецификации и опыт с похожими конфигурациями.

📌 Важно: все оценки производительности основаны на анализе характеристик и косвенных данных. Первые реальные тесты ожидаются в ближайшие недели.

Что внутри: сухие цифры и жирные возможности

Ryzen AI MAX+ 495 использует архитектуру Zen 5 (8 ядер / 16 потоков) и встроенную графику RDNA 3.5 с 16 вычислительными блоками. Но для AI-нагрузок ключевую роль играет не только GPU, но и общая пропускная способность памяти: 256-битная шина LPDDR5X-8000 дает около 256 ГБ/с. Это сравнимо с младшими дискретными видеокартами. Например, RTX 4060 имеет пропускную способность около 272 ГБ/с. Разница не катастрофическая.

Однако есть нюанс: видеопамять. В iGPU нет выделенной VRAM. LLM используют unified memory — это значит, что модель целиком загружается в ОЗУ, и процессор с графикой делят один пул. Для инференса это не так критично, но для тренировок (Fine-tuning) — практически беда. Впрочем, для запуска готовых моделей в формате GGUF или AWQ это даже удобно: не нужно следить за утечками VRAM.

А вот что действительно выделяет EVO-X3 — это OCuLink. Разъем позволяет подключить внешнюю видеокарту напрямую через PCIe 4.0 x4 (или даже x8 через адаптер). Это не USB4/Thunderbolt с их потерями. Мы уже видели, что eGPU через OCuLink даёт прирост производительности до 15-20% по сравнению с Thunderbolt. Так что владельцы EVO-X3 могут легко превратить его в полноценную AI-станцию, прицепив, скажем, Radeon RX 7900 XTX или даже пару карт через док-станцию. А если бюджет ограничен — пара RTX 3090 за копейки всё ещё актуальна.

Какие LLM потянет EVO-X3 без внешней карты?

Давайте прикинем. Для комфортной работы с квантизированными моделями (4-bit GGUF) нужно примерно 3-4 ГБ на каждые 1 млрд параметров. 192 ГБ ОЗУ — это огромный запас. Теоретически, можно загрузить модель до 40-50 млрд параметров в 4-bit, а то и 70B в 3-bit. Но загвоздка в скорости: встроенная графика RDNA 3.5 не имеет тензорных ядер, и инференс будет идти только через шейдеры (compute shaders) или CPU. По оптимистичным оценкам, скорость генерации для модели 7B может составить 5-10 токенов/с, а для 30B — 1-2 токена/с. Это медленно, но для асинхронных задач — сойдет.

Сравните: Mac с M3 Max показывает около 15-20 токенов/с на той же модели 7B в 4-bit. Но у EVO-X3 есть козырь — OCuLink. С подключенной RTX 4090 производительность взлетит до 50+ токенов/с на 7B и до 15-20 на 70B. И это уже уровень профессиональной рабочей станции.

Важно: модели, которые выходят сегодня, например, из списка лучших локальных LLM апреля 2026 (Qwen3.5, Gemma4, GLM-5.1), требуют всё больше памяти. Qwen3.5-32B в 4-bit занимает около 18 ГБ. EVO-X3 с 192 ГБ легко вместит несколько таких моделей одновременно. А если добавить eGPU, то можно запускать даже MoE-гиганты, вроде MiniMax-M2.5 230B, о котором мы писали в эксперименте с Mac M3 Max.

OCuLink — это не роскошь, а необходимость

Главная фишка EVO-X3 — именно внешнее подключение GPU. Обычно в мини-ПК для AI ставят один слот M.2 под диск, а OCuLink отсутствует. Здесь же — полноценный порт. Причем, в отличие от Thunderbolt 4, OCuLink даёт прямой доступ к PCIe, без преобразования протоколов. Да, потери всё равно есть (10-15% из-за ограничения x4), но это намного лучше, чем 20-30% у TB4.

Кстати, для сборки мини-ПК с 68 ГБ VRAM своими руками требуется гораздо больше танцев с бубном. EVO-X3 — коробочное решение, которое сразу даёт много ОЗУ и гибкость апгрейда.

Сколько это стоит? И стоит ли?

Цена пока не объявлена, но по слухам — около 800-1000 долларов за версию с 32 ГБ ОЗУ. За 192 ГБ придётся доплатить. Даже в минимальной конфигурации это дороже, чем, скажем, Beelink SER9 с Ryzen AI 9 370. Но там нет OCuLink, а ОЗУ ограничена 64 ГБ. Для локального AI разница колоссальная.

Кому это нужно? Тем, кто не хочет собирать громоздкий ПК с кучей проводов, но при этом хочет запускать большие модели локально. Или тем, кто хочет иметь компактный сервер для инференса, а для тренировок — подключать eGPU. ASUS GX10 — альтернатива, но она дороже и больше.

💡

Итог: GMKtec EVO-X3 — это, пожалуй, самый компактный способ получить до 192 ГБ unified memory для LLM. Да, без внешней карты производительность средняя, но с OCuLink — это фактически портативная AI-станция. Ждём независимых тестов, но уже сейчас понятно: это не игрушка, а серьёзный инструмент для локального AI.

Совет: если вы решили брать — не экономьте на ОЗУ. Именно объём памяти определяет, какие модели вы сможете запускать. А eGPU можно докупить позже. И не забывайте про актуальные модели: Qwen3.5, Gemma4, GLM-5.1 — они отлично квантизируются и работают на этом железе.

Подписаться на канал