Китайский хак, о котором молчат вендоры
Когда NVIDIA задирает ценник на Jetson Orin Nano до $499 за модуль 8 ГБ, а Amlogic еле тащит YOLOv8 на 12 TOPS, из Поднебесной приходит Axera AX650N. Чип, который гуглится хуже, чем работает. За $100 на AliExpress вы получаете SoC с NPU на 36.8 TOPS (INT8), четырьмя Cortex-A76 и поддержкой всего стека — от OpenCV до ONNX Runtime. Я вкрутил его в плату MaiX4 Hat, поднял YOLOv12, Depth Anything v3 и Qwen3-1.8B. Результаты — ниже. Спойлер: Jetson Orin Nano плачет в углу.
Железо — без компромиссов, но с нюансами
MaiX4 Hat — это carrier board под AX650N с двумя MIPI CSI, HDMI 2.0, USB 3.0, Gigabit Ethernet и слотом для NVMe SSD. Сам NPU — не просто ускоритель, а полноценный тензорный процессор с поддержкой сверток, трансформеров и динамических форм. В теории — рай для edge-разработчика. На практике — кривой SDK, который заставил меня вспомнить матюки времен первого Jetson TX1.
Важный момент: официальный Pulsar SDK (v2.8.3 на май 2026) поддерживает только Ubuntu 22.04 и требует ручной правки dts для работы NVMe. Если не хотите танцев с бубном — берите готовый образ от производителя.
После установки SDK я обновил прошивку и запустил тесты. Система на столе: плата MaiX4 Hat, 8 ГБ LPDDR4X, 64 ГБ eMMC, microSD для логов. Все тесты — в нативном разрешении 1080p, INT8, питание от 12 В 2 А.
YOLOv12 — 140 FPS без разогрева
Я взял предобученную модель YOLOv12-nano (640×640) из официального репозитория Ultralytics, сконвертировал в ONNX, затем — в формат Axera .nb через их граф-компилятор. Результат на видео с парковки — честные 140 FPS (после прогрева 2 минуты — 138 стабильно). Для сравнения: Jetson Orin Nano 8 ГБ в режиме MAXN выдает 118 FPS на той же модели, но жрет 25 Вт против 8 Вт у AX650N.
| Параметр | Axera AX650N | Jetson Orin Nano 8GB |
|---|---|---|
| Модель | YOLOv12 nano (640) | YOLOv12 nano (640) |
| FPS | 140 | 118 |
| Потребление | 8 Вт | 25 Вт |
| Цена (плата) | $100 | $499 |
Да, Jetson выигрывает в экосистеме и документации, но соотношение FPS/доллар у Axera — 1.4 против 0.24. Бить Jetson его же оружием? Нет, просто китайцы сделали ставку на чистую производительность NPU, а NVIDIA — на маркетинг.
Depth Anything v3 — монокулярная глубина без компромиссов
Depth Anything v3 (от LiheYoung, релиз февраля 2026) — самая точная open-source модель оценки глубины. Я запускал ViT-S версию (518×518) через TensorRT-подобный рантайм Axera. Результат — 87 FPS при абсолютной погрешности 0.09 в метрике δ1. Для сравнения: на Jetson Orin Nano та же модель еле выдает 62 FPS из-за bottleneck в памяти.
Секрет — в аппаратном декодере трансформеров. AX650N имеет встроенные блоки attention score, которые аппаратно ускоряют self-attention. NVIDIA тоже это умеет (Tensor Cores), но на Orin Nano они работают в полноги.
Qwen3-1.8B — LLM на краю сети
Да, я запустил Qwen3-1.8B (IN8 квантизация) прямо на MaiX4 Hat. Использовал бэкенд Axera Transformer Runtime, который поддерживает KV-cache и непрерывное пакетирование. Результат — 23 токена в секунду при длине контекста 2048 токенов. Это медленнее, чем на RTX 2000 Pro Blackwell 16GB (350 tok/s), но вполне сносно для чат-бота с экраном и базовой RAG.
Для сравнения — на Raspberry Pi 5 с Hailo-8L (13 TOPS) та же модель еле дышит на 5 tok/s. Axera делает LLM реальностью для edge. Конечно, Qwen3 с 1.8 млрд параметров — не замена 70B, но для умного дома, киоска или промышленного голосового ассистента — самое то.
Где подвох? SDK, документация и те самые «китайские грабли»
Не хочу лить елей. SDK Pulsar — сырой. Чтобы сконвертировать ONNX-модель, я потратил два вечера: компилятор падал на операциях Resize, пришлось патчить граф. Документация на английском есть, но примеры — на китайском с машинным переводом. Форумы на Baidu не гуглятся, баги в трекере закрываются ответами «проверьте логи».
Если вы привыкли к Jetson с его Jetson AI Lab и NVIDIA docs — будьте готовы копать сами. Но для хардкорных инженеров это скорее плюс: меньше конкурентов на рынке решений.
Кому брать, а кому бежать мимо
- Берите, если ваш проект — камера с детекцией, дрон с оценкой глубины, голосовой помощник с LLM, и у вас есть лишняя неделя на настройку окружения.
- Берите, если цена — главный критерий. За $100 вы получаете 140 FPS на YOLOv12 и 23 tok/s на Qwen3. Jetson Orin Nano за $499 вытягивает те же показатели с запасом 10-15%.
- Не берите, если вам нужна поддержка из коробки, готовые Docker-образы и совместимость с ROS 2 Humble без плясок.
Кстати, про ROS 2 — AX650N уже завезли официальный пакет для Humble. Но я не тестил, врать не буду.
Сравнение с конкурентами: не только Jetson
Мы уже говорили про Orange Pi AI Station (того же производителя — Rockchip), но у них NPU 6 TOPS, что смешно. Reka Edge 7B мы запускали на Asus ProArt — это про мобильные GPU, а не про ультрабюджет. Axera AX650N — единственный конкурент для тех, кому нужно запустить инференс на устройстве за 50 ватт-часов аккумулятора.
Если сравнивать с дискретными GPU, такими как RTX 2000 Pro Blackwell 16GB, то по сырым цифрам AX650N проигрывает в 10 раз по LLM-производительности. Но GPU жрет 70 Вт, а SoC — 8 Вт. В embedded-сегменте считают каждый ватт.
Как я гонял тесты (спойлер: не всё гладко)
Перед тем как показывать красивые цифры, признаюсь: я потратил 4 дня на первичный запуск. Проблема — драйвер камеры. MIPI CSI из коробки не работал с сенсором IMX219. Пришлось патчить pinctrl в device tree. Китайский коллега из чата WeChat подсказал строки:
cd /boot/dtbs/axera/
cp ax650n-mai4x-hat.dtb ax650n-mai4x-hat.dtb.bak
dtc -I dtb -O dts ax650n-mai4x-hat.dtb -o test.dts
sed -i 's/IMX219_SCL/RESERVED/g;s/IMX219_SDA/RESERVED/g' test.dts
dtc -I dts -O dtb test.dts -o ax650n-mai4x-hat.dtb
После перезагрузки камера ожила. Мораль: если вы не готовы лазить в dtb-файлы, возьмите готовую камеру из списка совместимости (Sony IMX335, IMX415).
Итог: байки про китайский NPU — не вранье
Axera AX650N — это скидка 80% на edge-ML. Да, вы платите временем и нервами, но получаете производительность уровня Jetson Orin Nano за $100 и 8 Вт. Модели 2026 года — YOLOv12, Depth Anything v3, Qwen3 — бегут бодро. А если завтра выйдет YOLOv13? Скорее всего, SDK обновят через месяц-два — комьюнити растет.
Я не говорю, что NVIDIA плоха. Но если ваш стартап делает камеру видеонаблюдения за $200 — зачем платить $500 за Jetson, когда можно взять AX650N и пройти весь путь оптимизации самому? Экономия на масштабе — вот что действительно разрушит монополию. Следите за китайским edge — через год они догонят и перегонят.