Карпати взламывает ANE: как autoresearch ускоряет исследования на MacBook

Если вы думали, что Apple Neural Engine - это просто для размытия фона в FaceTime, готовьтесь удивляться. Андрей Карпати, чье имя в машинном обучении звучит как 'биткойн' в крипте, выкатил инструмент, который заставляет ANE работать на полную. Autoresearch - это не очередная обертка над PyTorch, а система для автоматического исследования архитектур нейросетей. И она работает на вашем M3 MacBook так, будто у него встроен маленький NVIDIA A100.

💡

На 11 марта 2026 года реализация поддерживает последние версии MLX 2.3 и CoreML 5.2. Если вы все еще используете старые версии - вы в каменном веке. Динамические веса, которые меняются в ходе исследования, - ключевая фишка, снизившая val_loss с 6.1 до 3.55 в тестах Карпати.

Что внутри этого черного ящика?

Autoresearch - это не просто скрипт. Это целая методология, упакованная в репозиторий на GitHub. Система ищет оптимальные архитектуры нейросетей методом проб и ошибок, но делает это умнее, чем стандартный grid search. Динамические веса - это когда модель в ходе обучения решает, какие связи важнее, и перераспределяет вычислительные ресурсы. На бумаге звучит как магия, на практике - это просто очень умная математика, оптимизированная под аппаратные особенности ANE.

Внимание: ANE - не GPU. Здесь нет CUDA, нет tensor cores. Это специализированный блок для матричных операций, и если вы попытаетесь засунуть в него стандартный PyTorch-код, получите разочарование вместо ускорения. Autoresearch написан с учетом этих ограничений.

ANE против GPU: где быстрее?

Давайте начистоту: для тренировки GPT-5 400B параметров вам все равно понадобится кластер из H100. Но для исследований архитектур малых и средних моделей (до 10B параметров) ANE на M3 показывает неожиданные результаты. В тестах на задаче поиска оптимальной архитектуры для vision transformer авторы получили ускорение в 4.7 раза по сравнению с запуском на CPU M3 и в 1.8 раза по сравнению с использованием только GPU части Apple Silicon.

Платформа	Время одной итерации (сек)	Энергопотребление (Вт)	Примечание
ANE (M3 Max)	0.47	8-12	Лучший баланс
GPU (M3 Max)	0.85	15-20	Быстрее CPU, но жрет больше
CPU (M3 Max, 16-core)	2.21	25-30	Медленно и горячо
NVIDIA RTX 4090 (для сравнения)	0.32	350-450	Быстрее, но требует отдельную электростанцию

Цифры говорят сами за себя. ANE эффективен для специфичных операций, которые преобладают в autoresearch. Если ваша работа связана с постоянными экспериментами над архитектурами моделей, как в проекте Orion для LLM, этот инструмент сэкономит вам дни вычислений.

А альтернативы? Конечно, есть

Google с своим AutoML, Microsoft с NNI, куча open-source решений на PyTorch и TensorFlow. Но все они заточены под облака или мощные GPU. Попробуйте запустить их на MacBook - услышите, как фанаты пытаются охладить ваш ноутбук. Autoresearch же изначально проектировался для edge-устройств. Он легкий, эффективный и не требует отправки данных в облако (что для некоторых исследовательских задач критически важно).

Есть и другие подходы к локальному ML на Mac, например, использование оптимальных локальных LLM через MLX. Но они решают другую задачу - инференс готовых моделей. Autoresearch - про создание и оптимизацию этих самых моделей.

💡

Сравнивать Autoresearch с облачными AutoML - все равно что сравнивать швейцарский армейский нож с промышленным станком. Один всегда с вами и решает 80% задач, второй мощнее, но требует инфраструктуры и бюджетов.

Кому это впишется в рабочий процесс?

Аспиранты и исследователи с ограниченным доступом к вычислительным кластерам. Ваш M3 MacBook превращается в персональную исследовательскую станцию.
Инженеры по ML в стартапах, где каждый доллар на облака на счету. Поиск оптимальной архитектуры перед масштабированием теперь не требует кредитной линии.
Любители экспериментов, которые хотят понять, как работают нейросети изнутри. Autoresearch - это как Lego для глубокого обучения.
Разработчики приложений для iOS/macOS, которым нужно оптимизировать модели под ANE для запуска на устройстве. Это прямой путь к пониманию, что будет хорошо работать на iPhone.

Если же ваша задача - тренировка огромных языковых моделей с контекстом в 1M токенов, вам все еще нужны серьезные железки. Например, MacBook Pro на M4 Max справится лучше благодаря увеличенному количеству ядер ANE и поддержке unified memory до 128GB. Но для него, кстати, autoresearch тоже оптимизирован.

Где собака зарыта? Подводные камни ANE

ANE - не панацея. Поддерживаются только определенные типы операций (в основном матричные умножения и свертки). Если ваш алгоритм требует сложной логики управления потоком данных, ANE может стать узким местом. Кроме того, отладка кода, работающего на ANE, - это отдельное искусство. Инструменты мониторинга и профилирования все еще отстают от того, что есть для CUDA.

И да, пока Apple не решит открыть документацию по ANE полностью (чего не случилось к 2026 году), разработчики вынуждены действовать методом reverse engineering. Именно поэтому реализации вроде Orion и Autoresearch от Карпати так ценны - они проделывают черновую работу за всех.

Что в итоге? Будущее за гибридными вычислениями

Autoresearch - не просто крутой инструмент. Это сигнал о том, как будет развиваться машинное обучение в следующие пять лет. Специализированные ускорители в потребительских устройствах, эффективные алгоритмы, которые не требуют мегаватт энергии. Скоро мы увидим, как подобные системы будут встроены в Xcode, помогая разработчикам автоматически оптимизировать нейросети для своих приложений.

А пока что, если у вас есть Mac с Apple Silicon (не обязательно последний M5 Pro или M5 Max), загляните в репозиторий Карпати. Даже если не будете использовать в продакшене, вы поймете, на что способна ваша железка за пределами Safari и Figma. И кто знает, возможно, именно ваш эксперимент на ANE приведет к прорыву в архитектуре следующей Stable Diffusion.

Подписаться на канал

Autoresearch на Apple Neural Engine: разбор реализации Karpathy и ускорение на M3 MacBook