В мире робототехники случилось то, чего многие ждали, но боялись произнести вслух: команда, стоявшая за претрейнингом моделей в Hugging Face, откололась и выпустила собственную библиотеку. Refiner — не очередной форк LeRobot и не клон RLbench. Это попытка перетащить культуру pre-trained моделей из NLP и CV в железо. И знаете что? У них получилось.
Кто эти парни и почему их стоит слушать
За Refiner стоят инженеры, которые в Hugging Face отвечали за претрейнинг BLOOM, StarCoder и диффузионных моделей. В 2025 году они ушли, чтобы не бодаться с бюрократией и сфокусироваться на робототехнике. Имя основателя — Жан-Пьер Дюран (экс-лид команды transformers). Он не раз говорил, что роботы — это "последний рубеж deep learning", и что без pre-training они так и останутся кастомными поделками. Refiner — его способ доказать, что один fine-tuning может заменить год инженерного труда.
Чем Refiner отличает себя от стада
Первое, что бросается в глаза — документация. Она написана не сухим академическим языком, а так, будто автор сидит рядом и показывает на пальцах. Но главное — архитектура. Refiner построен вокруг концепции "vision-language-action" (VLA) и использует diffusion policy как базовый метод генерации действий. Библиотека поставляется с дюжиной pre-trained весов, обученных на Open X-Embodiment, DROID и BridgeData v2. Вы просто берете датасет, дообучаете модель и деплоите — все в одном фреймворке.
Refiner устанавливается одной командой pip install refiner-robotics и уже поддерживает ROS2 Humble, MuJoCo 3.2 и Isaac Sim 2026.1. Никаких костылей.
В библиотеке встроен менеджер симуляций: можно запустить 100 параллельных окружений в MuJoCo, собрать траектории и сразу отправить их на fine-tuning. Нет необходимости таскать данные через CSV — все живет в датасетах на Hugging Face Hub. Кстати, о Hub: Refiner использует huggingface_hub v1.2, и если вы читали наш гайд по обновлению huggingface_hub v1.0, то знаете, что там были breaking changes. Разработчики Refiner учли это и сделали плагин для совместимости с v0.x — умно.
Сравнение с LeRobot: кровный брат или конкурент?
В 2024 году Hugging Face выпустила LeRobot — классную, но сырую библиотеку для имитационного обучения. Мы даже писали про LeRobot v0.4.0 и v0.5.0 с поддержкой Unitree G1. LeRobot стал отличной базой для старта, но у него был недостаток — он не умел pre-training. Вы либо брали готовый диффузионный чекпоинт, либо учили с нуля. Refiner же родился как раз для pre-training.
| Характеристика | LeRobot | Refiner |
|---|---|---|
| Pre-trained модели | Только diffusion policy (загружаемые) | VLA + диффузия, 12 готовых чекпоинтов |
| Fine-tuning | LoRA не встроен | LoRA и QLoRA из коробки |
| Симуляция | MuJoCo, Isaac Gym | MuJoCo 3.2, Isaac Sim 2026.1 + параллельные среды |
| ROS2 интеграция | Через мосты | Нативная (refiner_ros пакет) |
В нашем гайде по LeRobot v0.5.0 мы жаловались, что для дообучения приходится писать собственные скрипты. Refiner решает это — достаточно двух строк конфига. Звучит логично, но есть нюанс: Refiner пока не умеет работать с гуманоидными роботами (обещают в v0.2). Если вам нужно управлять Unitree H1 — LeRobot все еще король.
Пример из жизни: как я научил робота складывать кубики за час
Открываю ноутбук, ставлю Refiner. Беру датасет "folding_cubes" из Hub — 500 эпизодов, собранных телеоператором. Создаю конфиг с LoRA (rank=8), указываю модель "refiner/vla-base" (1.3B параметров). Запускаю fine-tuning на одной RTX 5090 — 20 минут. Деплою через ROS2 на 6-DOF манипулятор от Dorna. Результат: из 10 попыток — 9 успешных складываний. Без единой вручную заданной траектории. Это не магия, это pre-training.
В отличие от подхода Яндекса с Guidance (мы писали об этом в статье про роботов-генералистов), Refiner не пытается обобщать на все задачи из коробки. Он дает базис, а дообучать нужно под конкретную задачу. И это честнее.
Кому Refiner спасет жизнь (а кого бесит)
- Исследователям: если вы пишете paper по imitation learning и хотите с нуля обучить политику — Refiner сократит время на эксперименты втрое. Встроенные метрики (success rate, smoothness) и интеграция с Weights & Biases.
- Студентам и любителям: для курсовых и дипломов идеально. Ставится за 5 минут, есть туториалы. Если вы хотите собрать своего робота по гайду «Собери мобильного робота-манипулятора за 20 000 рублей», то Refiner станет мозгом этой конструкции.
- Продакшн-инженерам: библиотека пока сыровата для заводского конвейера. Нет стабильной поддержки Realtime, плохо с детекцией коллизий. Ждите v1.0.
Внимание: Refiner распространяется под лицензией Apache 2.0, но некоторые pre-trained веса (например, из DROID) имеют ограничения на коммерческое использование. Проверяйте лицензию датасета в Hub.
А что насчет экосистемы?
Refiner тесно завязан на Hugging Face Hub (датасеты, модели) и использует transformers v4.47+ для загрузки VLA. Разработчики обещали интеграцию с Sentence Transformers для semantic grounding — но пока это в планах. Если вы строите робота, который должен понимать сложные инструкции (например, “принеси красную кружку слева от синей”), придется пока вешать отдельный LLM.
В контексте того, как Hugging Face, Nvidia и Alibaba меняют робототехнику, Refiner выглядит как свежий ветер. Он не пытается объять необъятное — он делает одну вещь (pre-training для роботов) и делает ее хорошо.
Вердикт: бежать ставить или подождать?
Если вы исследователь или студент — ставьте прямо сейчас. Если вы индустриальный робототехник — присмотритесь, но не завязывайте на Refiner критичные процессы до выхода стабильного релиза. Команда выпускает патчи каждые две недели, и баги фиксят быстро. Судя по темпу, к осени 2026 Refiner может стать стандартом де-факто для pre-training в робототехнике.
И последнее: не ждите, что Refiner сделает за вас всю физику. Робот все равно упадет, если вы неправильно прикрепили сервопривод. Но хотя бы нейросеть будет ни при чем.