HRM-Text 1B за $1000 обходит Llama 3.2 3B: разбор

Хватит мечтать о H100. Теперь маленькая модель за тысячу баксов уделывает трёхмиллиардника от Meta. Знакомьтесь — HRM-Text 1B.

В мире LLM размер имеет значение? Не всегда. 19 мая 2026 года команда исследователей опубликовала модель, которая заставит вас пересмотреть бюджет на AI. HRM-Text 1B — это 1.3 миллиарда параметров (да, не совсем 1B, но так назвали). Обучена на 40 миллиардах токенов. Стоимость всего обучения — $1000. И она бьёт Llama 3.2 3B по ключевым бенчмаркам.

Бенчмарк	HRM-Text 1B	Llama 3.2 3B
MATH	32.4	24.8
DROP (F1)	71.2	63.5
MMLU	58.1	56.9

Как им это удалось? Тут сработал принцип «качество данных важнее количества». Датасет HRM (High Resource Math) — это не просто очередная свалка из интернета. Разработчики тщательно отфильтровали 40B токенов, сфокусировались на математике, логике и чтении с пониманием. Архитектура — улучшенный Transformer с продвинутой активацией, которая выжимает максимум из каждого параметра. Для обучения хватило одного GPU L40S за $0.99/час — арендовать такой можно на Vast.ai.

Сравнение с трёхмиллиардной Llama 3.2 — не просто победа, а разгром. Особенно в математике (MATH) и понимании сложных текстов (DROP). При этом HRM-Text 1B весит в разы меньше и работает на CPU. Мы уже показывали, как Llama 3.2 1B и 3B работают на обычном Intel без видеокарты — HRM-Text 1B будет ещё быстрее.

Хотите повторить успех? Обратите внимание на принципы Nanollama — там тоже учат маленькую модель за полчаса. Разница — в датасете и настройках. HRM-Text 1B показывает: не нужно гнаться за гигантами. Иногда лучше собрать качественный датасет на 40B токенов, чем швырять миллиарды долларов в обучение 70B-моделей. Кстати, в нашем обзоре GLM4.7 + CC мы подсчитывали экономию — там та же логика: маленькое и эффективное бьёт большое и дорогое.

Где применять HRM-Text 1B? Идеальный сценарий — интеллектуальные чат-боты на периферии, локальные ассистенты, обработка документов в офлайне. Загрузите модель на ноутбук, дообучите под свою базу знаний — и получите корпоративного помощника, который не требует интернета и не сливает данные в облако. Если сравнить с Tiny Aya (3.35B, 70 языков), то HRM-Text 1B уступает в мультиязычности, но выигрывает в специализированных задачах на английском и математике.

В итоге — модель за $1000, которая положила на лопатки Llama 3.2 3B. Разработчики подчеркивают: это только начало. Планируется версия с 256K контекстом и мультимодальностью. Я ставлю на то, что уже через год модели 1B станут стандартом для edge-устройств, а HRM-Text 1B войдёт в историю как первый ласточка. Хотите быть впереди — скачивайте веса с Hugging Face и пробуйте прямо сейчас. Не ждите, пока big tech разродится очередным «убийцей» — убийца уже здесь, и он стоит тысячу баксов.

Подписаться на канал

Как маленькая модель за $1000 обходит Llama 3.2 3B: разбор HRM-Text 1B

Подписывайтесь на наш канал!