Хватит мечтать о H100. Теперь маленькая модель за тысячу баксов уделывает трёхмиллиардника от Meta. Знакомьтесь — HRM-Text 1B.
В мире LLM размер имеет значение? Не всегда. 19 мая 2026 года команда исследователей опубликовала модель, которая заставит вас пересмотреть бюджет на AI. HRM-Text 1B — это 1.3 миллиарда параметров (да, не совсем 1B, но так назвали). Обучена на 40 миллиардах токенов. Стоимость всего обучения — $1000. И она бьёт Llama 3.2 3B по ключевым бенчмаркам.
| Бенчмарк | HRM-Text 1B | Llama 3.2 3B |
|---|---|---|
| MATH | 32.4 | 24.8 |
| DROP (F1) | 71.2 | 63.5 |
| MMLU | 58.1 | 56.9 |
Как им это удалось? Тут сработал принцип «качество данных важнее количества». Датасет HRM (High Resource Math) — это не просто очередная свалка из интернета. Разработчики тщательно отфильтровали 40B токенов, сфокусировались на математике, логике и чтении с пониманием. Архитектура — улучшенный Transformer с продвинутой активацией, которая выжимает максимум из каждого параметра. Для обучения хватило одного GPU L40S за $0.99/час — арендовать такой можно на Vast.ai.
Сравнение с трёхмиллиардной Llama 3.2 — не просто победа, а разгром. Особенно в математике (MATH) и понимании сложных текстов (DROP). При этом HRM-Text 1B весит в разы меньше и работает на CPU. Мы уже показывали, как Llama 3.2 1B и 3B работают на обычном Intel без видеокарты — HRM-Text 1B будет ещё быстрее.
Хотите повторить успех? Обратите внимание на принципы Nanollama — там тоже учат маленькую модель за полчаса. Разница — в датасете и настройках. HRM-Text 1B показывает: не нужно гнаться за гигантами. Иногда лучше собрать качественный датасет на 40B токенов, чем швырять миллиарды долларов в обучение 70B-моделей. Кстати, в нашем обзоре GLM4.7 + CC мы подсчитывали экономию — там та же логика: маленькое и эффективное бьёт большое и дорогое.
Где применять HRM-Text 1B? Идеальный сценарий — интеллектуальные чат-боты на периферии, локальные ассистенты, обработка документов в офлайне. Загрузите модель на ноутбук, дообучите под свою базу знаний — и получите корпоративного помощника, который не требует интернета и не сливает данные в облако. Если сравнить с Tiny Aya (3.35B, 70 языков), то HRM-Text 1B уступает в мультиязычности, но выигрывает в специализированных задачах на английском и математике.
В итоге — модель за $1000, которая положила на лопатки Llama 3.2 3B. Разработчики подчеркивают: это только начало. Планируется версия с 256K контекстом и мультимодальностью. Я ставлю на то, что уже через год модели 1B станут стандартом для edge-устройств, а HRM-Text 1B войдёт в историю как первый ласточка. Хотите быть впереди — скачивайте веса с Hugging Face и пробуйте прямо сейчас. Не ждите, пока big tech разродится очередным «убийцей» — убийца уже здесь, и он стоит тысячу баксов.