Публикация AiManual

Почему маленькие модели ИИ побеждают гигантов: 3 кейса 2025–2026 годов (MDASH, MIT, Qwen)

Разбираем, как компактные нейросети MDASH, MIT и Qwen обходят гигантов по производительности и экономии. Реальные бенчмарки и стратегии.

3 мин чтения 04.06.2026

Коротко

Что будет в материале

01
MDASH: кибербезопасность на минималках
02
MIT: порвать шаблоны next-token-prediction
03
Qwen 3.5 4B: когда 4 миллиарда бьют 70 миллиардов
04
Что дальше? Маленькие модели — не утешительный приз

Вы заметили? Пока весь мир с упоением наблюдал за очередным релизом гигантской модели с триллионом параметров, в тихой лаборатории кто-то собрал нейросеть размером с флешку — и она ... обошла монстра. Нет, это не научная фантастика. В 2025–2026 годах маленькие модели вдруг перестали быть «игрушками». Они начали побеждать.

Бенчмарки больше не про качество — они про секунды и доллары, как писали в нашем разборе трендов. И здесь карлики оказываются в явном выигрыше.

MDASH: кибербезопасность на минималках

В 2025 году вышла модель MDASH — специализированный агент для кибербезопасности. Её параметров — кот наплакал по сравнению с Mythos (огромная LLM от небезызвестной компании). Но на бенчмарке CyberGym MDASH показала точность обнаружения угроз на 7% выше, при этом инференс занимал в 12 раз меньше памяти. Mythos, созданный как универсальный решатель, просто не умел глубоко нырять в узкую область. MDASH учили на конкретных логах, а не на всем интернете. Результат — налицо. Как говорят, «гонка за качеством закончилась, теперь считают секунды и доллары». И здесь MDASH выигрывает по обоим пунктам.

Кстати, это не единичный случай. Кризис больших моделей уже давно обсуждается, а MDASH лишь подтверждает — масштабирование вычислений ведёт в тупик.

MIT: порвать шаблоны next-token-prediction

Группа исследователей из MIT в 2026 году представила модель, которая использует не классическое next-token-prediction, а более эффективный механизм рассуждений. Она в 20 раз меньше GPT-5-mini, но на задачах логики и кода стабильно обходит её на 15–20%. Это не случайность — как мы разбирали ранее, ограничения NTP не позволяют большим моделям быть по-настоящему умными в специализированных областях. MIT доказали: можно пожертвовать широтой знаний, но выиграть в глубине.

💡

Пока гиганты задыхались от собственных весов, MIT просто сменили парадигму обучения. И это сработало.

Qwen 3.5 4B: когда 4 миллиарда бьют 70 миллиардов

Alibaba в начале 2026 года выпустила серию Qwen 3.5 — модели на 4B и даже 0.8B параметров. По тестам Intelligence Index, Qwen 3.5 4B вплотную приблизилась к Qwen 3.5 27B, а в некоторых аспектах (логика, математика) превзошла многие модели с 70B+. Это не шутка. Мы писали об этом в обзоре «Как карлики перестали быть шутами». Qwen 3.5 4B работает на обычном ноутбуке, но по качеству не уступает серверным монстрам двухлетней давности. Секрет — в дистилляции знаний и новом подходе к обучению.

Кстати, у них есть и старшая модель — Qwen3.5 27B, которая признана самой умной компактной моделью по Intelligence Index. Но именно «мелкие» версии впечатляют больше всего: они ломают стереотип «больше = лучше».

Что дальше? Маленькие модели — не утешительный приз

Три кейса — три доказательства: размер больше не гарантирует победу. Маленькие модели не убьют гигантов — они просто займут свои ниши. Будущее за роем специализированных агентов, каждый из которых компактен и дёшев. А гиганты останутся для оркестровки и сложных мультизадач.

Как сказал один из инженеров: «Мы в феврале 2020-го» — имея в виду, что всё только начинается. Тревога инженеров вполне понятна — старые правила перестают работать. А тренды 2026 года лишь подтверждают: плато возможностей AI достигнуто не за счёт гигантомании, а за счёт эффективности.

Маленькие модели — это не утешительный приз. Это новый стандарт. И если вы до сих пор думаете, что для серьёзных задач нужны сотни миллиардов параметров, — вы пропустили переломный момент.

Подписаться на канал