Вы заметили? Пока весь мир с упоением наблюдал за очередным релизом гигантской модели с триллионом параметров, в тихой лаборатории кто-то собрал нейросеть размером с флешку — и она ... обошла монстра. Нет, это не научная фантастика. В 2025–2026 годах маленькие модели вдруг перестали быть «игрушками». Они начали побеждать.
Бенчмарки больше не про качество — они про секунды и доллары, как писали в нашем разборе трендов. И здесь карлики оказываются в явном выигрыше.
MDASH: кибербезопасность на минималках
В 2025 году вышла модель MDASH — специализированный агент для кибербезопасности. Её параметров — кот наплакал по сравнению с Mythos (огромная LLM от небезызвестной компании). Но на бенчмарке CyberGym MDASH показала точность обнаружения угроз на 7% выше, при этом инференс занимал в 12 раз меньше памяти. Mythos, созданный как универсальный решатель, просто не умел глубоко нырять в узкую область. MDASH учили на конкретных логах, а не на всем интернете. Результат — налицо. Как говорят, «гонка за качеством закончилась, теперь считают секунды и доллары». И здесь MDASH выигрывает по обоим пунктам.
Кстати, это не единичный случай. Кризис больших моделей уже давно обсуждается, а MDASH лишь подтверждает — масштабирование вычислений ведёт в тупик.
MIT: порвать шаблоны next-token-prediction
Группа исследователей из MIT в 2026 году представила модель, которая использует не классическое next-token-prediction, а более эффективный механизм рассуждений. Она в 20 раз меньше GPT-5-mini, но на задачах логики и кода стабильно обходит её на 15–20%. Это не случайность — как мы разбирали ранее, ограничения NTP не позволяют большим моделям быть по-настоящему умными в специализированных областях. MIT доказали: можно пожертвовать широтой знаний, но выиграть в глубине.
Qwen 3.5 4B: когда 4 миллиарда бьют 70 миллиардов
Alibaba в начале 2026 года выпустила серию Qwen 3.5 — модели на 4B и даже 0.8B параметров. По тестам Intelligence Index, Qwen 3.5 4B вплотную приблизилась к Qwen 3.5 27B, а в некоторых аспектах (логика, математика) превзошла многие модели с 70B+. Это не шутка. Мы писали об этом в обзоре «Как карлики перестали быть шутами». Qwen 3.5 4B работает на обычном ноутбуке, но по качеству не уступает серверным монстрам двухлетней давности. Секрет — в дистилляции знаний и новом подходе к обучению.
Кстати, у них есть и старшая модель — Qwen3.5 27B, которая признана самой умной компактной моделью по Intelligence Index. Но именно «мелкие» версии впечатляют больше всего: они ломают стереотип «больше = лучше».
Что дальше? Маленькие модели — не утешительный приз
Три кейса — три доказательства: размер больше не гарантирует победу. Маленькие модели не убьют гигантов — они просто займут свои ниши. Будущее за роем специализированных агентов, каждый из которых компактен и дёшев. А гиганты останутся для оркестровки и сложных мультизадач.
Как сказал один из инженеров: «Мы в феврале 2020-го» — имея в виду, что всё только начинается. Тревога инженеров вполне понятна — старые правила перестают работать. А тренды 2026 года лишь подтверждают: плато возможностей AI достигнуто не за счёт гигантомании, а за счёт эффективности.
Маленькие модели — это не утешительный приз. Это новый стандарт. И если вы до сих пор думаете, что для серьёзных задач нужны сотни миллиардов параметров, — вы пропустили переломный момент.