Если вы работаете с большими языковыми моделями на локальном железе, то наверняка сталкивались с проблемой размещения даже квантованной версии модели в оперативной памяти. В феврале 2026 года на арену вышли новые REAP-квантования MiniMax-M2.5, обещающие сжатие от 19 до 50 процентов по сравнению с предыдущими версиями.

Эти квантования представляют собой новый подход к сжатию, основанный на алгоритмах REAP (Rapid Entropy Adaptive Processing). В отличие от традиционных методов, REAP использует адаптивные методы обработки для достижения максимальной эффективности при минимальных потерях качества.

Вот как это работает:

REAP использует комбинацию алгоритмов квантования и деквантования для минимизации потерь.
REAP использует комбинацию алгоритмов квантования и деквантования для минимизации потерь.

REAP использует комбинацию алгоритмов квантования и деквантования для минимизации потерь.

REAP-квантования MiniMax-M2.5: что дают новые 19-50% сжатия и как сравниваются с Qwen Coder Next на 128GB RAM

Подписывайтесь на наш канал!