Если вы работаете с большими языковыми моделями на локальном железе, то наверняка сталкивались с проблемой размещения даже квантованной версии модели в оперативной памяти. В феврале 2026 года на арену вышли новые REAP-квантования MiniMax-M2.5, обещающие сжатие от 19 до 50 процентов по сравнению с предыдущими версиями.
Эти квантования представляют собой новый подход к сжатию, основанный на алгоритмах REAP (Rapid Entropy Adaptive Processing). В отличие от традиционных методов, REAP использует адаптивные методы обработки для достижения максимальной эффективности при минимальных потерях качества.
Вот как это работает:
- REAP использует комбинацию алгоритмов квантования и деквантования для минимизации потерь.
- REAP использует комбинацию алгоритмов квантования и деквантования для минимизации потерь.
REAP использует комбинацию алгоритмов квантования и деквантования для минимизации потерь.
REAP использует комбинацию алгоритмов квантования и деквантования для минимизации потерь.
REAP использует комбинацию алгоритмов квантования и деквантования для минимизации потерь.
REAP использует комбинацию алгоритмов квантования и деквантования для минимизации потерь.
REAP использует комбинацию алгоритмов квантования и деквантования для минимизации потерь.