Почему hipfire не работает с другими картами AMD кроме 7900 XTX?

hipfire заточен под архитектуру RDNA3 (GFX1100). Для RDNA2 (6900 XT) нужна другая версия DFlash. Но 7900 XTX — самая быстрая для этой связки.

Как исправить ошибку 'HIP runtime error: out of memory' при большом контексте?

Убедитесь, что у вас включён HIP_ENABLE_DEFLATE=1, иначе 24 ГБ не хватит на 64K контекст. Также проверьте, что нет других процессов, занимающих VRAM (отключите GUI, если работаете в X11).

Можно ли запустить hipfire без Docker?

Технически да, но Docker гарантирует одинаковую среду с необходимыми библиотеками ROCm. Нативные сборки часто ломаются из-за конфликтов версий; Docker спасает от 'ад зависимостей'.

Hipfire в Docker для LLM на AMD RX 7900 XTX: гайд с TriAttention и 40 tok/s

Вы купили RX 7900 XTX, потому что на бумаге 24 ГБ и куча вычислительных блоков. Вы прочитали десятки гайдов по ROCm, накатили драйверы, запустили llama.cpp. Модель Qwen3.6 27B работает. Но как только контекст переваливает за 16K токенов — привет, медленное перемалывание, а потом segfault или OOM. Знакомо? Я тоже через это прошёл. Встречайте hipfire — связку, которая разрывает шаблоны и выжимает из 7900 XTX почти 40 токенов в секунду на длинных контекстах.

Подписаться на канал

Как приручить hipfire в Docker: Qwen3.6 27B летает на AMD RX 7900 XTX с 40 tok/s

Подписывайтесь на наш канал!