Почему в llama.cpp b9680 пропал Web UI?

Разработчики при рефакторинге сборки для Docker-образов с CUDA забыли включить компонент фронтенда.

Как исправить баг с Web UI в llama.cpp b9680?

Откатитесь до версии b9664 через Docker (тег b9664-server-cuda13) или пересоберите из исходников с коммита b9664.

Llama.cpp b9680 баг: Web UI пропал – решение и откат

Вы обновили llama.cpp до версии b9680. Запустили контейнер Docker с server-cuda13. В браузере – пустая страница. Ни чата, ни интерфейса. Только молчаливый чёрный экран и логи сервера, которые ничего не объясняют. Знакомо?

Добро пожаловать в баг версии b9680 – разработчики случайно отключили Web UI. Фронтенд не собирается при билде, либо не копируется в образ. В issue #3748 уже есть жалобы, но официального патча пока нет. И это не первый сбой стабильности – недавний кризис стабильности llama.cpp показал, что даже минорные релизы могут быть опасными.

Важно: проблема проявляется только при использовании Docker-образов с тегом server-cuda13 для b9680. Если вы собирали из сорцов с флагом LLAMA_WEBUI=1 – скорее всего, не затронуты. Но большинство использует официальные образы.

Как это выглядит на практике

Типичный сценарий: вы пулите последний образ llama.cpp, запускаете контейнер, передаёте модель. Сервер стартует, API отвечает (вызовы curl работают), но Web UI по порту 8080 отдаёт только пустой ответ. Логи не содержат ошибок – просто не загружается JS-бандл. Судя по коммитам, в b9680 сломали скрипт сборки фронтенда для CUDA-образов. Если вы тоже столкнулись с молчаливыми ошибками, загляните в наш разбор тихих убийц llama.cpp – там собраны похожие сценарии.

Временное решение – откат на b9664

Разработчики ещё не выпустили патч. Ждать неделями не хочется – запускать локальный AI без UI неудобно. Рабочий вариант: откатиться до версии b9664. Она стабильна, Web UI работает, все фичи на месте.

Если вы используете Docker

Просто смените тег образа на b9664-server-cuda13 (или аналогичный для вашей платформы):

docker pull ghcr.io/ggml-org/llama.cpp:b9664-server-cuda13
docker run -p 8080:8080 -v /models:/models ghcr.io/ggml-org/llama.cpp:b9664-server-cuda13 ...

Обратите внимание: тег b9664 может быть без суффикса -server-cuda13 – проверьте на Docker Hub. Если используете server с другим бэкендом (OpenCL, Vulkan, Metal), аналогично выберите старый тег.

Если вы собираете из исходников

Откатите репозиторий до коммита b9664 и пересоберите:

git checkout tags/b9664
mkdir build && cd build
cmake .. -DLLAMA_WEBUI=ON
make -j

После сборки Web UI появится снова.

Почему это произошло и когда починят

Судя по истории коммитов, в b9680 разработчики рефакторили структуру фронтенда, но забыли включить webui в конфигурацию сборки для CUDA-образов. Это не первый подобный косяк – ранее в баге с повторной обработкой промптов для Qwen 3.5 тоже пришлось откатывать. Похоже, тестирование образов на разных платформах оставляет желать лучшего.

Патч уже на подходе – в issue #3748 разработчик пообещал исправить в ближайшие дни. До выхода фикса мы рекомендуем зафиксироваться на b9664 и не спешить с обновлениями. И заодно подписаться на уведомления в репозитории, чтобы не пропустить следующую «бомбу».

А пока – пользуйтесь проверенной версией и не стесняйтесь написать в комментариях, сталкивались ли с багом. Может, вы нашли обходной путь интереснее отката?

Подписаться на канал

Llama.cpp b9680: Web UI исчез. Разработчики молчат, а сервер не работает

Как это выглядит на практике

Временное решение – откат на b9664

Если вы используете Docker

Если вы собираете из исходников

Почему это произошло и когда починят

Подписывайтесь на наш канал!