Обновление llama.cpp: granite-speech 4.1-2B, LFM2.5-Embedding, Vulkan

В мире локальных LLM редко бывают безбашенные новинки. Обычно всё сводится к «пофиксили баги, прикрутили ещё один тип квантования». Но июнь 2026-го подкинул сюрприз: в llama.cpp завезли поддержку целых двух принципиально разных моделей и серьёзно докрутили Vulkan-бэкенд. Если вы до сих пор думали, что локальные нейронки — это только про чат с Ламой, приготовьтесь: теперь ещё и голосовой ассистент с эмбеддингами уровня production.

Подписаться на канал

llama.cpp: гранит, эмбеддинги и вулкан — три кита нового релиза

Подписывайтесь на наш канал!