В мире локальных LLM редко бывают безбашенные новинки. Обычно всё сводится к «пофиксили баги, прикрутили ещё один тип квантования». Но июнь 2026-го подкинул сюрприз: в llama.cpp завезли поддержку целых двух принципиально разных моделей и серьёзно докрутили Vulkan-бэкенд. Если вы до сих пор думали, что локальные нейронки — это только про чат с Ламой, приготовьтесь: теперь ещё и голосовой ассистент с эмбеддингами уровня production.
24 Июн 2026
•
Инструмент
llama.cpp: гранит, эмбеддинги и вулкан — три кита нового релиза
Свежий релиз llama.cpp: локальная речь от IBM, эмбеддинги нового поколения и прокачанный Vulkan. Как это ускоряет работу и кому реально пригодится.