Исправление бага LM Studio: RAG не меняет embedding-модель с Nomic | AiManual
AiManual Logo Ai / Manual.
27 Янв 2026 Гайд

Как исправить проблему с выбором embedding-модели в LM Studio: RAG не переключается с Nomic

Подробный гайд по решению проблемы, когда LM Studio не переключает embedding-модель для RAG с nomic-embed-text-v1. Шаги по очистке кэша, правке конфигов и настр

Проблема: ваш RAG в LM Studio застрял на Nomic и никуда не двигается

Вы открываете LM Studio, заходите в Local Server, переходите в RAG. Пытаетесь сменить embedding-модель с дефолтной nomic-embed-text-v1.5 на что-то более подходящее — например, на ту же bge-m3 или свежую Qwen3-Embedding. Выбираете модель в выпадающем списке, нажимаете "Load", может, даже видите, как она скачивается. Но когда начинаете индексировать документы или задавать вопросы — бац! — в логах сервера или в интерфейсе снова красуется старый добрый Nomic. Вы меняете модель ещё раз. И ещё. А он возвращается. Знакомо? Это не вы сошли с ума. Это известный (и чертовски раздражающий) баг в LM Studio, который тянется уже несколько версий. На 27.01.2026 он всё ещё может всплывать в версиях 0.2.10-0.2.12. Почему? Потому что LM Studio в попытке быть удобным для новичка слишком агрессивно кэширует настройки и имеет несколько слоёв конфигурации, которые конфликтуют друг с другом.

Не путайте эту проблему с обычной сменой LLM-модели для генерации текста. Речь именно об embedding-модели для Retrieval-Augmented Generation (RAG) — той, которая преобразует ваш текст и запросы в числовые векторы для поиска. Если она сломана, весь ваш RAG превращается в дорогую игрушку, которая ищет по документам как попало.

Почему это вообще происходит? Глубже кроличьей норы

LM Studio — отличный инструмент для быстрого старта с локальными LLM, но его архитектура в части RAG и эмбеддингов... скажем так, не без греха. Когда вы впервые запускаете RAG, программа ищет доступную embedding-модель. Nomic-embed-text-v1.5 долгое время была рекомендованной по умолчанию из-за своего баланса качества, размера и поддержки контекста в 8192 токена. LM Studio, обнаружив, что у вас её нет, любезно скачивает её и прописывает в конфигурационный файл. И вот здесь начинается магия (точнее, чёрная магия).

Эта настройка записывается в два, а то и три разных места:

  • Глобальный кэш моделей — где хранятся скачанные файлы.
  • Конфиг RAG-движка — внутренние настройки сервера.
  • Пользовательские настройки интерфейса — то, что вы видите в GUI.

При смене модели через интерфейс обновляется только последний пункт. А движок RAG в фоне продолжает читать старый конфиг. Результат — тихий саботаж ваших усилий. Добавьте сюда возможные баги с проверкой наличия модели на диске, и получите идеальный шторм.

💡
Кстати, если вы выбираете между embedding-моделями для продакшена, у нас есть детальное сравнение BGE M3, EmbeddingGemma и Qwen3. Там разобраны не только метрики, но и практические нюансы интеграции.

Решение: ломаем систему в три этапа с гарантией

Не будем ходить вокруг да около. Баг системный, значит, и чинить нужно на уровне системы. Полумеры вроде перезагрузки приложения здесь не сработают. Нужно последовательно почистить кэш, убить скрытые процессы, переписать конфиги и только потом заново настроить RAG. Да, это займёт 10-15 минут. Зато проблема уйдёт.

1 Полная остановка всего, что связано с LM Studio

Первое правило борьбы с глючащим софтом — добить все его процессы. Закройте LM Studio. Теперь откройте диспетчер задач (Ctrl+Shift+Esc на Windows, Activity Monitor на Mac, htop на Linux). Найдите и принудительно завершите:

  • lmstudio.exe или LM Studio (основной процесс)
  • lmstudio-server или что-то похожее (фоновый сервер)
  • Любые процессы с именами, содержащими "llama", "bert", "embed" — на всякий случай.

Почему это важно? Фоновый сервер RAG часто остаётся висеть в памяти даже после закрытия основного окна. И он продолжает держать файлы конфигурации открытыми, блокируя любые изменения.

# Для Linux/Mac можно использовать такой набор команд в терминале:
killall -9 "LM Studio" 2>/dev/null
killall -9 lmstudio 2>/dev/null
pkill -f "embed"

2 Охота за конфигурационными файлами и их уничтожение

Теперь найдём и либо удалим, либо переименуем конфиги, которые LM Studio использует для RAG. Расположение зависит от ОС.

Операционная система Путь к конфигам RAG и кэшу
Windows %APPDATA%\LM Studio или %LOCALAPPDATA%\LM Studio
macOS ~/Library/Application Support/LM Studio и ~/Library/Caches/LM Studio
Linux ~/.config/LM Studio и ~/.cache/lmstudio

Внутри этих директорий ищите файлы с именами, содержащими "rag", "embed", "nomic", а также папки database или vector_store. Конкретно на 27.01.2026 критичными могут быть:

# Пример для macOS/Linux
cd ~/Library/Application\ Support/LM Studio
# Переименуем или удалим подозрительные папки
mv rag_config.json rag_config.json.bak
mv embeddings_cache embeddings_cache.bak
# Если есть папка с индексами - её тоже можно очистить
rm -rf vector_db  # Внимание! Это удалит ваши ранее проиндексированные документы!

Удаление папки vector_db или database приведёт к потере всех ранее созданных индексов документов. Если они вам дороги, просто переместите её в другое место. После решения проблемы вы сможете переиндексировать документы заново (что, кстати, рекомендуется при смене embedding-модели).

3 Чистая установка новой embedding-модели и принудительная привязка

Теперь запустите LM Studio заново. Не торопитесь открывать RAG. Сначала зайдите во вкладку "Models" (Модели) в левом боковом меню. В строке поиска найдите ту embedding-модель, которую хотите использовать. Например, "bge-m3" или "Qwen3-Embedding". Убедитесь, что скачиваете именно embedding-модель, а не обычную языковую. На 27.01.2026 популярные варианты:

  • BAAI/bge-m3 — универсальный солдат, поддерживает много языков.
  • Alibaba-NLP/gte-Qwen3-7B-instruct — свежая модель от Alibaba с отличными метриками.
  • nomic-ai/nomic-embed-text-v1.5 — да, её тоже можно переустановить, если вы хотите именно её, но без бага.
  • Google/embedding-gecko — если вы экспериментируете с новинками.

Скачайте модель, дождитесь полной загрузки. Теперь ключевой манёвр. Откройте Local Server, перейдите в RAG. В выпадающем списке "Embedding Model" выберите только что скачанную модель. Но перед нажатием "Load" сделайте следующее:

  1. В поле "Model Path" (если оно есть) убедитесь, что путь ведёт к новой модели. Иногда нужно нажать "Browse" и указать файл .gguf вручную.
  2. Включите опцию "Override previous settings" или аналогичную (в разных версиях она может называться по-разному).
  3. Нажмите "Load". Следите за логами сервера (обычно они открываются в отдельной вкладке или окне). Вы должны увидеть строки вроде "Loading embedding model: BAAI/bge-m3".

Если лог показывает старую модель — немедленно остановите сервер (кнопка "Stop") и проверьте, не осталось ли старых конфигов в местах, которые мы пропустили.

Нюансы, в которых спотыкаются даже опытные

Вы сделали всё по инструкции, а модель всё равно сбрасывается? Вот несколько тонких мест, которые часто упускают.

Конфликт версий llama.cpp. LM Studio использует собственную сборку llama.cpp для вычисления эмбеддингов. Если вы ранее ставили llama.cpp отдельно или через другие инструменты (например, сравнение LM Studio и llama.cpp здесь), в системе могут быть конфликтующие библиотеки. Решение — временно отключить или удалить сторонние установки llama.cpp.

Проблемы с правами доступа на Windows. Если LM Studio запущен от имени администратора, а конфиги лежат в пользовательской папке, может возникнуть путаница с правами. Запустите LM Studio от имени обычного пользователя (не админа) для чистоты эксперимента.

Сломанная модель в кэше. Файлы модели могли скачаться с ошибкой. Удалите модель не только через интерфейс LM Studio, но и физически с диска. Путь к кэшу моделей обычно: ~/.cache/lmstudio/models на Linux/Mac или %LOCALAPPDATA%\LM Studio\models на Windows. Удалите папку с именем nomic-embed-text-v1.5 или другой проблемной модели.

💡
Похожий принцип "очистки кэша и конфигов" работает и для других глюков LM Studio. Например, если у вас проблема с навязчивым 'мышлением' Nemotron Nano 3, первым делом стоит почистить историю чата и кэш модели.

Что делать, если ничего не помогает? Крайние меры

Бывает, что баг засел слишком глубоко. Тогда идём ва-банк.

  1. Полная переустановка LM Studio. Удалите программу через стандартный деинсталлятор. Затем вручную удалите ВСЕ оставшиеся папки из таблицы выше. Перезагрузите компьютер. Установите свежую версию LM Studio с официального сайта (на 27.01.2026 это, вероятно, версия 0.2.13 или выше).
  2. Использование альтернативного RAG-движка. LM Studio позволяет указать внешний endpoint для эмбеддингов. Вы можете поднять отдельный сервис на Python с помощью библиотеки sentence-transformers и указать его адрес в настройках RAG. Это сложнее, но даёт полный контроль.
  3. Отказ от встроенного RAG в пользу стороннего инструмента. Если сроки горят, рассмотрите LMStudio-Ollama связку или другие решения для локального RAG, например, PrivateGPT или локальный запуск через LangChain.

Вопросы, которые вы хотели задать, но стеснялись

Q: Я боюсь удалять конфиги. Можно ли просто отредактировать файл rag_config.json?
A: Можно, но это рискованно. Структура файла может меняться от версии к версии. Если решитесь, ищите ключ "embedding_model" или "embedding_model_path" и меняйте его значение на полный путь к новой модели. Закройте LM Studio перед редактированием.

Q: А если я просто обновлю LM Studio до последней версии?
A: На 27.01.2026 разработчики, возможно, уже пофиксили этот баг. Проверьте список изменений (changelog). Если там есть пункт про "fixed embedding model persistence in RAG", то обновление может помочь. Но всё равно рекомендую после обновления выполнить шаг 2 (очистку конфигов) для профилактики.

Q: Какая embedding-модель сейчас самая лучшая для русского и английского?
A: По состоянию на начало 2026 года, BGE-M3 и Qwen3-Embedding показывают отличные результаты на мультиязычных датасетах. Но всегда проверяйте свежие бенчмарки на сайтах вроде Hugging Face или LLMPlot.com.

Q: Этот баг как-то связан с тем, что LM Studio отстаёт от OpenWebUI в поддержке MCP?
A: Косвенно. Оба случая — симптомы одной болезни: LM Studio фокусируется на простоте для начинающих, иногда в ущерб гибкости и стабильности продвинутых функций. Если вам критичны современные протоколы вроде MCP, здесь есть анализ и обходные пути.

И последнее. Если вы проделали весь этот путь и наконец заставили RAG работать с нужной embedding-моделью — не расслабляйтесь. Сделайте снимок экрана с настройками или экспортируйте конфиг, если такая опция есть. Потому что после следующего крупного обновления LM Studio история может повториться. И тогда вы будете готовы.