Fulloch V2: локальный голосовой ассистент для Home Assistant и Obsidian на 16GB VRAM | AiManual
AiManual Logo Ai / Manual.
30 Май 2026 Инструмент

Fulloch V2: 100% локальный голосовой ассистент для Home Assistant и Obsidian на 16GB VRAM

Обзор полностью локального голосового ассистента Fulloch V2 с открытым кодом. Работает на 16GB VRAM, интегрируется с Home Assistant и Obsidian. Примеры, сравнен

Тихий переворот: почему ваш умный дом не должен просыться в облако

Каждый раз, когда вы говорите «Алиса, включи свет», ваш голос улетает на чей-то сервер. Или, если вы используете Home Assistant с облачным голосовым ассистентом, ваша приватность стоит ровно столько, сколько просит Amazon или Google. Но есть люди, которые строят дом, где даже лампочка не знает, что такое интернет. Для них и появился Fulloch V2 — проект, который превращает вашу видеокарту с 16GB VRAM в полностью автономного голосового дворецкого. Никаких облаков, никаких подписок, только Open Source.

Если вы уже пробовали собрать локального ассистента сами, знаете: связка STT + LLM + TTS на одной карте — это ад. Fulloch V2 заявляет, что делает это без танцев с бубном. Проверим?

Что скрывается под капотом Fulloch V2

В отличие от сборки на RTX 3090, где каждый компонент приходится склеивать скотчем и молитвами, Fulloch V2 предлагает единый Docker-образ. Внутри — Whisper.cpp для распознавания речи (специальная версия с оптимизацией под 16GB VRAM), кастомная LLM на базе Llama 3.2 8B (квантованная до 4-bit), и Microsoft Edge TTS (offline-форк). Всё это жрет около 13.5 GB VRAM. Остаётся запас для Home Assistant и плагина Obsidian.

Главная фишка — двухслойная архитектура. Первый слой: быстрый NLP-фильтр (на базе tiny BERT) решает, нужно ли передавать запрос LLM или можно обойтись командой «включи свет». Если запрос сложный (например, «запиши в заметку рецепт ужина и отправь мне напоминание через час»), в дело вступает второй слой — полноценная LLM, которая генерирует ответ и запускает действия через API Home Assistant и Obsidian Local REST API.

⚠️
Не советую так делать, если не хотите получить 30-секундную задержку. Без фильтра LLM будет грузить ответ на каждое «выключи свет» — бессмысленный расход ресурсов. Fulloch V2 решает это элегантно.

Как это выглядит на практике: сценарий «Вечерний рутины»

Представьте: вы заходите в дом, говорите «Fulloch, я вернулся». Ассистент распознаёт голос за 400 мс (спасибо Whisper.cpp на GPU), фильтр понимает, что это триггер сценария, и запускает последовательность: зажигается свет в прихожей, включается тёплый пол, на кухне начинается подогрев чайника, а в Obsidian создаётся новая заметка с шаблоном «Вечерняя рефлексия». Всё это без единого обращения к облаку.

Для тех, кто хочет копнуть глубже: в конфиге можно прописать свои сценарии на YAML. Вот пример, как настроить Obsidian-интеграцию (без магии, только код):

obsidian:
  vault: "/home/user/vault"
  default_note: "daily"
  templates:
    reminder: "templates/reminder.md"
    recipe: "templates/recipe.md"
  api_key: "your-local-rest-key"
  actions:
    - name: "create_note"
      params:
        title: "{{ date }} - {{ topic }}"
        content: "{Пользователь сказал: {text}}"

Звучит логично, но есть нюанс: без локального REST API Obsidian (плагин 3.0+) это не заведётся. Убедитесь, что плагин установлен и настроен на токен.

Сравнение с другими локальными решениями

Инструмент VRAM Home Assistant Obsidian Сложность установки
Fulloch V2 ~13.5 GB Нативно Нативно (плагин) Низкая (Docker)
Сборка на n8n Зависит от LLM Через REST Через REST Высокая (скрипты)
Hey Lama 8+ GB (Mac) Ограниченно Нет Средняя (консоль)
VibeVoice.cpp ~6 GB Нет Нет Низкая (C++ binary)

Как видите, Fulloch V2 выигрывает за счёт готовой интеграции с Obsidian и Home Assistant «из коробки». Но если вам нужен только speech-to-speech без умного дома, VibeVoice.cpp легче и быстрее. А если вы любите собирать всё из кубиков, n8n-подход даёт бесконечную гибкость, но требует больше времени.

Типичные ошибки при запуске (и как их избежать)

Ошибка 1: «У меня 16 GB VRAM, всё влезет». Не влезет, если вы забыли выключить другие GPU-процессы (например, браузер с аппаратным ускорением). Запускайте Fulloch V2 с флагом --gpu-mem-limit 14000, чтобы оставить 2GB на систему.

Ошибка 2: «Whisper не понимает мой акцент». Fulloch V2 использует Voxtral-Mini 4B в качестве опционального движка для транскрипции с задержкой <500 мс. Если Whisper ошибается на вашей речи, просто переключите stt_engine: voxtral в config.yaml.

Ошибка 3: «Obsidian плагин не видит ассистента». Проверьте, что в настройках плагина Obsidian Local REST API разрешён доступ с localhost:8080 (порт Fulloch).

Кстати, вы можете легко расширить функционал, подключив AVA как модуль фильтрации спам-команд — ассистент будет игнорировать запросы от незнакомых голосов.

Кому это реально нужно (а кому — нет)

  • Идеально подойдёт: владельцам Home Assistant с видеокартой 16 GB VRAM (RTX 4060 Ti 16GB, RTX 4060 16GB, RTX 3080 10GB — на 10GB будет тяжело, но можно урезать контекст LLM до 2048 токенов). Пользователям Obsidian, которые хотят голосовой ввод заметок без интернета.
  • Стоит попробовать, если: вы уже собрали ассистента на LangChain и Ollama, но устали от костылей. Fulloch V2 даст ту же функциональность без скриптов.
  • Не рекомендую: если у вас видеокарта 8 GB VRAM или вы не готовы выделить 20+ GB дискового пространства под модели (Whisper + LLM + TTS весят около 12 GB).

И последнее: Fulloch V2 — ещё не «поставил и забыл». Обновления выходят раз в месяц, комьюнити на GitHub активно чинит баги. Но если вы хотите максимально автономное решение без облаков сегодня — это лучший кандидат среди таких же маньяков приватности. А через год, когда домашние нейросети научатся работать на 8 GB VRAM с тем же качеством, все эти статьи покажутся архаичными. Но сейчас — 2026, и 16 GB — это разумный минимум.

Подписаться на канал