Публикация AiManual

Open Dungeon: локальный ролеплей с Gemma 4 QAT и встроенной генерацией изображений на 8 ГБ ОЗУ

Запустите свою RPG без интернета: Gemma 4 QAT, 256K контекст, генерация FLUX-изображений на 8 ГБ ОЗУ. Полный обзор и гайд.

5 мин чтения 12.06.2026

Коротко

Что будет в материале

01
Что под капотом — без купюр
02
Кто тут главный конкурент — и почему Open Dungeon выигрывает
03
Сценарий: одна игра за 20 минут
04
Установка за три команды — честно, это реально

Сколько раз вы упирались в стену цензуры AI Dungeon или ловили лаги в облачных RPG? Да и подписка за 15 баксов в месяц — не подарок. А если хочется генерировать не только текст, но и картинки к своей истории, не вылезая в отдельную нейросеть? Хорошая новость: теперь всё это можно запустить локально на 8 гигабайтах ОЗУ. Знакомьтесь — Open Dungeon.

Open Dungeon — это open-source движок для текстовых RPG, который внутри использует квантованную Gemma 4 QAT с контекстом до 256K токенов и умеет на лету рендерить FLUX-изображения. Всё полностью на вашем железе, без облаков и цензуры.

Что под капотом — без купюр

Разработчики взяли за основу Gemma 4 12B и обжали её через Quantization-Aware Training (QAT). Результат — модель, которая ест всего 5.5 ГБ ОЗУ в 4-битном квантовании и выдаёт осмысленные диалоги без «спасибо, я всего лишь ИИ». На практике это означает, что даже старенький ноут с 8 ГБ RAM может крутить полноценную RPG.

Но главная фишка — контекст. 256 тысяч токенов. Это не опечатка. Вы можете вести партию неделями, а модель помнит, какой предмет вы подобрали на первой локации. Раньше приходилось колдовать с mmproj, чтобы выжать 60K, а тут — коробочное решение.

Генерация изображений — вторая бомба. Open Dungeon вшил упрощённую версию FLUX (дистиллированную, всего 2.5 ГБ на диске). Когда вы описываете сцену, движок сам решает, стоит ли сгенерировать картинку. Результат — атмосферные арты прямо в окне чата.

Кто тут главный конкурент — и почему Open Dungeon выигрывает

Сравним с популярными альтернативами:

Инструмент	Цена	Нужен интернет	Генерация изображений	Контекст	Минимум RAM
Open Dungeon	Бесплатно	Нет	Встроенная (FLUX)	256K	8 ГБ
AI Dungeon (облачный)	$15–30/мес	Да	SDXL (дорого)	~8K	Не нужно
Equinox-31B (AI Dungeon)	Бесплатно (модель)	Опционально	Нет	32K	16+ ГБ
KoboldCPP + LLM	Бесплатно	Нет	Только текст	Зависит от модели	6–12 ГБ

Главное преимущество Open Dungeon — всё в одном флаконе. Не нужно ставить llama.cpp, отдельно качать модель, прикручивать ComfyUI. Установил — и играешь. Да, KV cache у Gemma 4 прожорливый, но инженеры Open Dungeon оптимизировали кэширование так, что на 8 ГБ вы спокойно держите 16K истории, а остальное — в offload на диск.

Сценарий: одна игра за 20 минут

Запускаем, создаём персонажа — рыжего мага по имени Кринж. Open Dungeon сразу предлагает сгенерировать его портрет. Жмём «Создать» — через 10 секунд получаем арт в стиле аниме. Нормально, но лица кривоваты (FLUX всё же не Midjourney, но для текстовой RPG — за глаза).

Пишем: «Вхожу в таверну, вижу бармена. Что он говорит?». Модель выплевывает сочный диалог с акцентом. Через 50 шагов я забываю, что брал квест у старушки. Но Open Dungeon помнит: при попытке продать ей найденное кольцо модель отвечает «Это же моё кольцо, вор!». Контекст в 256K — это магия. Вручную такое не эмулировать.

Ещё прикол: можно загрузить свою картинку локации, и модель опишет её словами. Или наоборот — описать словами, получить сгенерированный вид. Сравнение Gemma 4 с другими конкурентами показывает, что она справляется с пониманием запросов про обстановку не худе 70B-моделей.

Установка за три команды — честно, это реально

Разработчики явно заботились о новичках. Весь проект упакован в pip-пакет и Docker-образ. Самый простой путь:

pip install opendungeon
opendungeon run --model gemma-4-qat-4bit

Первое скачивание — около 8 ГБ (модель + вспомогательные файлы). Потом запускается графический интерфейс в браузере. Для пользователей macOS с Apple Silicon есть поддержка MLX — стандартный способ ускорения на M-чипах. На моём MacBook Air M1 с 8 ГБ всё летает: генерация текста — 15 токенов/сек, изображение — 30–40 секунд.

Важное предупреждение: если у вас видеокарта меньше 4 ГБ, генерация FLUX будет идти на CPU очень медленно (минуты). Лучше отключить авто-генерацию и запрашивать картинки только для ключевых моментов. Но текстовая часть работает на любом CPU с поддержкой AVX2.

На Windows с NVIDIA (6+ ГБ VRAM) скорость текста — до 30 токенов/сек. Для сравнения, Qwen 3.6 в похожих условиях давал 25 токенов/сек, но у него нет встроенного имидж-генератора.

Кому это реально нужно?

Трём категориям людей:

Одиночкам-ролевикам, которым надоели шаблонные квесты из готовых игр. Open Dungeon — бесконечный генератор историй.
Писателям и сценаристам, кто хочет рандомно разгонять сюжетные блоки. Модель иногда выдает неожиданные повороты, которые круто ложатся в текст.
Параноикам конфиденциальности. Никакой телеметрии, все данные на вашем диске. Идеально для взрослого контента без цензуры.

А ещё это отличный подарок для друга-гика, который думает, что «нейронки — это для майнинга биткоинов». Ставишь ему Open Dungeon, показываешь, как модель материт его персонажа — и готово, новый энтузиаст AI.

💡

Хитрый лайфхак. Open Dungeon позволяет подключать внешние LoRA-адаптеры для изменения стиля генерации. Хотите, чтобы ваши арты были в стиле киберпанк или «масло Босха»? Гуглите LoRA для FLUX и кладите в папку models/lora. Никакого рекуррентного промптинга.

Подписаться на канал