Сколько раз вы упирались в стену цензуры AI Dungeon или ловили лаги в облачных RPG? Да и подписка за 15 баксов в месяц — не подарок. А если хочется генерировать не только текст, но и картинки к своей истории, не вылезая в отдельную нейросеть? Хорошая новость: теперь всё это можно запустить локально на 8 гигабайтах ОЗУ. Знакомьтесь — Open Dungeon.
Open Dungeon — это open-source движок для текстовых RPG, который внутри использует квантованную Gemma 4 QAT с контекстом до 256K токенов и умеет на лету рендерить FLUX-изображения. Всё полностью на вашем железе, без облаков и цензуры.
Что под капотом — без купюр
Разработчики взяли за основу Gemma 4 12B и обжали её через Quantization-Aware Training (QAT). Результат — модель, которая ест всего 5.5 ГБ ОЗУ в 4-битном квантовании и выдаёт осмысленные диалоги без «спасибо, я всего лишь ИИ». На практике это означает, что даже старенький ноут с 8 ГБ RAM может крутить полноценную RPG.
Но главная фишка — контекст. 256 тысяч токенов. Это не опечатка. Вы можете вести партию неделями, а модель помнит, какой предмет вы подобрали на первой локации. Раньше приходилось колдовать с mmproj, чтобы выжать 60K, а тут — коробочное решение.
Генерация изображений — вторая бомба. Open Dungeon вшил упрощённую версию FLUX (дистиллированную, всего 2.5 ГБ на диске). Когда вы описываете сцену, движок сам решает, стоит ли сгенерировать картинку. Результат — атмосферные арты прямо в окне чата.
Кто тут главный конкурент — и почему Open Dungeon выигрывает
Сравним с популярными альтернативами:
| Инструмент | Цена | Нужен интернет | Генерация изображений | Контекст | Минимум RAM |
|---|---|---|---|---|---|
| Open Dungeon | Бесплатно | Нет | Встроенная (FLUX) | 256K | 8 ГБ |
| AI Dungeon (облачный) | $15–30/мес | Да | SDXL (дорого) | ~8K | Не нужно |
| Equinox-31B (AI Dungeon) | Бесплатно (модель) | Опционально | Нет | 32K | 16+ ГБ |
| KoboldCPP + LLM | Бесплатно | Нет | Только текст | Зависит от модели | 6–12 ГБ |
Главное преимущество Open Dungeon — всё в одном флаконе. Не нужно ставить llama.cpp, отдельно качать модель, прикручивать ComfyUI. Установил — и играешь. Да, KV cache у Gemma 4 прожорливый, но инженеры Open Dungeon оптимизировали кэширование так, что на 8 ГБ вы спокойно держите 16K истории, а остальное — в offload на диск.
Сценарий: одна игра за 20 минут
Запускаем, создаём персонажа — рыжего мага по имени Кринж. Open Dungeon сразу предлагает сгенерировать его портрет. Жмём «Создать» — через 10 секунд получаем арт в стиле аниме. Нормально, но лица кривоваты (FLUX всё же не Midjourney, но для текстовой RPG — за глаза).
Пишем: «Вхожу в таверну, вижу бармена. Что он говорит?». Модель выплевывает сочный диалог с акцентом. Через 50 шагов я забываю, что брал квест у старушки. Но Open Dungeon помнит: при попытке продать ей найденное кольцо модель отвечает «Это же моё кольцо, вор!». Контекст в 256K — это магия. Вручную такое не эмулировать.
Ещё прикол: можно загрузить свою картинку локации, и модель опишет её словами. Или наоборот — описать словами, получить сгенерированный вид. Сравнение Gemma 4 с другими конкурентами показывает, что она справляется с пониманием запросов про обстановку не худе 70B-моделей.
Установка за три команды — честно, это реально
Разработчики явно заботились о новичках. Весь проект упакован в pip-пакет и Docker-образ. Самый простой путь:
pip install opendungeon
opendungeon run --model gemma-4-qat-4bit
Первое скачивание — около 8 ГБ (модель + вспомогательные файлы). Потом запускается графический интерфейс в браузере. Для пользователей macOS с Apple Silicon есть поддержка MLX — стандартный способ ускорения на M-чипах. На моём MacBook Air M1 с 8 ГБ всё летает: генерация текста — 15 токенов/сек, изображение — 30–40 секунд.
Важное предупреждение: если у вас видеокарта меньше 4 ГБ, генерация FLUX будет идти на CPU очень медленно (минуты). Лучше отключить авто-генерацию и запрашивать картинки только для ключевых моментов. Но текстовая часть работает на любом CPU с поддержкой AVX2.
На Windows с NVIDIA (6+ ГБ VRAM) скорость текста — до 30 токенов/сек. Для сравнения, Qwen 3.6 в похожих условиях давал 25 токенов/сек, но у него нет встроенного имидж-генератора.
Кому это реально нужно?
Трём категориям людей:
- Одиночкам-ролевикам, которым надоели шаблонные квесты из готовых игр. Open Dungeon — бесконечный генератор историй.
- Писателям и сценаристам, кто хочет рандомно разгонять сюжетные блоки. Модель иногда выдает неожиданные повороты, которые круто ложатся в текст.
- Параноикам конфиденциальности. Никакой телеметрии, все данные на вашем диске. Идеально для взрослого контента без цензуры.
А ещё это отличный подарок для друга-гика, который думает, что «нейронки — это для майнинга биткоинов». Ставишь ему Open Dungeon, показываешь, как модель материт его персонажа — и готово, новый энтузиаст AI.