PageStorm v2.0: модель для написания книг — настройка, промпты, сравнение | AiManual
AiManual Logo Ai / Manual.
30 Июн 2026 Инструмент

PageStorm: как локальная модель для книг заменяет ChatGPT и не боится тормозов

Полный обзор PageStorm — open-source LLM для писателей. Локальный запуск, генерация глав, контроль сюжета. Сравнение с Claude и Llama, реальные примеры промптов

Реклама
cliv2

Тот самый момент, когда Sonnet 3.7 умирает

Вы сидите с пустым взглядом перед курсивом «Глава 17». ChatGPT выплёвывает три абзаца про «оторопевшего героя, который вглядывался в даль», а потом — тишина. Контекстное окно прожёвывает последние 8000 токенов и начинает забывать, что герой — левша, а антагонист боится пауков. Знакомо? Если да — встречайте PageStorm v2.0, модель, которую автор Vellium (тот самый, кто сделал писательский режим в Vellium) заточил под одну задачу: писать книги, а не отвечать на имейлы.

PageStorm — не очередной «универсальный помощник», который пытается быть и поэтом, и программистом. Это 13-миллиардная модель, дообученная исключительно на художественных текстах: от романов Толстого до современных веб-новелл. Она не умеет писать код, не цитирует Википедию — зато держит сюжет на 50 000 токенах и не сбивается на «с другой стороны» через три абзаца.

Важное уточнение: PageStorm не генерирует текст «за вас». Она — соавтор, который помнит, что в седьмой главе персонаж потерял ключи от машины, и может предложить, где они всплывут в финале.

Что под капотом: архитектура и «фишки», которых нет у других

Базовая архитектура — Transformer Decoder, но с двумя ключевыми модификациями:

  • Scaffold Attention — механизм, который фиксирует «скелет» сюжета (ключевые точки, арки персонажей) и повторно подгружает его каждые 2048 токенов. Контекстное окно — 128k токенов, но модель «помнит» самые важные моменты даже при 200k.
  • Narrative Consistency Head — дополнительный выход, который оценивает логику повествования. Если модель решает, что персонаж делает что-то нехарактерное, она не просто генерирует дальше, а подсвечивает это в логах.

Эти штуки работают только с PageStorm, и это сразу видно. Когда я попытался написать детектив, где сыщик теряет очки в первой главе, а в десятой они находятся — модель не забыла про очки ни разу. Сравните с Llama 3.1 70B, которая к пятой главе превратила сыщика в дальтоника.

Как настроить PageStorm: от установки до первого абзаца

В теории это open-source, но на практике нужен компьютер с 16 ГБ видеопамяти (на Quantized 4-bit). Если у вас Mac M2 Ultra с 192 ГБ памяти (как в этой истории про экстремум) — вообще сказка: модель летает.

1Установка через Ollama

Самый простой способ — уже готовые квантизованные версии:

ollama pull pagestorm:7b-q4_K_M  # для 6-8 ГБ VRAM
ollama pull pagestorm:13b-q4_K_M # для 12-16 ГБ VRAM, рекомендую

Затем запускаете с фиксированным seed, чтобы получать воспроизводимые результаты:

ollama run pagestorm:13b-q4_K_M --seed 42

2Промпт: как НЕ надо делать

Большинство ошибок — из-за того, что промпты скопированы из ChatGPT. PageStorm не терпит «будь вежливым» в системном сообщении. Он хочет структуру:

Ошибка: «Напиши главу 12, где герой встречает старого друга, используя яркие описания».

Результат — скучная вода. Правильный подход:

SYSTEM = """
Сюжетный скелет: герой (Пётр, 35 лет, бывший военный) 
ищет пропавшую дочь. В главе 12 он находит старого друга — 
Майю, которая работает в архиве. Дружба была разорвана 10 лет 
назад из-за предательства. 
Ключевая точка: Майя знает местонахождение дочери, но не 
хочет говорить. Эмоциональная арка: от холодности до 
вспышки гнева.
"""
USER = "Глава 12. Встреча в архиве. Напиши диалог, в котором 
Пётр сначала притворяется, что забыл прошлое, но постепенно 
срывается на крик. Используй дождь за окном как метафору 
нарастающего напряжения."

Результат — 4 страницы диалога с внутренними монологами, где каждая реплика двигает сюжет. Никаких «он вздохнул» без причины.

3Настройка параметров генерации

PageStorm любит высокую температуру (0.9-1.1) для диалогов и низкую (0.4-0.6) для описаний. Top-k = 40, top-p = 0.9. Частота штрафов — 0.15 (иначе начинает повторять «он подумал» каждые три строки).

Пример для llama.cpp:

./main -m pagestorm-13b-q4_K_M.gguf -p "[INST] ... [/INST]" 
--temp 0.8 --repeat-penalty 1.15 --top-k 40 --top-p 0.9 
--ctx-size 32000

Звучит сложно? На самом деле один раз сохранили в скрипт — и забыли.

Сравнение с альтернативами: почему не ChatGPT, не Claude и даже не NovelAI

ПараметрPageStorm 13BClaude Sonnet 4.6NovelAI Kayra
Макс. контекст128k (эффективно ~80k)200k (но быстро забывает начало)8k
СтоимостьБесплатно (open-source)$20/мес + лимиты$10-25/мес
Контроль сюжетаВысокий (Scaffold Attention)Средний (теряет детали)Низкий (не держит длинные арки)
Творческий стильБлизок к классике, но гибкийКорпоративно-вежливыйСпецифический (аниме/фанфики)
Локальный запускДа (16 ГБ VRAM)НетНет

Какую нейросеть выбрать для написания текста — вопрос, который мы разбирали отдельно. Если коротко: PageStorm — единственная бесплатная модель, которая не теряет нить повествования на дистанции в 10 глав. Claude 4.6 (по моему тесту) уже к 3-й главе «забывает», что герой — вегетарианец, и кормит его стейком.

Живой пример: сценарий финала детектива

Допустим, вы пишете детектив. Убийца — дворецкий, но читатель должен догадаться только в последней главе. PageStorm умеет держать «ложные следы» и выдавать их ровно в нужный момент. Я попросил модель написать сцену, где детектив впервые подозревает дворецкого, но не говорит об этом вслух:

prompt = """
Сюжетный скелет: убийца — дворецкий (Джеймс, 50 лет, 
педантичный). Детектив Смит только что заметил, что 
часы на камине показывают неправильное время — их 
переводили, чтобы создать алиби. Джеймс входит в комнату 
и предлагает чай. Смит должен скрыть подозрение, но 
читатель ощущает напряжение.
"""
# Результат через PageStorm (отредактирован для краткости):
"""
Смит проследил, как пальцы Джеймса сжались на ручке 
чайника чуть сильнее, чем нужно. Секунда — и он снова 
расслабился. «С сахаром или без?» — голос был ровным, 
даже ласковым. Но Смит уже видел, как дрожит край 
фарфоровой чашки, когда дворецкий ставит её на стол. 
«Без» — ответил детектив и улыбнулся, не разжимая зубов. 
В комнате запахло бергамотом и ложью.
"""

Модель не просто описывает действие — она выстраивает психологическое напряжение. Ни одна коробочная нейросеть (ChatGPT, Gemini) не даст такой плотности намеков без прямых указаний.

Кому PageStorm не подойдёт (честно)

  • Если вам нужен «генератор текста» на 5000 знаков для блога — идите к GPT или Claude. PageStorm слишком медленный для коротких форм.
  • Если пишете строго по плану и не хотите сюрпризов — модель может «выдумать» неожиданный поворот, который придётся править.
  • Если нет GPU с 12+ ГБ — забудьте. CPU-инференс на 13B модели даёт 1-2 токена в секунду (это как писать вручную, только с лагом).

Но если вы готовы к экспериментам — это лучший бесплатный инструмент для длинных нарративов. А если добавить автоматическую иллюстрацию глав через этот пайплайн генерации, получится конвейер по производству книг.

Прогноз: PageStorm убьёт рынок «литературных ассистентов»?

Думаю да, но не сразу. Тренировать LLM на своих EPUB — уже реальность. PageStorm — следующий шаг: модель, которая не просто учится на книгах, а понимает, как работает драматургия. Через год-два подобные open-source модели смогут писать целые романы с минимальным контролем. Вопрос не в технологии, а в том, готовы ли читатели принять книгу, написанную в соавторстве с алгоритмом. Лично я — готов. Особенно если PageStorm запомнит, что в 23-й главе у героини сломался телефон — и не заставит её звонить в финале.

Подписаться на канал