Знаете это чувство? Глаза уже слипаются, а до конца главы ещё тыща страниц. Или наоборот — руки заняты, варишь борщ, а в ушах тишина. Можно включить аудиокнигу, но её нет в открытом доступе, а покупать за 500 рублей — влом. И тут на сцену выходит OpenReader — open-source сервер, который превращает любую электронную книгу в аудио прямо у вас на железе, с подсветкой текста и без ежемесячной подписки.
OpenReader — это не просто конвертер. Это веб-сервер, который вы ставите на свой NAS, Raspberry Pi или старый ноутбук. Загружаете EPUB, PDF, DOCX, TXT или MD — и слушаете в браузере, с синхронно подсвечивающимся текстом. А хотите — скачиваете готовую аудиокнигу (M4B/MP3) и таскаете на плеере.
Чем он лучше Balabolki и прочих монстров?
На рынке куча софта для чтения вслух. Balabolka — классика, но она десктопная только под Windows. NaturalReader — удобно, но платите либо за облако, либо за лицензию. Speechify — крут, но стоит как подписка на Netflix. А OpenReader — бесплатный, с открытым кодом, и, что важнее, ваш. Вы контролируете, какие TTS-движки использовать, где хранить библиотеку и кто к ней имеет доступ.
Пара ключевых отличий от типовых решений:
- Серверная архитектура — читаете с телефона, планшета, ноутбука из одной точки. Всё в браузере, никаких установок на клиентах.
- Синхронная подсветка — слова подсвечиваются при произношении. Если отвлёкся, глаз цепляется за текущее место, не теряешь нить.
- Экспорт в аудиокниги — можно сгенерировать файл и слушать офлайн в любом плеере. Полезно, когда едете в метро без интернета.
- Любой TTS-бэкенд — от быстрого eSpeak до нейросетевых Kokoro 82M, XTTS или даже Qwen3 TTS. Выбор за вами.
1 Запуск в Docker за три минуты
Разработчики явно дружат с контейнерами — вариант запуска через Docker самый простой. Никакой возни с зависимостями, просто тянете образ и поднимаете:
docker run -d --name openreader -p 8080:8080 \
-v /path/to/books:/books \
-v /path/to/config:/config \
ghcr.io/openreader/server:latest
После этого открываете браузер на http://ваш-сервер:8080 — и готово. Загружаете книгу, выбираете голос, жмёте «Play». Если хотите скачать аудиоверсию, нажимаете «Export» и получаете M4B с главами.
Внимание: для экспорта в аудиокнигу понадобится FFmpeg внутри контейнера (идёт в комплекте). Если используете кастомный образ — не забудьте его установить.
Какой TTS выбрать? (спойлер: не гонитесь за идеалом)
OpenReader поддерживает несколько движков. По умолчанию стоит eSpeak-NG — быстрый, но с роботизированным голосом. Для черновиков и быстрого пролистывания сойдёт. А вот для комфортного прослушивания лучше подключить нейросетевой модуль.
Если у вас есть GPU, смело ставьте Kokoro 82M (см. нашу статью про Kokoro TTS на Android — там похожий принцип). Он даёт очень естественную речь, почти неотличимую от человека. Без GPU подойдёт Pocket TTS — лёгкая 100M-модель, которая шустро работает на CPU (мы это уже обкатывали в Pocket TTS).
А для полного кайфа — подключите XTTS и склонируйте голос диктора, как мы делали в гайде «Книги на слух без облаков». Только учтите: XTTS требует 8+ ГБ видеопамяти, иначе будет генерировать по 5 секунд на предложение.
| Движок | Качество | Скорость (CPU) | GPU | Когда использовать |
|---|---|---|---|---|
| eSpeak-NG | Низкое (робот) | Мгновенно | Не нужен | Черновик, быстрый просмотр |
| Pocket TTS | Среднее | Быстро (реал-тайм) | Опционально | Ежедневное чтение на CPU |
| Kokoro 82M | Высокое | Медленно | Желателен | Домашний сервер с GPU |
| XTTS | Отличное (клон голоса) | Очень медленно | Обязателен (8+ ГБ) | Когда нужен конкретный голос |
Сравнение с подходами из наших предыдущих гайдов
За последние месяцы мы уже публиковали пайплайн PDF в аудиокнигу на Kokoro + Qwen и конвертер на Qwen3 TTS. Те решения — универсальные скрипты, которые вы дёргаете из командной строки. OpenReader же даёт веб-интерфейс: загрузил, нажал кнопку, слушаешь. Не нужно писать скрипты под каждую книгу.
Если у вас NAS Synology или QNAP — OpenReader встанет поверх Docker и будет доступен всей семье. А вот мобильное приложение у него отсутствует, но это не беда — прогрессивный веб-интерфейс нормально работает в браузере Android/iOS.
Кому это реально нужно?
- Владельцам NAS — докер-контейнер, общая библиотека, доступ из любой точки дома. Идеально.
- Ученикам и студентам — слушать учебники по дороге на пары. PDF с подсветкой помогает запоминать.
- Людям с дислексией или проблемами со зрением — озвучка с синхронным текстом снижает нагрузку на глаза.
- Любителям аудиокниг, которые не хотят кормить Amazon — конвертируете свою библиотеку раз и навсегда, никаких DRM.
- Тем, кто уже пробовал собирать пайплайны вручную — OpenReader избавляет от рутины, но оставляет гибкость выбора TTS.
Честно говоря, единственный минус, который я вижу — для новичка настройка TTS-бэкенда может показаться сложной. Но разработчики сделали docker-compose.yml с примерами для eSpeak и Pocket TTS. Просто копируете, правите пару строк, запускаете.
Неочевидный совет напоследок
Не пытайтесь с первой секунды поставить XTTS с клонированием голоса Ганса Циммера (шучу, но суть ясна). Для ежедневного фонового прослушивания — Pocket TTS на CPU даёт 90% комфорта при 10% затрат. А XTTS или Kokoro включайте только для финального экспорта качественной аудиокниги, которую собираетесь слушать на хорошем плеере. Поверьте, экономия времени на генерации оправдывает себя — вы потратите меньше нервов, а результат будет почти такой же.