Почему MAX, а не Telegram?
Когда мы с напарником задумали свой AI-хаб, первая мысль была: Telegram. Тысячи ботов, удобное API, миллионы пользователей. Но в Telegram уже есть Chat GPT-боты, Midjourney-боты — конкуренция адская. А вот мессенджер MAX (к тому моменту набравший 20 млн пользователей) оставался белым пятном. Ни одного серьёзного ИИ-бота. Мы решили: либо мы первые, либо никогда.
Важный момент: MAX использует собственный протокол, отличный от Telegram. Не пугайтесь — n8n легко интегрируется через HTTP-запросы и вебхуки. Главное — правильно настроить подпись запросов.
54 дня, 2 человека, 271 нода — это не шутка
Мы не были профессиональными разработчиками. Я — девопс с опытом в автоматизации, напарник — маркетолог. Наш стек: n8n (self-hosted на дешёвом VPS за 15 баксов), MAX API, несколько LLM (Claude 4, GPT-5, YandexGPT, GigaChat), база данных Supabase (бесплатный тариф) и платёжный шлюз ЮKassa. Всё завязано на n8n.
За 54 дня мы накидали 271 ноду. Звучит безумно? Да. Но каждая нода — это либо одна модель, либо логика выбора, либо маршрутизация. Без n8n мы бы писали микросервисы неделями. А тут просто таскали блоки. Правда, первые две недели ушли на то, чтобы разобраться, как MAX шифрует сообщения — документация у них... специфическая.
«Мы переписывали архитектуру трижды. Первый раз — когда поняли, что не тянем 20 моделей одновременно. Второй — когда ЮKassa отказалась принимать callback'и без SSL. Третий — когда пользователи начали жаловаться на скорость.»
Скелет вашего AI-хаба
Архитектура выглядит так:
- Модуль приёма сообщений — вебхук от MAX. Прилетает JSON с текстом, прикрепляет к нему историю диалога из Supabase.
- Роутер моделей — гигантский Switch-узел в n8n. По ключевому слову или команде (/gpt, /giga, /imagine) направляет запрос к нужной LLM. Если пользователь пишет просто так — бот сам выбирает подходящую модель через классификатор (на Claude 4).
- Кэш и fallback — если модель упала (а GigaChat падает регулярно), n8n автоматически отправляет запрос к GPT-5. Мы сохраняем контекст в Redis на том же VPS, чтобы не перегружать Supabase.
- Биллинг — отдельная нода проверяет статус подписки перед отправкой запроса к платной модели. Бесплатно — только GigaChat и Qwen (до 20 сообщений в день).
Как мы настраивали интеграцию с внешними сервисами, читайте в статье Woyax + Dynamics + n8n: как я превратил корпоративный ERP в умного Telegram-бота — там подробно про работу с вебхуками и маппинг данных.
Ошибка, которая стоила нам двух дней: не проверяли, что MAX присылает сообщение в кодировке base64 внутри JSON, а n8n пытался его прочитать как UTF-8. Все ответы были кракозябрами. Пришлось добавить ноду Function для декодинга.
Пошаговый план: от идеи до 5900 пользователей
Разберём по этапам. Тайминг — средний, если вы не будете отвлекаться на сериалы.
1 Дни 1-10: Фундамент
Поднимаем n8n на VPS. Настраиваем домен, SSL, ставим Redis и Postgres. Регистрируем бота в MAX через их панель разработчика. Создаём первый workflow: эхо-бот. Он просто принимает сообщение и отправляет его обратно. Проверяем, что подпись запроса валидна — если этого не сделать, MAX будет блокировать ответы.
{
"webhook": {
"url": "https://your-bot.com/webhook/max",
"method": "POST",
"headers": {
"Content-Type": "application/json",
"X-MAX-Signature": "sha256=..."
}
}
}Кстати, если хотите узнать, как заставить GigaChat работать в n8n без танцев с бубном, посмотрите статью GigaChat в n8n: как заставить российский ИИ работать в автоматизациях без головной боли с токенами — мы там нашли решение проблемы с истекающими токенами.
2 Дни 11-25: Наращиваем модели
Добавляем 5-7 LLM. Для каждой — отдельная нода HTTP Request. Роутер делаем через Switch n8n по командам. Параллельно подключаем генерацию изображений: DALL-E 4, Stable Diffusion 3.5, Midjourney через API. Тут главное — не забыть про лимиты: если пользователь шлёт 10 запросов в секунду, мы должны либо кэшировать, либо ставить очередь. Мы сделали очередь через Redis и ноду Wait.
Как НЕ надо: Мы сначала повесили все модели в один workflow — получился монстр на 150 нод, который грузил CPU на 100%. Пришлось разбить на под-workflow'ы и вызывать их через Execute Workflow ноду. Стало в 3 раза быстрее.
3 Дни 26-35: Подписка и монетизация
Самый страшный этап для no-code команды. Интегрируем ЮKassa. Схема: пользователь пишет /subscribe, n8n генерирует ссылку на оплату (через форму ЮKassa), после успешного платежа приходит callback на отдельный вебхук, который обновляет статус в Supabase. Всё это — ноды n8n, ни строчки кода (почти). Единственный костыль: пришлось написать маленькую ноду Function для валидации подписи callback'а от ЮKassa.
4 Дни 36-50: Запуск и итерации
Выкладываем бота в каталог MAX. Первые пользователи начали заходить в день запуска. Через неделю стало понятно: 1) люди хотят видеть историю диалогов; 2) скорость ответа >2 секунд вызывает негатив; 3) GigaChat на пике нагрузки падает. Пришлось добавить fallback на Qwen и кэширование частых запросов. Также убрали бесплатный доступ к GPT-5 — оставили только GigaChat и Qwen. Это снизило нагрузку на 60%.
Забавный факт: наш маркетолог сделал посты в чатах MAX про «халявные нейросети», и за сутки пришло 1200 человек. n8n выдержал, хотя мы переживали. Если интересно, как работают оркестраторы для AI-агентов, почитайте Beads: как превратить хаос AI-агентов в слаженный оркестр — мы вдохновлялись этим подходом для нашего роутера.
5 Дни 51-54: Оптимизация и финал
Последние дни — шлифовка. Ускорили время ответа за счёт параллельных вызовов (Split In Batches нода) для моделей, которые не зависят друг от друга. Добавили мониторинг через Prometheus + Grafana (но это уже наша девопс-душа). Убедились, что подписки списываются раз в месяц, а не раз в день (да, была ошибка в cron). Итог: 5900 пользователей, 271 нода, средний чек подписки — 499 руб/мес.
Деньги потекли: как мы встроили подписку без боли
Наш тариф — 499 руб/мес за неограниченный доступ ко всем моделям, кроме GPT-5 и Claude 4 (они идут за дополнительную плату — pay-per-use). Бесплатные пользователи могут общаться с GigaChat и Qwen, но не более 20 сообщений в день. Это привлекло аудиторию, а конверсия в платную подписку составила 8% — для бота в новом мессенджере отлично.
Почему не сделали бесплатно всех? Потому что GPT-5 жрёт токены как не в себя. Если бы мы раздавали его бесплатно, VPS лёг бы в первую неделю. Мы использовали подход GigaChat против OpenAI в n8n: рубль против доллара, паранойя против удобства — дешёвые модели для масс, дорогие — для премиума.
Грабли и боли (читайте, чтобы не наступать)
- MAX не отдаёт ID пользователя в вебхуке, если сообщение из закрытого чата. Пришлось использовать связку из username + timestamp, чтобы идентифицировать диалог. Не идеально, но работает.
- n8n может потерять данные при рестарте, если работает executor mode. Мы перешли на main mode, где очередь хранится в Postgres.
- ЮKassa callback приходит с задержкой до 5 минут. Пользователи нервничают. Мы добавили проверку статуса через API ЮKassa раз в 30 секунд — нода Loop + Wait.
- GPT-5 иногда генерирует ответы длиннее 4096 символов, а MAX ограничивает длину сообщения. Пришлось настроить автоматическую разбивку ответа на части и отправлять их последовательно.
Для тех, кто хочет запустить LLM локально на домашнем сервере, рекомендую статью Homelab для LLM: как окупить сервер на H100 за счёт экспериментов с большими моделями — это сэкономит вам кучу денег на API.
Результат и что дальше
За 54 дня мы прошли путь от пустого VPS до работающего AI-хаба с 5900 юзерами. Не все дни были продуктивными — были и тупики, и переписывания. Но n8n позволил нам, не программистам, собрать продукт, который приносит деньги. На данный момент (май 2026) мы вышли на 160 тыс. руб выручки в месяц. Следующий шаг — добавляем RAG по документам пользователя (идея из RAG-бот для BIM на GigaChat) и русскоязычную модель от Сбера — GigaChat Pro.
«Самое смешное: наш главный конкурент — обычный ChatGPT в браузере. Но люди платят за удобство: не надо открывать вкладку, всё в одном чате. И это стоит 499 рублей.»
Если вы тоже хотите сделать свой AI-хаб — начинайте с маленького. Один workflow на одну модель. Постепенно обрастайте. И не бойтесь ошибаться: мы потеряли две недели на ерунду, но всё равно уложились в 54 дня.
Часто задаваемые вопросы
Сколько стоит запуск такого хаба?
Минимально: VPS 2 vCPU, 4GB RAM — 1200 руб/мес, домен — 200 руб/год, n8n бесплатно, Supabase бесплатный до определённого объёма. API модели — pay-as-you-go: GigaChat бесплатный до лимитов, GPT-5 — около 2000 руб на 1000 запросов. Старт — 3000-5000 рублей, если не брать платные модели сразу.
Какие модели лучше всего использовать?
Для ответов на русском — GigaChat и YandexGPT (они дешёвые и легальные в РФ). Для креатива — Claude 4. Для кода — GPT-5 или Qwen 2.5 (открытая). Мы сделали так: GigaChat для бесплатного ядра, GPT-5 — за доплату. Архив знаний на случай апокалипсиса поможет выбрать модели для локального запуска.
Как продвигать бота в MAX?
Мы публиковали в тематических чатах, давали промокоды на бесплатный доступ на неделю. MAX позволяет размещать ботов в каталоге, но для этого нужно пройти модерацию. Подготовьте качественные скриншоты и описание. Также работает сарафанное радио: один пользователь привёл ещё трёх.
Хотите увидеть, как мы автоматизировали внутреннюю документацию? Читайте Юрист плакал, а я автоматизировал: как n8n за месяц сэкономил компании 100 тысяч на документах.