Создание AI-хаба в MAX на n8n за 54 дня: полный гайд

Почему MAX, а не Telegram?

Когда мы с напарником задумали свой AI-хаб, первая мысль была: Telegram. Тысячи ботов, удобное API, миллионы пользователей. Но в Telegram уже есть Chat GPT-боты, Midjourney-боты — конкуренция адская. А вот мессенджер MAX (к тому моменту набравший 20 млн пользователей) оставался белым пятном. Ни одного серьёзного ИИ-бота. Мы решили: либо мы первые, либо никогда.

Важный момент: MAX использует собственный протокол, отличный от Telegram. Не пугайтесь — n8n легко интегрируется через HTTP-запросы и вебхуки. Главное — правильно настроить подпись запросов.

54 дня, 2 человека, 271 нода — это не шутка

Мы не были профессиональными разработчиками. Я — девопс с опытом в автоматизации, напарник — маркетолог. Наш стек: n8n (self-hosted на дешёвом VPS за 15 баксов), MAX API, несколько LLM (Claude 4, GPT-5, YandexGPT, GigaChat), база данных Supabase (бесплатный тариф) и платёжный шлюз ЮKassa. Всё завязано на n8n.

За 54 дня мы накидали 271 ноду. Звучит безумно? Да. Но каждая нода — это либо одна модель, либо логика выбора, либо маршрутизация. Без n8n мы бы писали микросервисы неделями. А тут просто таскали блоки. Правда, первые две недели ушли на то, чтобы разобраться, как MAX шифрует сообщения — документация у них... специфическая.

«Мы переписывали архитектуру трижды. Первый раз — когда поняли, что не тянем 20 моделей одновременно. Второй — когда ЮKassa отказалась принимать callback'и без SSL. Третий — когда пользователи начали жаловаться на скорость.»

Скелет вашего AI-хаба

Архитектура выглядит так:

Модуль приёма сообщений — вебхук от MAX. Прилетает JSON с текстом, прикрепляет к нему историю диалога из Supabase.
Роутер моделей — гигантский Switch-узел в n8n. По ключевому слову или команде (/gpt, /giga, /imagine) направляет запрос к нужной LLM. Если пользователь пишет просто так — бот сам выбирает подходящую модель через классификатор (на Claude 4).
Кэш и fallback — если модель упала (а GigaChat падает регулярно), n8n автоматически отправляет запрос к GPT-5. Мы сохраняем контекст в Redis на том же VPS, чтобы не перегружать Supabase.
Биллинг — отдельная нода проверяет статус подписки перед отправкой запроса к платной модели. Бесплатно — только GigaChat и Qwen (до 20 сообщений в день).

Как мы настраивали интеграцию с внешними сервисами, читайте в статье Woyax + Dynamics + n8n: как я превратил корпоративный ERP в умного Telegram-бота — там подробно про работу с вебхуками и маппинг данных.

Ошибка, которая стоила нам двух дней: не проверяли, что MAX присылает сообщение в кодировке base64 внутри JSON, а n8n пытался его прочитать как UTF-8. Все ответы были кракозябрами. Пришлось добавить ноду Function для декодинга.

Пошаговый план: от идеи до 5900 пользователей

Разберём по этапам. Тайминг — средний, если вы не будете отвлекаться на сериалы.

1 Дни 1-10: Фундамент

Поднимаем n8n на VPS. Настраиваем домен, SSL, ставим Redis и Postgres. Регистрируем бота в MAX через их панель разработчика. Создаём первый workflow: эхо-бот. Он просто принимает сообщение и отправляет его обратно. Проверяем, что подпись запроса валидна — если этого не сделать, MAX будет блокировать ответы.

{
  "webhook": {
    "url": "https://your-bot.com/webhook/max",
    "method": "POST",
    "headers": {
      "Content-Type": "application/json",
      "X-MAX-Signature": "sha256=..."
    }
  }
}

Кстати, если хотите узнать, как заставить GigaChat работать в n8n без танцев с бубном, посмотрите статью GigaChat в n8n: как заставить российский ИИ работать в автоматизациях без головной боли с токенами — мы там нашли решение проблемы с истекающими токенами.

2 Дни 11-25: Наращиваем модели

Добавляем 5-7 LLM. Для каждой — отдельная нода HTTP Request. Роутер делаем через Switch n8n по командам. Параллельно подключаем генерацию изображений: DALL-E 4, Stable Diffusion 3.5, Midjourney через API. Тут главное — не забыть про лимиты: если пользователь шлёт 10 запросов в секунду, мы должны либо кэшировать, либо ставить очередь. Мы сделали очередь через Redis и ноду Wait.

Как НЕ надо: Мы сначала повесили все модели в один workflow — получился монстр на 150 нод, который грузил CPU на 100%. Пришлось разбить на под-workflow'ы и вызывать их через Execute Workflow ноду. Стало в 3 раза быстрее.

3 Дни 26-35: Подписка и монетизация

Самый страшный этап для no-code команды. Интегрируем ЮKassa. Схема: пользователь пишет /subscribe, n8n генерирует ссылку на оплату (через форму ЮKassa), после успешного платежа приходит callback на отдельный вебхук, который обновляет статус в Supabase. Всё это — ноды n8n, ни строчки кода (почти). Единственный костыль: пришлось написать маленькую ноду Function для валидации подписи callback'а от ЮKassa.

💡

Совет: Для платных моделей мы использовали отдельный workflow, который проверяет подписку перед вызовом. Если просрочена — бот отправляет сообщение с предложением продлить. Никогда не доверяйте статусу на фронтенде — проверяйте на бэкенде.

4 Дни 36-50: Запуск и итерации

Выкладываем бота в каталог MAX. Первые пользователи начали заходить в день запуска. Через неделю стало понятно: 1) люди хотят видеть историю диалогов; 2) скорость ответа >2 секунд вызывает негатив; 3) GigaChat на пике нагрузки падает. Пришлось добавить fallback на Qwen и кэширование частых запросов. Также убрали бесплатный доступ к GPT-5 — оставили только GigaChat и Qwen. Это снизило нагрузку на 60%.

Забавный факт: наш маркетолог сделал посты в чатах MAX про «халявные нейросети», и за сутки пришло 1200 человек. n8n выдержал, хотя мы переживали. Если интересно, как работают оркестраторы для AI-агентов, почитайте Beads: как превратить хаос AI-агентов в слаженный оркестр — мы вдохновлялись этим подходом для нашего роутера.

5 Дни 51-54: Оптимизация и финал

Последние дни — шлифовка. Ускорили время ответа за счёт параллельных вызовов (Split In Batches нода) для моделей, которые не зависят друг от друга. Добавили мониторинг через Prometheus + Grafana (но это уже наша девопс-душа). Убедились, что подписки списываются раз в месяц, а не раз в день (да, была ошибка в cron). Итог: 5900 пользователей, 271 нода, средний чек подписки — 499 руб/мес.

Деньги потекли: как мы встроили подписку без боли

Наш тариф — 499 руб/мес за неограниченный доступ ко всем моделям, кроме GPT-5 и Claude 4 (они идут за дополнительную плату — pay-per-use). Бесплатные пользователи могут общаться с GigaChat и Qwen, но не более 20 сообщений в день. Это привлекло аудиторию, а конверсия в платную подписку составила 8% — для бота в новом мессенджере отлично.

Почему не сделали бесплатно всех? Потому что GPT-5 жрёт токены как не в себя. Если бы мы раздавали его бесплатно, VPS лёг бы в первую неделю. Мы использовали подход GigaChat против OpenAI в n8n: рубль против доллара, паранойя против удобства — дешёвые модели для масс, дорогие — для премиума.

Грабли и боли (читайте, чтобы не наступать)

MAX не отдаёт ID пользователя в вебхуке, если сообщение из закрытого чата. Пришлось использовать связку из username + timestamp, чтобы идентифицировать диалог. Не идеально, но работает.
n8n может потерять данные при рестарте, если работает executor mode. Мы перешли на main mode, где очередь хранится в Postgres.
ЮKassa callback приходит с задержкой до 5 минут. Пользователи нервничают. Мы добавили проверку статуса через API ЮKassa раз в 30 секунд — нода Loop + Wait.
GPT-5 иногда генерирует ответы длиннее 4096 символов, а MAX ограничивает длину сообщения. Пришлось настроить автоматическую разбивку ответа на части и отправлять их последовательно.

Для тех, кто хочет запустить LLM локально на домашнем сервере, рекомендую статью Homelab для LLM: как окупить сервер на H100 за счёт экспериментов с большими моделями — это сэкономит вам кучу денег на API.

Результат и что дальше

За 54 дня мы прошли путь от пустого VPS до работающего AI-хаба с 5900 юзерами. Не все дни были продуктивными — были и тупики, и переписывания. Но n8n позволил нам, не программистам, собрать продукт, который приносит деньги. На данный момент (май 2026) мы вышли на 160 тыс. руб выручки в месяц. Следующий шаг — добавляем RAG по документам пользователя (идея из RAG-бот для BIM на GigaChat) и русскоязычную модель от Сбера — GigaChat Pro.

«Самое смешное: наш главный конкурент — обычный ChatGPT в браузере. Но люди платят за удобство: не надо открывать вкладку, всё в одном чате. И это стоит 499 рублей.»

Если вы тоже хотите сделать свой AI-хаб — начинайте с маленького. Один workflow на одну модель. Постепенно обрастайте. И не бойтесь ошибаться: мы потеряли две недели на ерунду, но всё равно уложились в 54 дня.

Часто задаваемые вопросы

Сколько стоит запуск такого хаба?

Минимально: VPS 2 vCPU, 4GB RAM — 1200 руб/мес, домен — 200 руб/год, n8n бесплатно, Supabase бесплатный до определённого объёма. API модели — pay-as-you-go: GigaChat бесплатный до лимитов, GPT-5 — около 2000 руб на 1000 запросов. Старт — 3000-5000 рублей, если не брать платные модели сразу.

Какие модели лучше всего использовать?

Для ответов на русском — GigaChat и YandexGPT (они дешёвые и легальные в РФ). Для креатива — Claude 4. Для кода — GPT-5 или Qwen 2.5 (открытая). Мы сделали так: GigaChat для бесплатного ядра, GPT-5 — за доплату. Архив знаний на случай апокалипсиса поможет выбрать модели для локального запуска.

Как продвигать бота в MAX?

Мы публиковали в тематических чатах, давали промокоды на бесплатный доступ на неделю. MAX позволяет размещать ботов в каталоге, но для этого нужно пройти модерацию. Подготовьте качественные скриншоты и описание. Также работает сарафанное радио: один пользователь привёл ещё трёх.

Хотите увидеть, как мы автоматизировали внутреннюю документацию? Читайте Юрист плакал, а я автоматизировал: как n8n за месяц сэкономил компании 100 тысяч на документах.

Подписаться на канал

Как за 54 дня собрать ИИ-хаб в мессенджере MAX на n8n: полный гайд для старта