Что именно изменил Z.ai в Pro-плане?

Z.ai ввёл скрытый лимит в 2000 запросов в час для модели GLM-5 Turbo. При превышении этого лимита трафик автоматически переключается на более дорогую модель GLM-5 Pro без уведомления пользователя.

Как проверить, затронули ли меня эти изменения?

Зайдите в раздел Billing → Usage Details в вашем аккаунте Z.ai и проверьте распределение запросов по моделям за последние 7 дней. Если видите GLM-5 Pro там, где раньше был только Turbo, изменения вас коснулись.

Какие инструменты помогут контролировать расходы на AI-API?

Используйте Prometheus + Grafana для мониторинга запросов в реальном времени, настройте прокси-слой для контроля трафика, договоритесь о фиксированных тарифах при высоком объёме и настройте алерты при приближении к лимитам.

Это единичный случай или тренд среди AI-провайдеров?

Скорее всего, это начало тренда. С ростом стоимости инфраструктуры и ужесточением конкуренции другие провайдеры могут последовать примеру Z.ai со скрытыми изменениями тарифной политики.

Скандал Z.ai: скрытое снижение лимитов Pro-плана и защита расходов

Что случилось? Тихий апгрейд, громкий счёт

Вчера вечером мой счёт от Z.ai прилетел на 43% больше обычного. Не паникуя (сначала), я открыл дашборд. Всё выглядело нормально: те же 10 тысяч токенов в день по Pro-плану за $29. Но детализация рассказала другую историю.

Оказалось, Z.ai тихо изменил правила игры. С 10 февраля 2026 года они ввели скрытый лимит на запросы к GLM-5 Turbo — 2000 в час вместо неограниченных. И спрятали это глубоко в обновлённых условиях, которые никто не читает. (Кто вообще читает эти документы после пятого обновления за месяц?)

Вот что изменилось на практике: если ваше приложение делает больше 2000 запросов в час к GLM-5 Turbo, Z.ai автоматически переключает часть трафика на более дорогую модель GLM-5 Pro. Без предупреждения. Без уведомления в интерфейсе. Просто тихий перерасход средств.

Почему это проблема больше, чем кажется

Звучит как техническая мелочь? Давайте посмотрим на цифры. GLM-5 Pro стоит $0.012 за 1K токенов против $0.003 у Turbo. Разница в четыре раза. При пиковой нагрузке (а у кого её нет?) ваш счёт может взлететь до небес, пока вы разбираетесь, что происходит.

Модель	Старая цена (за 1K токенов)	Новая скрытая логика	Реальный эффект
GLM-5 Turbo	$0.003	Лимит 2000 запросов/час	Превышение → переход на Pro
GLM-5 Pro	$0.012	Автоматическое использование	+400% к стоимости
GLM-5 Ultra	$0.03	Не затронута изменениями	Остаётся дорогой опцией

Ирония в том, что Z.ai позиционирует себя как «прозрачный и developer-friendly» провайдер. Их маркетинг говорит о предсказуемости цен. Но реальность оказалась другой. (Помните историю про цену на токены? Вот он, живой пример.)

Как это обнаружили? Сообщество против молчания

Первыми забили тревогу не корпоративные клиенты, а небольшие стартапы. Почему? Потому что у них нет команды юристов, читающих каждый пункт обновлений. Они просто увидели счета и начали искать причину.

На Reddit и Hacker News за неделю набралось больше 200 постов с одинаковой проблемой: «Почему мой счёт вырос?» И только после этого Z.ai признал изменения — в ответе на поддержку, а не в публичном объявлении.

💡

Проверьте свой аккаунт Z.ai прямо сейчас. Зайдите в Billing → Usage Details и посмотрите распределение по моделям за последние 7 дней. Если видите GLM-5 Pro там, где раньше был только Turbo, вас уже коснулись изменения.

Пять способов защитить свой бюджет прямо сейчас

Ждать, что провайдеры станут честнее сами по себе — наивно. Особенно в свете пузыря AI-инфраструктуры. Действуйте проактивно.

1 Настройте алерты на превышение лимитов

Не доверяйте дашбордам провайдеров. Используйте внешние инструменты мониторинга. Prometheus + Grafana могут отслеживать запросы к API в реальном времени. Настройте алерт при достижении 1500 запросов в час — у вас будет время среагировать.

2 Используйте прокси-слой для контроля

Разверните простой прокси-сервер между вашим приложением и Z.ai API. Он будет считать запросы, ограничивать их при необходимости и логировать всё. Python-скрипт на FastAPI займёт пару часов разработки, но сэкономит тысячи долларов.

3 Договоритесь о фиксированной ставке

Если ваш трафик стабильно высокий, требуйте фиксированную месячную цену. Многие провайдеры идут на это ради крупных клиентов. Особенно актуально после истории с Snowflake и OpenAI — корпорации уже поняли цену переговорной силы.

4 Дублируйте критическую нагрузку

Не храните все яйца в одной корзине. Настройте fallback на другой провайдер (Anthropic с их Opus 4.6 или локальные модели). Если Z.ai начнёт дорожать дальше, вы сможете переключиться без остановки сервиса.

5 Требуйте прозрачности по умолчанию

Пишите в поддержку. Задавайте вопросы публично. Когда сотни разработчиков начинают требовать чётких условий, провайдеры вынуждены реагировать. Молчание стоит вам денег — делайте шум.

Что будет дальше? Прогноз на 2026

Это не последний случай. С ростом стоимости железа (вспомните историю Nvidia с предоплатой) и ужесточением регуляций (GDPR-совместимый ИИ становится головной болью), провайдеры будут искать способы сохранить маржу.

Ожидайте больше скрытых изменений: лимиты на контекстные окна, плата за fine-tuning API, дифференцированные цены по регионам. И да, это коснётся не только Z.ai. Когда один крупный игрок начинает экономить на прозрачности, другие подхватывают тренд.

Мой совет? Отнеситесь к AI-провайдерам как к облачным платформам начала 2010-х. Тогда AWS тоже меняла цены без предупреждения, пока сообщество не заставило их стать прозрачнее. Тот же путь ждёт и ИИ-индустрию — но только если мы будем шуметь громче их бухгалтерских отделов.

А пока проверяйте свои счета. Настраивайте мониторинг. И помните: в мире, где ИИ становится «дорогой cron-задачей», каждая копейка на счету. Особенно когда её тихо забирают без спроса.

Тихий грабёж: как Z.ai скрыто урезал лимиты Pro-плана и что делать, чтобы не переплачивать