Что случилось? Тихий апгрейд, громкий счёт
Вчера вечером мой счёт от Z.ai прилетел на 43% больше обычного. Не паникуя (сначала), я открыл дашборд. Всё выглядело нормально: те же 10 тысяч токенов в день по Pro-плану за $29. Но детализация рассказала другую историю.
Оказалось, Z.ai тихо изменил правила игры. С 10 февраля 2026 года они ввели скрытый лимит на запросы к GLM-5 Turbo — 2000 в час вместо неограниченных. И спрятали это глубоко в обновлённых условиях, которые никто не читает. (Кто вообще читает эти документы после пятого обновления за месяц?)
Вот что изменилось на практике: если ваше приложение делает больше 2000 запросов в час к GLM-5 Turbo, Z.ai автоматически переключает часть трафика на более дорогую модель GLM-5 Pro. Без предупреждения. Без уведомления в интерфейсе. Просто тихий перерасход средств.
Почему это проблема больше, чем кажется
Звучит как техническая мелочь? Давайте посмотрим на цифры. GLM-5 Pro стоит $0.012 за 1K токенов против $0.003 у Turbo. Разница в четыре раза. При пиковой нагрузке (а у кого её нет?) ваш счёт может взлететь до небес, пока вы разбираетесь, что происходит.
| Модель | Старая цена (за 1K токенов) | Новая скрытая логика | Реальный эффект |
|---|---|---|---|
| GLM-5 Turbo | $0.003 | Лимит 2000 запросов/час | Превышение → переход на Pro |
| GLM-5 Pro | $0.012 | Автоматическое использование | +400% к стоимости |
| GLM-5 Ultra | $0.03 | Не затронута изменениями | Остаётся дорогой опцией |
Ирония в том, что Z.ai позиционирует себя как «прозрачный и developer-friendly» провайдер. Их маркетинг говорит о предсказуемости цен. Но реальность оказалась другой. (Помните историю про цену на токены? Вот он, живой пример.)
Как это обнаружили? Сообщество против молчания
Первыми забили тревогу не корпоративные клиенты, а небольшие стартапы. Почему? Потому что у них нет команды юристов, читающих каждый пункт обновлений. Они просто увидели счета и начали искать причину.
На Reddit и Hacker News за неделю набралось больше 200 постов с одинаковой проблемой: «Почему мой счёт вырос?» И только после этого Z.ai признал изменения — в ответе на поддержку, а не в публичном объявлении.
Пять способов защитить свой бюджет прямо сейчас
Ждать, что провайдеры станут честнее сами по себе — наивно. Особенно в свете пузыря AI-инфраструктуры. Действуйте проактивно.
1 Настройте алерты на превышение лимитов
Не доверяйте дашбордам провайдеров. Используйте внешние инструменты мониторинга. Prometheus + Grafana могут отслеживать запросы к API в реальном времени. Настройте алерт при достижении 1500 запросов в час — у вас будет время среагировать.
2 Используйте прокси-слой для контроля
Разверните простой прокси-сервер между вашим приложением и Z.ai API. Он будет считать запросы, ограничивать их при необходимости и логировать всё. Python-скрипт на FastAPI займёт пару часов разработки, но сэкономит тысячи долларов.
3 Договоритесь о фиксированной ставке
Если ваш трафик стабильно высокий, требуйте фиксированную месячную цену. Многие провайдеры идут на это ради крупных клиентов. Особенно актуально после истории с Snowflake и OpenAI — корпорации уже поняли цену переговорной силы.
4 Дублируйте критическую нагрузку
Не храните все яйца в одной корзине. Настройте fallback на другой провайдер (Anthropic с их Opus 4.6 или локальные модели). Если Z.ai начнёт дорожать дальше, вы сможете переключиться без остановки сервиса.
5 Требуйте прозрачности по умолчанию
Пишите в поддержку. Задавайте вопросы публично. Когда сотни разработчиков начинают требовать чётких условий, провайдеры вынуждены реагировать. Молчание стоит вам денег — делайте шум.
Что будет дальше? Прогноз на 2026
Это не последний случай. С ростом стоимости железа (вспомните историю Nvidia с предоплатой) и ужесточением регуляций (GDPR-совместимый ИИ становится головной болью), провайдеры будут искать способы сохранить маржу.
Ожидайте больше скрытых изменений: лимиты на контекстные окна, плата за fine-tuning API, дифференцированные цены по регионам. И да, это коснётся не только Z.ai. Когда один крупный игрок начинает экономить на прозрачности, другие подхватывают тренд.
Мой совет? Отнеситесь к AI-провайдерам как к облачным платформам начала 2010-х. Тогда AWS тоже меняла цены без предупреждения, пока сообщество не заставило их стать прозрачнее. Тот же путь ждёт и ИИ-индустрию — но только если мы будем шуметь громче их бухгалтерских отделов.
А пока проверяйте свои счета. Настраивайте мониторинг. И помните: в мире, где ИИ становится «дорогой cron-задачей», каждая копейка на счету. Особенно когда её тихо забирают без спроса.