Разработчики, влюбившиеся в Claude Code, начинают испытывать раздражение. Ещё месяц назад инструмент летал — рефакторил код, разворачивал микросервисы, писал тесты. Сегодня в терминале всё чаще всплывает серое Rate limit exceeded. Или того хуже — сообщение о недоступности вычислительных ресурсов. Anthropic пытается тушить пожар шлангом, но шланг оказался слишком тонким.
Взрывной рост, которого никто не ждал
По данным внутренней аналитики, количество активных сессий Claude Code выросло в 80 раз с начала года. Инструмент перестал быть игрушкой для гиков — его используют в продакшене такие гиганты, как SpaceX. Илон Маск лично демонстрировал на Code with Claude 2026, как инженеры пишут код для Starship прямо в терминале. Звучит круто, но цена такого успеха — колоссальная нагрузка на инфраструктуру.
Сухие цифры:
- 80x — рост числа разработчиков, запускающих Claude Code
- Среднее количество запросов на пользователя выросло в 3 раза за квартал
- Более 40% сессий упираются в лимиты compute, а не в токены
Проблема усугубляется тем, что Claude Code — агентный инструмент. Он не просто генерирует текст, он выполняет команды, анализирует окружение, запускает песочницы. Каждое действие требует гораздо больше compute, чем обычный чат. В прошлой статье мы уже предупреждали: дефицит compute станет узким горлышком.
Удвоение лимитов — паллиатив или решение?
17 мая 2026 года Anthropic объявила о новом раунде расширения лимитов. Продакт-лид Cat Wu в интервью объясняла стратегию: "Мы удваиваем usage limits для всех платных пользователей и вводим более гибкие тарифы для enterprise". Звучит обнадеживающе, но на практике многие разработчики жалуются, что лимиты заканчиваются через час активной работы.
💡 Нюанс: удвоение лимитов не равно удвоению доступного compute. Если серверы Anthropic не справляются с пиковыми нагрузками, дополнительные лимиты лишь переносят проблему на сторону клиента — он ждёт ответа дольше.
В сообществе уже обсуждают, что компания вплотную подошла к потолку своих GPU-мощностей. Контракт с Oracle и Google Cloud не резиновый, а спрос растёт экспоненциально. Неудивительно, что Anthropic принципиально не публикует долгосрочный roadmap — они просто не знают, сколько compute понадобится завтра.
Pro Max и другие планы — что известно?
В кулуарах ходят слухи о запуске тарифа "Pro Max" с эксклюзивным доступом к выделенным вычислительным мощностям. Якобы цена будет в 2-3 раза выше текущего Pro ($20/мес), но с гарантированным приоритетом и отсутствием rate limits. Официально Anthropic ничего не подтверждает, но Cat Wu в разговоре с инвесторами намекнула на "новую линейку продуктов для профессионалов".
Параллельно компания работает над оптимизацией самого Claude Code. Запуск локальных моделей через vLLM и MiniMax — это попытка снять часть нагрузки с облачных серверов, но пока эта опция доступна только для самых смелых. Да и качество локальных моделей всё ещё уступает облачным.
Обратная сторона медали: скандалы и утечки
Когда ресурсов не хватает, компании иногда принимают неоднозначные решения. Совсем недавно разразился скандал: Anthropic обвинили в намеренном ухудшении ответов Claude при запросах о конкурентах. Если компания готова манипулировать качеством ради конкурентной борьбы, что мешает ей делать то же самое ради экономии compute?
К тому же недавняя череда утечек данных подрывает доверие к компании. Если вы планируете использовать Claude Code для работы с чувствительным кодом, стоит дважды подумать о безопасности.
Что делать разработчику прямо сейчас?
Пока Anthropic ищет новые GPU, можно попробовать обходные пути. Например, настроить жёсткие лимиты расходов (история с $6000 никого не научила?). Или перейти на локальный запуск, если задачи не требуют сверхинтеллекта. Некоторые команды уже комбинируют Claude Code с GPT-4.5 от OpenAI для менее критичных задач — так экономится compute.
Другой вариант — дождаться выхода Claude Code 2.0. Инсайдеры говорят, что в нём переработана архитектура агента: меньше вызовов на каждый шаг, больше кеширования. Если это правда, то второй релиз может снизить нагрузку в разы. Но когда он выйдет — неизвестно.
В конечном счёте, ситуация с compute — это маркер зрелости рынка. Агентные инструменты оказались слишком прожорливыми для существующей инфраструктуры. И пока индустрия не построит специализированные чипы (а Neuralink с Groq уже работают над этим), терпеть и оптимизировать придётся нам, разработчикам.