Проблемы compute Claude Code: удвоение лимитов и планы Anthropic | AiManual
AiManual Logo Ai / Manual.
05 Июл 2026 Новости

Claude Code сталкивается с проблемами compute: что известно об удвоении лимитов и планах Anthropic

Разбираемся с дефицитом вычислительных мощностей Claude Code: удвоение usage limits, интервью продакт-лида Cat Wu, сделка со SpaceX и что это значит для разрабо

Разработчики, влюбившиеся в Claude Code, начинают испытывать раздражение. Ещё месяц назад инструмент летал — рефакторил код, разворачивал микросервисы, писал тесты. Сегодня в терминале всё чаще всплывает серое Rate limit exceeded. Или того хуже — сообщение о недоступности вычислительных ресурсов. Anthropic пытается тушить пожар шлангом, но шланг оказался слишком тонким.

Взрывной рост, которого никто не ждал

По данным внутренней аналитики, количество активных сессий Claude Code выросло в 80 раз с начала года. Инструмент перестал быть игрушкой для гиков — его используют в продакшене такие гиганты, как SpaceX. Илон Маск лично демонстрировал на Code with Claude 2026, как инженеры пишут код для Starship прямо в терминале. Звучит круто, но цена такого успеха — колоссальная нагрузка на инфраструктуру.

Сухие цифры:

  • 80x — рост числа разработчиков, запускающих Claude Code
  • Среднее количество запросов на пользователя выросло в 3 раза за квартал
  • Более 40% сессий упираются в лимиты compute, а не в токены

Проблема усугубляется тем, что Claude Code — агентный инструмент. Он не просто генерирует текст, он выполняет команды, анализирует окружение, запускает песочницы. Каждое действие требует гораздо больше compute, чем обычный чат. В прошлой статье мы уже предупреждали: дефицит compute станет узким горлышком.

Удвоение лимитов — паллиатив или решение?

17 мая 2026 года Anthropic объявила о новом раунде расширения лимитов. Продакт-лид Cat Wu в интервью объясняла стратегию: "Мы удваиваем usage limits для всех платных пользователей и вводим более гибкие тарифы для enterprise". Звучит обнадеживающе, но на практике многие разработчики жалуются, что лимиты заканчиваются через час активной работы.

💡 Нюанс: удвоение лимитов не равно удвоению доступного compute. Если серверы Anthropic не справляются с пиковыми нагрузками, дополнительные лимиты лишь переносят проблему на сторону клиента — он ждёт ответа дольше.

В сообществе уже обсуждают, что компания вплотную подошла к потолку своих GPU-мощностей. Контракт с Oracle и Google Cloud не резиновый, а спрос растёт экспоненциально. Неудивительно, что Anthropic принципиально не публикует долгосрочный roadmap — они просто не знают, сколько compute понадобится завтра.

Pro Max и другие планы — что известно?

В кулуарах ходят слухи о запуске тарифа "Pro Max" с эксклюзивным доступом к выделенным вычислительным мощностям. Якобы цена будет в 2-3 раза выше текущего Pro ($20/мес), но с гарантированным приоритетом и отсутствием rate limits. Официально Anthropic ничего не подтверждает, но Cat Wu в разговоре с инвесторами намекнула на "новую линейку продуктов для профессионалов".

Параллельно компания работает над оптимизацией самого Claude Code. Запуск локальных моделей через vLLM и MiniMax — это попытка снять часть нагрузки с облачных серверов, но пока эта опция доступна только для самых смелых. Да и качество локальных моделей всё ещё уступает облачным.

Обратная сторона медали: скандалы и утечки

Когда ресурсов не хватает, компании иногда принимают неоднозначные решения. Совсем недавно разразился скандал: Anthropic обвинили в намеренном ухудшении ответов Claude при запросах о конкурентах. Если компания готова манипулировать качеством ради конкурентной борьбы, что мешает ей делать то же самое ради экономии compute?

К тому же недавняя череда утечек данных подрывает доверие к компании. Если вы планируете использовать Claude Code для работы с чувствительным кодом, стоит дважды подумать о безопасности.

Что делать разработчику прямо сейчас?

Пока Anthropic ищет новые GPU, можно попробовать обходные пути. Например, настроить жёсткие лимиты расходов (история с $6000 никого не научила?). Или перейти на локальный запуск, если задачи не требуют сверхинтеллекта. Некоторые команды уже комбинируют Claude Code с GPT-4.5 от OpenAI для менее критичных задач — так экономится compute.

Другой вариант — дождаться выхода Claude Code 2.0. Инсайдеры говорят, что в нём переработана архитектура агента: меньше вызовов на каждый шаг, больше кеширования. Если это правда, то второй релиз может снизить нагрузку в разы. Но когда он выйдет — неизвестно.

Совет: Если ваша работа критически зависит от Claude Code, не кладите все яйца в одну корзину. Держите под рукой альтернативы — локальный запуск, другие агентные инструменты (Codex CLI, Copilot Workspace). Anthropic делает ставку на "lean harness", но пока эта упряжь слишком тугая.

В конечном счёте, ситуация с compute — это маркер зрелости рынка. Агентные инструменты оказались слишком прожорливыми для существующей инфраструктуры. И пока индустрия не построит специализированные чипы (а Neuralink с Groq уже работают над этим), терпеть и оптимизировать придётся нам, разработчикам.

Подписаться на канал