Пир во время чумы: Claude Code захватывает мир, но сервера Anthropic задыхаются
Сначала хорошие новости: Claude Code grows like crazy. 80x за год — это не опечатка, а официальные данные Anthropic, которые продакт-лид Алексей Петров озвучил на закрытом брифинге в мае. Плохие новости: каждый новый пользователь — это удар по compute budget компании. В ход идет все: от стратегии «lean harness» до экстренного доступа к суперкомпьютеру SpaceX. Разбираемся, что происходит и как это скажется на разработчиках.
80x — это сколько ватт?
Количество активных сессий Claude Code выросло в 80 раз по сравнению с маем 2025 года. При этом штат команды увеличился лишь на 30%. С одной стороны, это триумф эффективности — та самая «lean harness», о которой мы подробно писали. Но с другой — даже идеально оптимизированные запросы жрут ресурсы, когда их миллионы.
По данным источников, близких к Anthropic, загрузка вычислительных кластеров компании достигла 98% в пиковые часы. Это означает, что любой новый всплеск активности — будь то релиз крупного обновления или вирусный пост в X — может привести к сбоям.
«Мы не строим гигантские дата-центры. Мы учимся делать больше с меньшими затратами. Удвоение лимитов — не про раздувание бюджетов, а про то, чтобы каждый токен работал на полную».
— Алексей Петров, продакт-лид Claude Code
💡 Стратегия «lean harness» дала впечатляющий результат: сессия, которая раньше съедала 12 000 токенов, теперь укладывается в 4 000. Но этого недостаточно, чтобы покрыть 80-кратный рост.
Новые лимиты: палка о двух концах
С 20 мая 2026 года Anthropic удвоил лимиты на обработку кода для всех тарифов. Вот как это выглядит:
| Тариф | Старый лимит | Новый лимит |
|---|---|---|
| Free | 1 000 строк | 2 000 строк |
| Pro | 5 000 строк | 10 000 строк |
| Enterprise | 25 000 строк | 50 000 строк |
На первый взгляд — щедрый жест. Но если копнуть глубже, эти лимиты — вынужденная мера. Вместо того чтобы бесконечно наращивать compute, Anthropic пытается удержать пользователей в рамках, не отпугнув их жесткими rate limits.
Илон Маск, чей суперкомпьютер SpaceX подключился к Claude Code для тестирования Opus 4.7, уже пожаловался на «rate limits, от которых потеют сервера». В нашем репортаже мы подробно разбирали, как даже топ-клиенты сталкиваются с задержками.
Дефицит compute: реальность или драма?
Anthropic — не первая компания, кто уперся в потолок вычислительных мощностей. OpenAI проходил это в 2023-2024, когда ChatGPT был доступен с перебоями. Но у Claude Code ситуация сложнее: агентный код требует много токенов на одно действие (чтение файлов, запуск тестов, правка кода). Оптимизация «lean harness» помогла, но не решила проблему полностью.
По слухам, Anthropic ведет переговоры с несколькими облачными провайдерами о масштабировании. Но на фоне общего дефицита GPU (H100/B200 по-прежнему в дефиците) быстро нарастить мощности не выйдет. Особенно с учетом того, что локальные кодеры типа Qwen3-30B-Coder или Qwen3-Coder-Next 80B набирают популярность — разработчики уже тестируют альтернативы для снижения нагрузки на облако.
Что дальше? Ждем ценовой революции
Пока Anthropic держится: лимиты растут, цены не меняются. Но долго ли так продлится? Все признаки указывают на то, что компания готовит новые тарифные планы с привязкой к compute-юнитам. В интервью Петров осторожно намекнул: «Мы хотим, чтобы каждый платил за то, что реально использует».
Если это произойдет, разработчикам придется пересмотреть свои пайплайны. Вместо «просто кинуть запрос» — учиться оптимизировать контекст. Как уже делают те, кто следит за статьей о слухах про Qwen 27B для локального запуска.
Но есть и хорошая новость: SyDecode, Triton-ядро, которое ускоряет vLLM в 40 раз, может быть адаптировано для Claude Code. Если Anthropic интегрирует такие наработки, вопрос compute станет менее острым.
Мой совет (неочевидный): не гонитесь за последними моделями. Opus 4.7 хорош, но для рутинных задач Haiku 3.5 справляется не хуже и жрет в 5 раз меньше токенов. Экономия compute — это новая скилл-секта. Осваивайте.