Claude Code: 80x рост, дефицит compute и новые лимиты — аналитика | AiManual
AiManual Logo Ai / Manual.
14 Июн 2026 Новости

Claude Code: 80x рост, дефицит compute и новые лимиты — что ждёт разработчиков

Anthropic столкнулся с нехваткой вычислительных мощностей из-за 80-кратного роста Claude Code. Удвоенные лимиты, стратегия lean harness и прогнозы для разработч

Реклама
cliv1

Пир во время чумы: Claude Code захватывает мир, но сервера Anthropic задыхаются

Сначала хорошие новости: Claude Code grows like crazy. 80x за год — это не опечатка, а официальные данные Anthropic, которые продакт-лид Алексей Петров озвучил на закрытом брифинге в мае. Плохие новости: каждый новый пользователь — это удар по compute budget компании. В ход идет все: от стратегии «lean harness» до экстренного доступа к суперкомпьютеру SpaceX. Разбираемся, что происходит и как это скажется на разработчиках.

80x — это сколько ватт?

Количество активных сессий Claude Code выросло в 80 раз по сравнению с маем 2025 года. При этом штат команды увеличился лишь на 30%. С одной стороны, это триумф эффективности — та самая «lean harness», о которой мы подробно писали. Но с другой — даже идеально оптимизированные запросы жрут ресурсы, когда их миллионы.

По данным источников, близких к Anthropic, загрузка вычислительных кластеров компании достигла 98% в пиковые часы. Это означает, что любой новый всплеск активности — будь то релиз крупного обновления или вирусный пост в X — может привести к сбоям.

«Мы не строим гигантские дата-центры. Мы учимся делать больше с меньшими затратами. Удвоение лимитов — не про раздувание бюджетов, а про то, чтобы каждый токен работал на полную».
— Алексей Петров, продакт-лид Claude Code

💡 Стратегия «lean harness» дала впечатляющий результат: сессия, которая раньше съедала 12 000 токенов, теперь укладывается в 4 000. Но этого недостаточно, чтобы покрыть 80-кратный рост.

Новые лимиты: палка о двух концах

С 20 мая 2026 года Anthropic удвоил лимиты на обработку кода для всех тарифов. Вот как это выглядит:

ТарифСтарый лимитНовый лимит
Free1 000 строк2 000 строк
Pro5 000 строк10 000 строк
Enterprise25 000 строк50 000 строк

На первый взгляд — щедрый жест. Но если копнуть глубже, эти лимиты — вынужденная мера. Вместо того чтобы бесконечно наращивать compute, Anthropic пытается удержать пользователей в рамках, не отпугнув их жесткими rate limits.

Илон Маск, чей суперкомпьютер SpaceX подключился к Claude Code для тестирования Opus 4.7, уже пожаловался на «rate limits, от которых потеют сервера». В нашем репортаже мы подробно разбирали, как даже топ-клиенты сталкиваются с задержками.

Дефицит compute: реальность или драма?

Anthropic — не первая компания, кто уперся в потолок вычислительных мощностей. OpenAI проходил это в 2023-2024, когда ChatGPT был доступен с перебоями. Но у Claude Code ситуация сложнее: агентный код требует много токенов на одно действие (чтение файлов, запуск тестов, правка кода). Оптимизация «lean harness» помогла, но не решила проблему полностью.

По слухам, Anthropic ведет переговоры с несколькими облачными провайдерами о масштабировании. Но на фоне общего дефицита GPU (H100/B200 по-прежнему в дефиците) быстро нарастить мощности не выйдет. Особенно с учетом того, что локальные кодеры типа Qwen3-30B-Coder или Qwen3-Coder-Next 80B набирают популярность — разработчики уже тестируют альтернативы для снижения нагрузки на облако.

⚠️
Разработчики в соцсетях начали массово обсуждать, что «Claude Code стал тормозить». Anthropic это отрицает, но графики latency на публичных статус-страницах показывают рост времени ответа на 15-20% в часы пик.

Что дальше? Ждем ценовой революции

Пока Anthropic держится: лимиты растут, цены не меняются. Но долго ли так продлится? Все признаки указывают на то, что компания готовит новые тарифные планы с привязкой к compute-юнитам. В интервью Петров осторожно намекнул: «Мы хотим, чтобы каждый платил за то, что реально использует».

Если это произойдет, разработчикам придется пересмотреть свои пайплайны. Вместо «просто кинуть запрос» — учиться оптимизировать контекст. Как уже делают те, кто следит за статьей о слухах про Qwen 27B для локального запуска.

Но есть и хорошая новость: SyDecode, Triton-ядро, которое ускоряет vLLM в 40 раз, может быть адаптировано для Claude Code. Если Anthropic интегрирует такие наработки, вопрос compute станет менее острым.

Мой совет (неочевидный): не гонитесь за последними моделями. Opus 4.7 хорош, но для рутинных задач Haiku 3.5 справляется не хуже и жрет в 5 раз меньше токенов. Экономия compute — это новая скилл-секта. Осваивайте.

Подписаться на канал