Утро с молоком и $6000 счета
Разработчик по имени Алекс (назовем его так) запустил автономную сессию Claude Code перед сном. Он хотел, чтобы AI декомпилировал старую игру — задача для Claude на 8 часов. Утром Алекс обнаружил в почте не результаты работы, а письмо от Anthropic: «Ваш баланс исчерпан. Долг: $6,247.83».
История не единична. С момента выхода Claude Code в начале 2025 года и до сегодняшнего дня (10 мая 2026) подобные сценарии повторяются с пугающей регулярностью. Агенты способны жрать токены как голодные еноты — быстро, незаметно и с последствиями для кошелька.
Давайте разберемся, как так получается, что умный инструмент превращается в финансовую черную дыру, и что сделать, чтобы ваши $100 за Claude Code не стали $10 000.
Почему Claude Code высасывает деньги: 4 ловушки
Важно: Все цены и версии актуальны на 10 мая 2026. Anthropic обновил модели: Claude 4 Opus 4.7 сейчас стоит $0.08/1K input, $0.32/1K output — заметно дороже, чем Haiku 3.5 ($0.0025/$0.01). Ошибка в выборе модели сразу множит счет в 10 раз.
Ловушка 1. Автономные задачи без лимитов
Самый популярный сценарий — вы запускаете Claude Code на задачу, которая может длиться часами. В статье автономная декомпиляция игр мы показывали, как в теории можно оставить ИИ работать без присмотра. Но в реальности каждый вызов модели стоит денег, а агент может бесконечно гонять циклы перезапусков, особенно если в промпте не указан лимит шагов.
Ловушка 2. Prompt Caching (который на самом деле не бесплатный)
Anthropic гордится функцией кэширования промптов — вроде бы кэш снижает стоимость повторных запросов. Но, как мы писали в материале «Счет за память», кэш может работать и во вред: если вы храните в контексте килобайты ненужных данных, платите за хранение кэша, а сброс кэша при изменении промпта приводит к полной оплате нового запроса. В долгих сессиях это накручивает сотни долларов.
Ловушка 3. Неправильный выбор модели
Claude Code умеет работать с разными моделями: Haiku для простых задач, Sonnet для баланса, Opus для сложных. Разница в цене между Haiku и последней версией Opus 4.7 — больше чем в 30 раз. Если вы случайно или по умолчанию выставили Opus (особенно после того, как Anthropic выпустил Opus 4.7 с новыми ценами), каждый простой запрос на рефакторинг одной функции будет стоить как обед в ресторане.
Ловушка 4. «Полезные» скиллы, которые гоняют циклы
Маркетплейс скиллов Claude Code — отличная штука, но не все скиллы оптимизированы. В гайде по скиллам мы предупреждали: некоторые скиллы используют рекурсивный вызов агентов, что множит число запросов. Если скилл написан криво — он будет перезапускать модель до бесконечности, пока не упрется в API лимит — или в ваш банковский лимит.
7 шагов защиты: как не получить счет на $6000
Хватит о грустном. Вот что надо сделать прямо сейчас, чтобы не повторить судьбу Алекса.
1 Копейка рубль бережет: еженедельные лимиты в API
Anthropic API поддерживает программную настройку spending limits через заголовок Anthropic-Custom-Limit. Установите жесткий лимит на день и неделю. Пример кода для Node.js:
const response = await fetch('https://api.anthropic.com/v1/messages', {
method: 'POST',
headers: {
'x-api-key': 'sk-...',
'anthropic-version': '2023-06-01',
'anthropic-beta': 'spending-limits-2025-01-01',
'Anthropic-Custom-Limit': 'daily=20.00;weekly=100.00'
},
body: JSON.stringify({
model: 'claude-sonnet-4-20251022',
max_tokens: 1024,
messages: [{ role: 'user', content: 'Рефакторинг функции X' }]
})
});
Если сумма превышена, API вернет ошибку 402 Payment Required — лучше, чем $6000 утром.
2 Режим «Только для чтения» для автономных сессий
Перед запуском долгой задачи добавьте в промпт строгие инструкции: максимум 20 вызовов модели, приостановка при ошибках, обязательный отчет после каждых 10 шагов. Пример промпта:
Ты — агент по декомпиляции. У тебя есть лимит в 50 ответов. После каждого ответа считай оставшиеся шаги. Как только израсходуешь 40 шагов — остановись и выведи промежуточный результат. Если за 3 попытки не удается выполнить задачу — заверши сессию с кодом STOP_EXCEEDED.
В статье «Промпт для автономной декомпиляции» есть готовые шаблоны с ограничением шагов — берите и используйте.
3 Выключите ненужный billing header
В нашем расследовании «Claude Code глючит кэш?» мы обнаружили, что заголовок x-anthropic-billing-header может вызывать лишние вызовы биллинговой системы, увеличивая latency и расходы (из-за повторной отправки метаданных). Отключите этот заголовок в своих интеграциях, если не используете кастомизированный биллинг.
4 Контроль кэша — ваш лучший друг
Включите Prompt Caching осознанно. Используйте ключ cache_control: { type: "ephemeral" } только для статических частей промпта (системные инструкции). Контекст с уникальными данными кэшировать не надо — вы все равно будете платить за его запись. Следите за метриками: Anthropic возвращает заголовок anthropic-balance-cache-info (в бета-версии).
5 Выбирайте модель под задачу
Не используйте Opus 4.7 для рефакторинга одной функции. Настройте правило: для задач «простой код», «комментарии», «поиск ошибок» используйте claude-haiku-4-20260401. Для средних задач — claude-sonnet-4-20251022. И только для анализа архитектуры — claude-opus-4-7-20260501. В материалах по миграции с 4.6 на 4.7 есть таблицы соответствия.
6 Отслеживайте расходы в реальном времени
Используйте инструмент Claude-spend — про него мы писали в статье «Claude-spend: когда токены утекают сквозь пальцы». Это open-source дашборд, который подключается к вашему API-ключу и показывает расходы в реальном времени. Установка займет 5 минут:
git clone https://github.com/anthropics/claude-spend
cd claude-spend
ANTHROPIC_API_KEY=sk-... docker compose up -d
Дашборд показывает стоимость каждого запроса, разбивку по моделям и предупреждает, когда дневной лимит превышает порог.
7 Настройте многофакторную блокировку на аккаунте
Anthropic позволяет задать Accounts & Billing -> Spending Caps в консоли. Выставьте значение 0 для автоматического режима (каждая сессия должна явно запрашивать увеличение лимита). Это неудобно, зато безопасно. В командной работе используйте разные API-ключи под каждый проект и привяжите к ним разные лимиты.
Что делать, если счет уже пришел?
Сценарий: вы проснулись и увидели $6000. Первое — не платите сразу. Свяжитесь с Anthropic support (у них есть форма оспаривания транзакций). Компания идет навстречу, если докажете, что расходы были вызваны багом агента (например, бесконечным циклом из-за бага в скилле). В качестве доказательства приложите логи сессии — Anthropic видит все вызовы API.
Второе — проверьте, не было ли несанкционированного использования ключа. В разборе утечки Claude Code мы описывали, как открытый API-ключ в коде привел к миллионным счетам. Немедленно отзовите скомпрометированные ключи и создайте новые.
Случай из жизни: $1.78 млн и потеря доверия
Самый громкий случай — стартап, который слепо доверился ИИ-ассистенту. Мы разбирали эту историю в статье «Фиаско Claude Code: как слепое доверие привело к потере $1.78 миллиона». Итог: агент без контроля нагенерил миллионы строк кода, счет за токены превысил все разумные пределы, стартап обанкротился. $6000 на этом фоне — цветочки, но симптом тот же: отсутствие бюджетных ограничений.
Неочевидный совет: «Выход из системы» как спасение
Когда я вижу очередной кейс перерасхода, первое, что спрашиваю: «А вы выходили из аккаунта после сессии?». Звучит смешно, но многие оставляют сессии открытыми, а Claude Code (особенно в связке с Anthropic Cowork) продолжает фоновую работу. На Mac, например, агент может перезапускаться при подключении к сети. Выход из аккаунта после завершения работы — дешевый и эффективный способ сэкономить тысячу баксов.
Быстрая проверка: В Claude Code добавьте в .claude/configuration.yml настройку auto_logout_after: 30 (минут бездействия). Сессия завершится автоматически — и счет не будет расти.
AI агенты — это инструмент, а не замена ответственности. Я не говорю «откажитесь от Claude Code». Я говорю: включите голову и лимиты. Иначе история с $6000 может оказаться вашей.