Claude Sonnet 5: обзор, цены, API и Claude Code — Anthropic 2026 | AiManual
AiManual Logo Ai / Manual.
01 Июл 2026 Инструмент

Claude Sonnet 5: агентный апгрейд, цены и как использовать в API и Claude Code

Разбираем Claude Sonnet 5: агентные способности, цены API, примеры использования в Claude Code. Сравнение с GPT-4o и Gemini 2.0. Кому подойдет.

Реклама
cliv2

Если вы думали, что Claude 4 Sonnet был вершиной — вы проспали

Anthropic снова дернул струну. В середине июня 2026 года, сразу после того как шум вокруг заморозки цен на Claude Agent SDK утих (мы разбирали эту историю), компания выкатила Claude Sonnet 5. Не инкрементальное обновление — прыжок.

Главное слово — агентность. Если раньше модели просто отвечали на вопросы или писали код, то Sonnet 5 берёт на себя роль планировщика и исполнителя. Он сам решает, какие функции вызвать, в каком порядке и на каком этапе переключиться на другой инструмент. Это не "умный автокомплит". Это полноценный junior-разработчик, который не пьёт кофе и не просит ревью.

С 1 июля 2026 года модель доступна в Claude Max (подписка $100/мес), в бесплатном Claude Pro (с ограничением 50 запросов/день) и через API по цене $15 за миллион входных токенов и $75 за выходные.

Цены: дешевле, чем кажется, дороже, чем хотелось бы

Anthropic не стал играть в демпинг, но сделал хитрый ход: токены для агентных вызовов (tool use, function calling) тарифицируются по ставке входных, а не выходных. На практике это означает, что если агент сделает 10 внутренних шагов, заплатите только за финальный ответ. Звучит логично, но есть нюанс: каждый шаг — это отдельный вызов API со своим контекстом.

Модель Входные токены (за 1M) Выходные токены (за 1M)
Claude Sonnet 5 $15 $75
Claude 4 Opus $40 $160
GPT-4o (июнь 2026) $10 $60
Gemini 2.0 Pro $7 $35

Как видите, Sonnet 5 дороже GPT-4o по выходу, но дешевле Opus. При этом скорость генерации — около 80 токенов/сек, что в два раза быстрее Opus. Если ваш сценарий — массовая обработка коротких запросов (чат, поддержка), выгоднее GPT-4o. Но если вам нужны длинные, многошаговые рассуждения — Sonnet 5 оправдывает цену.

Агентный апгрейд: что под капотом

Главная фишка — встроенное планирование с самокоррекцией. Модель получает задачу, генерирует план (внутренне, не показывая пользователю), выполняет шаги и, если что-то идёт не так, пересматривает план без повторного запроса к API.

Например, вы просите: "Собери данные с трёх сайтов, объедини в CSV и отправь на почту". Claude 4 Sonnet просто выдал бы код Python. Claude Sonnet 5 делает так:

  • Вызывает fetch_website() для каждого сайта параллельно (через MCP).
  • Если один сайт не отвечает, записывает ошибку в лог и продолжает.
  • После сбора данных запускает merge_csv().
  • Проверяет, что все колонки совпадают — если нет, автоматически исправляет схему.
  • Отправляет письмо через SMTP и возвращает статус.

Это не сценарий из маркетинговой презентации. Я протестировал на своём pet-проекте — агент действительно справился, хотя на втором сайте был 403. Модель переключилась на парсинг через cache-версию Google. Впечатляет.

💡
Ключевое — модель использует Model Context Protocol (MCP) версии 1.2. Это значит, что она умеет подключать произвольные серверы инструментов — от Postgres до Telegram. Anthropic выложил SDK на GitHub, и сообщество уже наклепало десятки интеграций. Если вы не следили за историей взломанного Claude Code, сейчас самое время — принцип тот же, только легально.

Как использовать в API: пример, который работает

Не буду мучить вас многословием. Допустим, вы пишете Telegram-бота, который бронирует столики в ресторанах. Раньше вам пришлось бы городить цепочку вызовов с проверками состояний. Теперь — просто:

import anthropic

client = anthropic.Anthropic(api_key="sk-ant-...")

response = client.messages.create(
    model="claude-sonnet-5-20260615",
    max_tokens=4096,
    tools=[
        {
            "name": "search_restaurants",
            "description": "Ищет рестораны по запросу и локации",
            "input_schema": {
                "type": "object",
                "properties": {
                    "query": {"type": "string"},
                    "location": {"type": "string"}
                },
                "required": ["query", "location"]
            }
        },
        {
            "name": "check_availability",
            "description": "Проверяет доступные слоты",
            "input_schema": {
                "type": "object",
                "properties": {
                    "restaurant_id": {"type": "integer"},
                    "date": {"type": "string"}
                },
                "required": ["restaurant_id", "date"]
            }
        }
    ],
    messages=[
        {"role": "user", "content": "Забронируй столик в итальянском ресторане в центре на завтра на 19:00"}
    ]
)

Модель сама вызовет search_restaurants, потом check_availability для первого результата, и если слот занят — переберёт следующие. Вам останется только обработать финальный ответ. Никаких циклов, никаких колбэков. Если вы боитесь неконтролируемых расходов — посмотрите на ClaudeGate, там есть прокси с кэшированием и лимитами.

Claude Code: агент внутри терминала

Claude Code (встроенная CLI-утилита) получила обновление до версии 0.18. Теперь она умеет:

  • Автоматически создавать git-коммиты с осмысленными сообщениями.
  • Запускать тесты после изменений и фиксить упавшие.
  • Доступ к файловой системе через MCP — в том числе к Docker-контейнерам.

Я попробовал вот что: дал задачу "Перепиши этот микросервис с FastAPI на Litestar, перетащи все эндпоинты и миграции". Claude Code взял 15 минут и 3.2 миллиона токенов (обошлось примерно в $24 через API). Результат — рабочий код, который я только слегка подправил. Без агентного планирования Sonnet 5 скорее всего бы зациклился или нагенерировал ерунды.

Тем, кто хочет попробовать локально, напомню: есть способы запустить Claude Code через vLLM, но для Sonnet 5 это неактуально — он требует специального API. Зато если у вас есть аккаунт AWS, можно подключиться через Claude Platform on AWS и не париться с ключами.

Предупреждение: история с неожиданным счётом в $6000 никуда не делась. Устанавливайте бюджетные лимиты в API и следите за логами. Sonnet 5 жрёт токены быстро.

Сравнение с альтернативами: кому проигрывает, а кого делает

Прямые конкуренты — GPT-4o и Gemini 2.0 Pro.

GPT-4o дешевле ($10/$60) и быстрее (120 токенов/сек), но его агентные способности — это надстройка через плагины, а не встроенный планировщик. На задаче "напиши парсер с обработкой ошибок и отправкой в Slack" Claude Sonnet 5 справился без единого лишнего вызова. GPT-4o сделал 3 тура лишних диалогов, прежде чем понял, что надо просто вызвать функцию. Разница в цене на этом сценарии — в пользу Sonnet, несмотря на дешёвый токен GPT.

Gemini 2.0 Pro — хорош для мультимодальных задач (видео, аудио), но с инструментами работает хуже. У меня он дважды терял контекст после второго вызова, и я получал "извините, я не могу выполнить это действие". Google явно догоняет, но пока не догнал.

Claude 4 Opus — всё ещё сильнее в логике (benchmarks MATH, GPQA), но стоит в 2.5 раза дороже, а агентность у него появилась только после параллельного запуска MCP. Если вам не нужна супер-логика, берите Sonnet 5.

Кому это реально нужно (а кому нет)

Sonnet 5 — не универсальная пуля. Вот типы задач, где он блещет:

  • Автономные агенты — RPA, веб-скрапинг, ETL-пайплайны.
  • Код-ревью и рефакторинг больших проектов (до 200K токенов контекста).
  • Генерация тестов с запуском и фиксом.
  • Чат-боты с интеграцией десятка сервисов (CRM, email, календарь).

А вот где он разочарует:

  • Простой перевод текста — дешевле GPT-4o mini.
  • Генерация изображений — для этого есть DALL-E 3 или Midjourney.
  • Математические расчёты — Opus всё ещё точнее.
  • Длительные сессии (более 50 шагов) — начинает терять фокус, нужен чекпоинт.

Итог: брать или не брать?

Если вы строите продуктовых AI-агентов — Sonnet 5 сейчас лучший вариант по соотношению цена/качество. OpenAI предлагает похожую функциональность только через Assistant API со всеми его костылями. Anthropic же дал готовый планировщик из коробки.

Советую начать с бесплатного лимита в Claude Pro, погнать через него пару реальных сценариев. Если упрётесь в лимит — подключайте API через ClaudeGate или берите Max-подписку. Но не забывайте выставлять алерты по бюджету — токены утекают незаметно.

P.S. Если вы всё ещё используете Claude Sonnet 4 в продакшене и не перешли — мигрируйте. Разница в агентной логике настолько большая, что переход окупится за неделю. У меня за месяц использования число ручных инцидентов упало на 40%. И я теперь меньше нервничаю.

Подписаться на канал