Claude Sonnet 5 обзор: цена, агентность, сравнение с Opus 4.8 | AiManual
AiManual Logo Ai / Manual.
30 Июн 2026 Инструмент

Claude Sonnet 5: агентный бюджетник, который заставит Opus нервно курить в сторонке

Обзор Claude Sonnet 5 — агентной модели Anthropic с низкой ценой API. Сравнение с Opus 4.8, тесты автономности, цена за токен, кому подойдет.

Реклама
cliv1

Когда Sonnet перестала быть просто дешевым Opus

В июне 2026 Anthropic выкатила Sonnet 5. Без фанфар. Без презентации с Дэрио Амодеи на сцене. Просто обновили API, и в документации появилась строчка: «Sonnet 5 — первая модель Anthropic, оптимизированная для автономных агентов».

Это не просто очередной Sonnet. Это смена парадигмы. Если раньше Sonnet были «умными исполнителями» — быстрыми, дешевыми, но требующими жесткой руки разработчика, — то Sonnet 5 пытается стать самостоятельным агентом. И, черт возьми, у нее получается.

Спойлер: Sonnet 5 не догоняет Opus в сложном reasoning. Но в агентных задачах она уделывает Opus 4.8 по соотношению цена/качество. И это меняет правила игры для стартапов.

Что такого агентного в Sonnet 5?

В предыдущих версиях (Sonnet 4.5, 4.6) агентность подразумевала возможность вызывать функции и читать контекст до 1M токенов. Sonnet 5 пошла дальше:

  • Встроенное управление инструментами — модель сама решает, когда вызвать код, поиск в интернете или работу с файловой системой. Без MCP. Без костылей.
  • Agent Teams из коробки — вы можете запустить несколько инстансов Sonnet 5, и они скоординируются между собой. Ранее такая фича была только у Opus 4.6, теперь она доступна за копейки.
  • Планирование цепочки шагов — Sonnet 5 может построить план на 20-30 шагов и выполнять его без обращений к пользователю, если все идет по плану. При ошибке — запрашивает уточнение, а не молча генерирует ерунду.
  • Динамический контекст — модель не просто хранит 1M токенов, она умеет забывать нерелевантное и подтягивать нужное. Что-то вроде бюджетной версии Dynamic Workflows из Opus 4.8, но без дорогих вычислений.

На практике это значит: я дал Sonnet 5 задачу — «собери данные с 50 страниц, проанализируй и напиши отчет с графиками». Она сама ходит в браузер, запускает Python, генерирует matplotlib, собирает все в PDF. Я просто жду 2 минуты. С предыдущими Sonnet такое было возможно только через связку из 5-7 запросов и тонну кода обвязки.

Цена, которая заставит пересчитать бюджет

Sonnet 5 стоит: $10 за 1M входных токенов, $40 за 1M выходных. Это на 33% дешевле Sonnet 4.6 ($15/$60) и в 15 раз дешевле Opus 4.8 ($150/$450).

МодельВходные токены ($/1M)Выходные токены ($/1M)Контекст
Sonnet 4.5$15$60200K
Sonnet 4.6$15$601M
Sonnet 5$10$401.5M
Opus 4.8$150$4502M

Да, контекст у Opus больше, но 1.5M для агентных задач — это почти бесконечность. Выше потолка в большинстве кейсов вы не упретесь.

💡
Кстати, Anthropic заморозил цены на SDK для агентов, так что связка Sonnet 5 + Agent SDK — самый дешевый способ получить полностью автономную систему. Дешевле даже Gemini 4 Flash, который стартует от $12 за токен.

Бенчмарки: когда агентность важнее натаскивания на тесты

Anthropic опубликовала результаты Sonnet 5 на ключевых агентных бенчмарках. Сравним с Opus 4.8 (обычный режим) и Sonnet 4.6:

БенчмаркSonnet 5Opus 4.8Sonnet 4.6
SWE-bench Verified72.1%69.2%68.3%
OS World (агентные задачи)83.4%89.4%72.1%
GAIA (инструментальные)67.2%80.5%56.1%
MQA (многоагентные сцены)71.0%82.3%-

Посмотрите на SWE-bench — Sonnet 5 обходит даже Opus! Как так? Агентная архитектура позволяет ей перепроверять код, запускать тесты и исправлять ошибки в цикле, не выходя за лимиты контекста. Opus делает то же самое, но дороже и с более тяжеловесным планированием.

В OS World (работа с ОС: браузер, файлы, терминал) Opus все еще впереди, но разрыв не критичен. А в GAIA (сложный поиск и агрегация информации) Opus давит опытом — у него лучше глубинное понимание. Но зачем платить в 15 раз больше, если Sonnet 5 делает 67% работы за $10? Иногда эти 13% не стоят переплаты.

Кому бежать за Sonnet 5 прямо сейчас

  • Стартапы, строящие AI-агентов. Ваш рейт-лимит перестанет быть узким местом. Sonnet 5 позволяет развернуть десятки параллельных агентов по цене одного Opus.
  • Разработчики инструментов для работы с кодом. Если вы делаете автоподбора багов или код-ревью — Sonnet 5 с ее циклом проверки выдает лучший результат на SWE-bench, чем любой не-агентный конкурент.
  • Все, кто кормит модели длинными логами и документами. 1.5M контекста + встроенная функция забывать неважное — вы получаете анализ логов за копейки. Мы уже разбирали эту дилему с Sonnet 4.6 и Opus 4.6 — теперь выбор стал еще проще.

Кому лучше остаться на Opus

  • Юристам и финансистам, которым нужно объяснение решений. Opus все еще лучше в Chain-of-Thought и может обосновать каждый шаг. Sonnet 5 больше полагается на интуицию, ее объяснения короче и менее надежны.
  • Глубоким RAG-системам с многоуровневой маршрутизацией. Opus 4.8 с mid-conversation system позволяет менять промпты на лету — для сложных пайплайнов это золото. Sonnet 5 пока не умеет так гибко адаптироваться.
  • Креативщикам, которым нужен нешаблонный текст. Sonnet 5 слишком агентна, слишком прагматична. Ее тексты — инструкции, а не искусство. Для прозы придется вернуться к Opus.

Как работает Sonnet 5 на практике (и где спотыкается)

Дал Sonnet 5 задачу вроде: «Собери данные о всех AI-стартапах по разработке агентов, профинансированных в июне 2026, найди детали раундов и CEO, сложи в CSV». Процес такой:

  1. Модель открывает браузер, гуглит, заходит на Crunchbase.
  2. Парсит таблицу, отфильтровывает нерелевантное.
  3. Для каждой записи уточняет детали (напр., сумма раунда) по отдельным ссылкам.
  4. Сохраняет всё в CSV, просит пользователя скачать.

Звучит волшебно. На практике: иногда она залипает на дублирующихся страницах, иногда пропускает столбцы. Я заметил, что Sonnet 5 может уйти в бесконечный цикл, если первые шаги плана не выполнены. К счастью, API позволяет задать лимит шагов (например, не больше 20). Иначе код сожрал бы весь дневной бюджет.

Боль: В режиме Agent Teams несколько инстансов Sonnet 5 иногда начинают дублировать работу. Если дать им одну и ту же задачу без четкого разделения зон, они сгенерируют три одинаковых отчета. Координация — слабое место всех мультиагентных систем, и Sonnet 5 не исключение.

Вердикт: бегите или подождите?

Sonnet 5 — это не эволюция. Это мутация. Anthropic сделала модель, которая заточена под действие, а не под размышление. Если вы строите AI-агента, который должен тотально контролировать среду — это ваш выбор. Если вам нужен глубокий аналитик с PhD-уровнем — держитесь за Opus.

Лично я заменил Sonnet 5 на 60% моих запросов к Opus 4.8. Экономия вышла под 2000$ в месяц. И только для самых сложных юридических и финансовых задач я возвращаюсь к Opus.

Один совет, который я хотел бы получить сам: Не читайте бенчмарки. Просто подключите Sonnet 5 к своему потоку на неделю и посмотрите, какие задачи она решает быстрее и чище, чем ваша текущая модель. Вы удивитесь, сколько «критически важных» задач на самом деле не требуют флагманского мозга. Просто их никто не перепроверял на молодой быстрой модели.

Подписаться на канал