Милион токенов за копейки: почему все обсуждают Sonnet 4.6
17 февраля 2026 Anthropic выкатила обновление, которое перевернуло представление о ценах на длинный контекст. Sonnet 4.6 получил контекстное окно в 1 миллион токенов при цене $15 за миллион входных и $60 за миллион выходных токенов. Это в 3-4 раза дешевле, чем у конкурентов с аналогичными возможностями.
Ключевое изменение: раньше длинный контекст был прерогативой флагманских моделей. Теперь средний сегмент получил доступ к анализу документов в 700+ страниц текста без потери качества. Это меняет экономику RAG-систем и аналитических пайплайнов.
Opus 4.6: тот же зверь, но с новыми когтями
Пока все обсуждают Sonnet, Opus 4.6 тихо получил обновление Adaptive Thinking — систему автоматического выбора глубины reasoning. Модель сама решает, когда нужно глубоко подумать (и потратить больше токенов), а когда можно ответить быстро.
На бумаге звучит круто. На практике это значит, что ваш $150-запрос к Opus может закончиться за $75, если модель решит, что задача простая. Или растянуться на $300, если она посчитает нужным «подумать» дольше.
Цифры, которые бьют по глазам: бенчмарки февраля 2026
| Бенчмарк | Sonnet 4.6 | Opus 4.6 | Что это значит |
|---|---|---|---|
| ARC-AGI-2 | 84.2% | 92.7% | Opus лучше в абстрактном мышлении |
| SWE-Bench Verified | 68.3% | 81.9% | Разрыв в реальном кодинге |
| OS World (агентные задачи) | 72.1% | 89.4% | Opus почти автономен |
| Цена за 1M входных токенов | $15 | $150 | Разница в 10 раз |
Цифры не врут: Opus 4.6 все еще король в сложных задачах. Но посмотрите на цену. Десятикратная разница. Стоит ли 15-20% улучшения в бенчмарках десятикратной стоимости?
Когда Sonnet 4.6 — ваш выбор (а когда нет)
1 Анализ длинных документов и RAG
Здесь Sonnet 4.6 убивает конкурентов. 1 миллион токенов за $15 — это примерно 700 страниц технической документации, которые модель прочитает и проанализирует за копейки. Opus сделает то же самое, но за $150. Разницы в качестве анализа технических спецификаций или поиска информации в длинных документах практически нет.
Реальный кейс: вам нужно проанализировать 300-страничный контракт, найти все упоминания SLA и вытащить условия штрафов. Sonnet справится за $4-5. Opus — за $40-50. Результат будет идентичным.
2 Рутинный кодинг и код-ревью
Для ежедневных задач разработчика — написание типовых функций, рефакторинг, простой код-ревью — Sonnet 4.6 более чем достаточен. Его 68.3% на SWE-Bench Verified означают, что он решает 7 из 10 реальных GitHub issues из популярных репозиториев.
Но есть нюанс: если вам нужен не просто код, а архитектурные решения, проектирование сложных систем или отладка нетривиальных багов — здесь уже вступает Opus с его 81.9%. Разница в 13.6% — это разница между «написало работающий код» и «написало оптимальное решение с учетом scaling, edge cases и maintainability».
Важно: SWE-Bench Verified — это реальные issues из реальных репозиториев типа Django, pandas, scikit-learn. 68.3% у Sonnet — это очень высокий результат для модели среднего сегмента. Для сравнения: многие open-source модели 30B параметров едва дотягивают до 40%.
3 Агентные системы и автономные задачи
Вот где Opus 4.6 показывает, за что стоит платить. 89.4% на OS World против 72.1% у Sonnet — это разница между «агент, который иногда ошибается» и «агент, который почти всегда достигает цели».
OS World тестирует выполнение реальных задач в виртуальной среде: установить пакет, настроить сервис, починить конфиг. Opus 4.6 здесь ближе к автономному сотруднику, Sonnet — к стажеру, которому нужно давать четкие инструкции.
Adaptive Thinking: гениально или развод?
Новая фича Opus 4.6 вызывает больше всего споров. Модель сама решает, сколько «думать» над ответом. В теории это экономит токены на простых задачах. На практике вы не контролируете бюджет.
Представьте: вы отправляете запрос на рефакторинг функции. Вчера это стоило $2. Сегодня Opus решает, что функция сложная, включает «глубокий reasoning» и выставляет счет на $8. Консистентности в ценах ноль.
Anthropic утверждает, что в среднем экономия составляет 30-40%. Но «в среднем» — это статистическая уловка. Ваш конкретный use case может оказаться в хвосте распределения, где цена наоборот вырастет.
Гибридный подход: как использовать обе модели
Умные команды не выбирают между Sonnet и Opus. Они используют обе, но для разных задач. Вот рабочий стек на февраль 2026:
- Первичный анализ документов → Sonnet 4.6. Загружаете ТЗ, техдокументацию, требования. 1 млн токенов за $15.
- Архитектурные решения → Opus 4.6. После анализа Sonnet отправляете сжатый контекст в Opus для проектирования.
- Ежедневный кодинг → Sonnet 4.6 для 80% задач, Opus 4.6 для сложных 20%.
- Агентные пайплайны → Opus 4.6 как orchestrator, Sonnet 4.6 как worker для конкретных подзадач.
Этот подход напоминает архитектуру Opus как архитектор, Sonnet как исполнитель. Opus разбивает сложную задачу на подзадачи, Sonnet выполняет их дешево, Opus интегрирует результаты.
А что с конкурентами? GPT-5.3 Codex против дуэта Anthropic
Пока Anthropic играет в «две модели разного класса», OpenAI делает ставку на специализированные модели. GPT-5.3 Codex, выпущенный в январе 2026, бьет рекорды в кодинге, но проигрывает в общих рассуждениях.
Прямое сравнение:
- GPT-5.3 Codex: 85.7% на SWE-Bench, но 76.3% на ARC-AGI-2
- Opus 4.6: 81.9% на SWE-Bench, но 92.7% на ARC-AGI-2
- Sonnet 4.6: 68.3% на SWE-Bench, 84.2% на ARC-AGI-2
Вывод: для чисто кодових задач GPT-5.3 Codex все еще лидер. Для смешанных задач (код + reasoning) Opus 4.6 лучше. Для бюджетного варианта с хорошим балансом — Sonnet 4.6.
Ошибки, которые все совершают с новыми моделями
Ошибка 1: Использовать Opus 4.6 для анализа длинных документов. Платить $150 вместо $15 за ту же работу — безумие. 1 млн токенов в Sonnet — не маркетинг, а реальная фича.
Ошибка 2: Думать, что Sonnet 4.6 справится со сложными агентными задачами. 72.1% на OS World — это хорошо, но не достаточно для production-систем. Для автономных агентов все еще нужен Opus или специализированные модели.
Ошибка 3: Игнорировать Adaptive Thinking в Opus 4.6. Если вы не мониторите стоимость запросов, можете получить неожиданный счет. Настройте алерты или используйте фиксированный бюджет.
Что дальше? Прогноз на 2026 год
Обновление Sonnet 4.6 — это первый звоночек. К середине 2026 года ждите:
- Еще большее удешевление длинного контекста. 2-3 млн токенов за $20-30
- Специализированные версии Sonnet для кодинга, анализа, чата
- Гибридные модели, которые динамически переключаются между «режимами» как Adaptive Thinking, но на уровне архитектуры
- Давление на цены со стороны open-source моделей вроде Apriel v1.6
Самый важный тренд: разделение на «умные, но дорогие» (Opus) и «достаточно умные, но дешевые» (Sonnet) модели. Это не временное явление, а новая норма.
Итоговый чек-лист: что выбрать сегодня
- Бюджет до $1000/месяц → Sonnet 4.6 для всего. Хватит на 60+ миллионов входных токенов.
- Production-агенты → Opus 4.6. 89.4% успешности в автономных задачах.
- Анализ документов + кодинг → Гибрид: Sonnet для анализа, Opus для сложного кода.
- Стартап с ограниченным бюджетом → Sonnet 4.6 + open-source модели для специфичных задач. Как в статье про локального монстра для агентного кодинга.
Главный вопрос не «Какая модель лучше?», а «Какая модель лучше для этой конкретной задачи при моем бюджете?». Sonnet 4.6 с 1 млн токенов за $15 переписывает правила игры для 80% use cases. Но для оставшихся 20% Opus 4.6 все еще незаменим.
P.S. Если вы платите за Opus 4.6, но используете его для анализа документов — остановитесь. Вы выбрасываете $135 из каждых $150. Sonnet сделает то же самое за $15. Проверьте свои логы — скорее всего, 60-70% ваших запросов к Opus можно без потери качества перевести на Sonnet.