Два апдейта, один мировой хайп
Февраль 2026 года начался с громких анонсов. Anthropic выпустила Claude Sonnet 4.6, а Google – Gemini 3.1 Pro. Обе модели кричат об одном: контекстное окно в 1 миллион токенов. Это не просто цифра. Это обещание проанализировать всю вашу кодобазу, всю документацию, всю переписку за раз. Но кто из них не просто хвастается, а реально работает?
Важно: обе модели доступны через платные API. Бесплатные версии в ChatGPT или Bard таких возможностей не предлагают. Речь идет о профессиональном инструменте.
Claude Sonnet 4.6: философ стал инженером?
Anthropic всегда позиционировала Claude как вдумчивую, осторожную модель. Sonnet 4.6 ломает стереотипы. Основной козырь – стабильная работа с полным контекстом в 1M токенов. Не 200к, не 500к, а целый миллион. В теории это позволяет загрузить 700 страниц технической документации и задавать вопросы по любой из них.
Но главное – результаты на бенчмарках. Sonnet 4.6 показывает 78.4% на SWE-Bench (тест на исправление багов в реальных GitHub репозиториях). Для сравнения, Claude 4.5 Sonnet выдавал около 72%. Прогресс есть, и он заметен. Модель стала менее многословной в коде, реже галлюцинирует с синтаксисом.
Gemini 3.1 Pro: ответ Google на все вопросы
Google, после успеха Gemini 3 Flash, решил не мелочиться. Gemini 3.1 Pro – это флагман, заточенный под reasoning и длинный контекст. Их миллион токенов поддерживается «из коробки» для текста и кода (для изображений пока 128к). Архитектурно это развитие идей из Gemini 3, но с оптимизациями.
На что смотреть? На бенчмарк OS World (агент, взаимодействующий с операционной системой). Здесь Gemini 3.1 Pro бьет рекорды – 91.2% успешных задач. Модель умеет не просто писать код, а выполнять многошаговые инструкции: найти файл, отредактировать, запустить, проанализировать лог. Это уровень автономного ассистента.
Ценник у Google агрессивный. Стоимость ввода для Gemini 3.1 Pro почти на 15% ниже, чем у Claude Sonnet 4.6. Но есть нюанс: цена вывода (сгенерированного текста) может быть выше при больших объемах. Типичный Google – заманивает, а потом считает каждую токен-копейку.
Табличный разбор: холодные цифры февраля 2026
| Параметр | Claude Sonnet 4.6 | Gemini 3.1 Pro |
|---|---|---|
| Контекстное окно (токенов) | 1 000 000 | 1 000 000 |
| SWE-Bench Score | 78.4% | 76.1% |
| OS World Score | 84.7% | 91.2% |
| Цена за 1M вводных токенов | ~$18.50 | ~$15.75 |
| Скорость генерации (токен/с) | 120-150 | 180-220 |
| Мультимодальность | Текст, изображения (анализ) | Текст, изображения, аудио (ввод) |
Цены актуальны на 24.02.2026 для публичных API. Gemini быстрее и дешевле на входе. Claude чуть точнее в чистом кодинге. Выбор зависит от задачи.
Кому и что брать? Мнение из окопов
Писать агентов для автоматизации? Берите Gemini 3.1 Pro. Его результаты на OS World и скорость говорят сами за себя. Модель создана для цепочек действий. Если ваш проект похож на screenshot-to-code с множеством шагов, Google предложит более надежную агентскую логику.
Детально рефакторить legacy-код, изучать монорепозитории? Claude Sonnet 4.6. Его сила – в аккуратности и понимании сложного контекста. Модель реже теряет нить рассуждений на 500-й странице документа. (Хотя и стоит это удовольствие дороже).
Не верьте слепо бенчмаркам. Протестируйте обе модели на своих данных. Загрузите свою документацию, свой код. Один проваленный кейс из реальной работы перевесит все красивые цифры.
А что с мультимодальностью и русским?
Claude Sonnet 4.6 лучше понимает нюансы русского языка в технических текстах. У Gemini 3.1 Pro иногда проскальзывает «переводной» стиль в ответах. Визуальное восприятие у обоих на высоком уровне, но для работы с скриншотами интерфейсов и диаграммами, как в нашем стресс-тесте, разница минимальна.
Gemini имеет встроенную поддержку аудиоввода – можно отправлять голосовые инструкции. Для Claude это пока неактуально.
Итог: кто выиграл февраль 2026?
Победителя нет. Есть два разных инструмента. Google сделал мощный, быстрый и относительно дешевый двигатель для AI-агентов. Anthropic отточила точный инструмент для глубокого анализа сложных текстов и кода.
Мой совет: начните с Gemini 3.1 Pro для большинства задач. Он экономичнее и шустрее. Если упретесь в ограничения по качеству анализа или работе с гигантскими контекстами – подключайте Claude Sonnet 4.6 как «тяжелую артиллерию». Подписаться на API можно через официальный сайт Anthropic и Google Cloud Vertex AI.
А гонка только начинается. Ожидайте, что к лету 2026 кто-нибудь (возможно, OpenAI с GPT-5) анонсирует контекст в 2 миллиона токенов. И тогда эти два тяжеловеса покажутся нам лишь разминкой.