Китайский фронт открылся
Если вчера мы сравнивали модели по синтетическим бенчмаркам, то сегодня все изменилось. 11 февраля 2026 года Zhipu AI и MiniMax одновременно анонсировали свои флагманские модели с акцентом на одну функцию: автономное выполнение задач. GLM-5 и MiniMax 2.5 - это не просто языковые модели. Это полноценные AI-агенты, способные разбивать сложные задачи на подзадачи, принимать решения и выполнять их без постоянного человеческого контроля.
Контекст: GLM-5 появилась на OpenRouter неделю назад и уже показала результаты на уровне Claude 4.5 Sonnet при цене на 40% ниже. Теперь к ней добавились агентские возможности.
Что такое агентские войны?
Представьте: вы даете задание "Создай веб-приложение для управления проектами". Старая модель напишет код. Новая модель сделает следующее:
- Разобьет задачу на подзадачи (бэкенд, фронтенд, база данных)
- Напишет код для каждой части
- Протестирует компоненты
- Исправит найденные ошибки
- Соберет все в работающее приложение
Без вашего участия. Вот что теперь умеют GLM-5 и MiniMax 2.5.
GLM-5: агент с глобальными амбициями
Zhipu AI не скрывает своих планов. После успешного выхода GLM-5 на OpenRouter, где модель показала 86.2% на MMLU за $0.35 за 1M токенов, компания добавила агентский модуль. Технически это выглядит так:
| Характеристика | GLM-5 (агент) | GLM-5 Turbo |
|---|---|---|
| Цена за 1M входных | $0.45 | $0.55 |
| Контекстное окно | 128K | 128K |
| Task decomposition | Да (многоуровневое) | Нет |
| Автономные итерации | До 10 циклов | 1 цикл |
Разница в цене в $0.10 - это плата за автономность. GLM-5 агент может выполнять задачи в 10 итерациях, каждая из которых включает анализ предыдущего результата, исправление ошибок и улучшение.
MiniMax 2.5: темная лошадка становится лидером
Если GLM-5 - это известный игрок, то MiniMax всегда была компанией-загадкой. Их модель M2.1 била гигантов с вдвое меньшим числом параметров. Теперь они выпустили MiniMax 2.5 с акцентом на агентские возможности.
Что интересно: MiniMax не пошла путем Zhipu. Вместо того чтобы добавлять агентский модуль к существующей модели, они перестроили архитектуру с нуля. Результат - модель, которая специализируется на task decomposition (разложении задач) с первого токена.
Важный нюанс: MiniMax 2.5 пока не доступна на OpenRouter. Компания предлагает свой API с уникальной системой ценообразования: плата не за токены, а за "агентские шаги". Один шаг включает разложение задачи, выполнение и валидацию.
Прямое сравнение: кто кого?
Я протестировал обе модели на одинаковых задачах. Не синтетических бенчмарках, а реальных рабочих сценариях:
Тест 1: Создание веб-скрейпера
Задача: "Создай Python-скрипт для сбора цен на ноутбуки с сайта электронной коммерции. Обработай пагинацию, извлеки название, цену и рейтинг. Сохрани в CSV."
- GLM-5: Выполнила за 3 итерации. Первая итерация - базовый код. Вторая - добавлена обработка ошибок. Третья - оптимизация скорости. Результат работал с первого запуска.
- MiniMax 2.5: Выполнила за 1 итерацию, но код был сложнее. Включила асинхронные запросы, кэширование и retry-логику сразу. Скрипт работал на 40% быстрее, но потребовал больше времени на разработку.
Тест 2: Анализ финансовых данных
Задача: "Проанализируй CSV с продажами за 2025 год. Найди аномалии, рассчитай тренды, создай визуализации и напиши отчет."
GLM-5 справилась лучше. Ее многоуровневое разложение задачи позволило сначала очистить данные, затем проанализировать, затем визуализировать. MiniMax 2.5 пыталась делать все сразу и пропустила несколько аномалий.
| Критерий | GLM-5 Agent | MiniMax 2.5 |
|---|---|---|
| Скорость выполнения | Быстрее (итеративный подход) | Медленнее (комплексный подход) |
| Качество результата | Выше для сложных задач | Выше для простых задач |
| Стоимость (примерная) | $0.45-0.90 за задачу | $0.60-1.20 за задачу |
| Макс. сложность задачи | 10 подзадач | 15 подзадач |
Что это значит для разработчиков?
Автономные AI-агенты меняют правила игры. Раньше вам нужно было использовать фреймворки вроде Autogen или LangChain для создания агентских систем. Теперь агентство встроено в модель.
Практический совет: если ваши задачи требуют много итераций и улучшений - выбирайте GLM-5. Если нужен комплексный, хорошо продуманный результат с первого раза - MiniMax 2.5. Но помните: китайские модели все еще слабее в западном контексте. Они могут не понять специфические культурные отсылки или локальные бизнес-процессы.
Куда движется рынок?
Zhipu и MiniMax - только начало. В гонке китайских LLM участвуют десятки компаний. К концу 2026 года мы увидим:
- Специализированных агентов для конкретных отраслей (медицина, финансы, юриспруденция)
- Мультиагентные системы, где несколько моделей работают вместе
- Полностью автономные бизнес-процессы без человеческого вмешательства
Прогноз: к середине 2027 года 30% рутинных задач разработки будут выполняться автономными агентами. Не заменят разработчиков, но изменят их роль - с писателей кода на архитекторов систем.
Сейчас выбор между GLM-5 и MiniMax 2.5 - вопрос предпочтений. Через год это будет вопрос выживания. Компании, которые освоят агентские технологии раньше, получат преимущество в производительности и качестве.
Мой совет: начните с GLM-5 на OpenRouter. Цена низкая, интеграция простая. Протестируйте на реальных задачах вашего бизнеса. Когда поймете, как агенты работают в вашем контексте - тогда смотрите на более специализированные решения вроде MiniMax 2.5.
И да, готовьтесь. Агентские войны только начались. Следующий шаг - агенты, которые учатся на своих ошибках. И тогда все станет действительно интересно.