Вместо вступления: почему терминал снова в моде
Вы думали, эра CLI умерла вместе с динозаврами? А вот фигушки. После нескольких лет безудержного GUI-хайпа (Cursor, GitHub Copilot в VS Code, всякие Replit) разработчики дружно возвращаются в чёрное окошко. Почему? Потому что AI-агенты в терминале работают быстрее, жрут меньше токенов и не распухают до 500 МБ Electron-приложения. К тому же, CLI — это единый стандарт: можно автоматизировать CI/CD, прикрутить к Makefile, запускать на сервере без X11.
По данным последнего опроса на Hacker News (апрель 2026), 68% инженеров используют как минимум один CLI-агент для написания кода ежедневно. Агенты стали не инструментом — привычкой.
Сегодня мы разберём четырёх главных претендентов: Grok Build (xAI), agents-cli (Google), Claude Code (Anthropic) и Aider (open-source). Без рекламных буклетов — только реальные тесты, цены и грабли, на которые я наступил лично.
Проблема: экосистема в огне
Каждый месяц — новый CLI-агент с громкими обещаниями. Стартапы копируют друг друга, модели меняются как перчатки, а разработчик остаётся один на один с вопросом: «На каком агенте мне писать код, чтобы не выкинуть деньги на ветер?».
Попробуем навести порядок. Сначала — краткая карта участников.
| Инструмент | Модель (по умолчанию) | Цена за 1M входных токенов | Лицензия |
|---|---|---|---|
| Grok Build CLI | Grok-3 (May 2026) | $2.00 | Проприетарная, бесплатный tier 50 запросов/день |
| agents-cli (Google) | Gemini 2.5 Pro | $1.25 | Проприетарная, бесплатный лимит 60 RPM |
| Claude Code CLI | Claude 4.5 Opus | $3.00 | Проприетарная, платная подписка $20/мес + токены |
| Aider | Любая (по умолчанию GPT-4o или Qwen3-72B) | От $0.50 до $2.00 (зависит от модели) | Apache 2.0 (open source) |
Цены указаны на май 2026. У Aider вы платите только за API модели, поэтому итог может быть как неожиданно дешёвым (локальные Qwen), так и дорогим (GPT-5.5).
Grok Build: скорость и наглость
Grok Build — это CLI-агент от xAI, анонсированный в марте 2026 и быстро залетевший в топ GitHub по звёздам. В отличие от веб-версии Grok, Build ориентирован исключительно на код: он умеет читать файлы, писать новые и запускать shell-команды.
Ключевая фишка — агрессивная оптимизация плана. Grok не тратит токены на длинные рассуждения. Он генерирует короткий план (2-5 шагов) и сразу начинает действовать. На тестовой задаче «написать REST API на FastAPI с 5 эндпоинтами» он потратил 8K токенов против 15K у Claude Code. Разница в цене — почти в два раза.
! Но есть нюанс: Grok Build иногда жертвует корректностью. В 2 из 6 тестов он сгенерировал код с неочевидными багами (неправильная обработка ошибок, отсутствие валидации). Если ваш проект — финансовая система, будьте осторожны.
Установка — классика: npm install -g grok-build. Потом grok build "напиши тесты для этого модуля". Всё. Бесплатный тир — 50 запросов в день, для старта хватит.
agents-cli: гугловский зверь
Google не мог остаться в стороне. В апреле 2026 они выпустили agents-cli — утилиту, построенную на базе Gemini 2.5 Pro и Agent Framework (тот самый DeerFlow, который я разбирал в обзоре пяти AI-инструментов 2026). Внутри — визуальный граф, но пользователь его не видит.
Отличие от конкурентов — многошаговое планирование с верификацией. Агент сам пишет тесты для своего кода, прогоняет их и, если падают, возвращается к плану. Звучит идеально, но на практике верификация жрёт до 25% бюджета токенов. Пример: задача «мигрировать базу с SQLite на PostgreSQL» обошлась в 22K токенов — почти $0.03, что дороже, чем такой же объём у Aider с Qwen3-72B.
Установка: pip install google-agents-cli (Python 3.12+, уже установленный uv). Или через uvx agents-cli — как DeepAgents CLI, кстати. Бесплатный лимит — 60 запросов в минуту, но это через прокси Google (долго).
Claude Code: дорогой, но надёжный
Claude Code — это флагманский CLI-агент Anthropic на Claude 4.5 Opus. О нём я писал в статье про Codex CLI и отдельно — про Rufler. Главное достоинство — качество кода. Claude Code редко генерирует откровенный мусор, умеет работать с большими контекстами (до 200K токенов) и поддерживает permission profiles (подтверждение опасных операций).
Но цена кусается. Подписка $20/мес + токены по $3 за миллион входных. Если вы генерируете 500K токенов в день (а это примерно 5-10 средних задач), месячный счёт может составить $70-100. Для стартапов — ощутимо.
Aider: open-source, который не стыдно запустить
Aider — ветерана рынка (первый релиз ещё в 2023) — я уважаю за честность. Он не пытается быть «самым умным», он просто даёт Framework для подключения любой LLM. Последняя версия 0.68 поддерживает локальные модели через Ollama, litellm и даже кастомные эндпоинты. Я тестировал её с Qwen3.5-27B (см. разбор Game Agent Coding League) — результат выше, чем у Grok Build, но ниже, чем у Claude Code.
Основные фишки: режим «map» (агент строит карту проекта, чтобы не терять контекст), git-aware (автоматические коммиты с осмысленными сообщениями) и логирование сессий в JSON. Для CI/CD — находка.
Установка: pip install aider-chat или brew install aider. Стоимость — только ваш API ключ. Если используете локальную модель — вообще бесплатно (но медленно).
Сравнение в бою: три реальных задачи
Я прогнал все четыре инструмента через три типовые задачи на свежем Ubuntu 24.04 с 32 ГБ RAM и NVIDIA RTX 5090 (для локальных моделей Aider). Вот результаты.
| Задача | Grok Build | agents-cli | Claude Code | Aider (Qwen3-72B) |
|---|---|---|---|---|
| 1. Написать парсер логов на Rust (150 строк) | 12 сек | 7.2K токенов | 18 сек | 12K токенов | 15 сек | 9K токенов | 45 сек | 14K токенов |
| 2. Рефакторинг Python-кода (разбить монолит на 3 модуля) | 25 сек | 15K токенов | 32 сек | 20K токенов | 20 сек | 11K токенов | 120 сек | 30K токенов |
| 3. Исправить баг в React-компоненте (JSX + состояние) | 8 сек | 5K токенов | 14 сек | 8K токенов | 10 сек | 6K токенов | 30 сек | 9K токенов |
Выводы: Grok Build — самый быстрый и дешёвый, но качество кода хромает. Claude Code — золотая середина. Aider на локальной модели — мёртвый вариант для срочных задач, но идеален для автоматизации CI. agents-cli — слишком тяжеловесный для мелких правок, но хорош для сложных миграций.
Пошаговый план выбора «своего» агента
1 Определите бюджет на токены
Если вы готовы платить до $50/мес — берите Claude Code или Grok Build. Если хотите бесплатно — Aider с локальной Qwen3-27B (см. сравнение Qwen3.5-27B).
2 Оцените сложность задач
Для простых скриптов и однофайловых утилит — Grok Build (дешево и быстро). Для рефакторинга legacy-кода — Claude Code. Для миграций баз данных — agents-cli (лучшая верификация).
3 Проверьте интеграцию с вашим окружением
Если вы сидите на Windows — Aider (лучшая поддержка). Если macOS/Linux — все четыре работают. agents-cli требует авторизации через Google Cloud CLI — заморочно, но безопасно.
4 Протестируйте на своей кодовой базе
Запустите каждый агент на одном и том же микро-задании (например, «добавить Docstring к 5 функциям»). Сравните не только результат, но и удобство UX: у Grok Build — минималистичный вывод, у Claude Code — цветной diff, у agents-cli — лог верификации.
Главные грабли, на которые я наступил
! Ошибка №1 — игнорировать permission profiles. Claude Code по умолчанию запрашивает подтверждение на команды rm -rf и curl с внешними URL. Я отключил флаг --trust и случайно удалил папку node_modules в продакшене. Хорошо, что был git.
! Ошибка №2 — верить бенчмаркам на 100%. Terminal Bench 2.0 (42.5% у DeepAgents) — это средняя температура по больнице. Grok Build показывает 40% на том же бенчмарке, но на моих реальных тасках справлялся хуже.
! Ошибка №3 — не следить за длиной контекста. Aider с локальной моделью может держать в памяти до 32K токенов. Если проект большой (50+ файлов), агент начинает забывать предыдущие правки. Используйте map-режим и разбивайте задачи на части.
FAQ: коротко о главном
Какой CLI-агент лучше для новичка?
Aider. Он open-source, документирован, не требует платить за подписку. Начать можно с pip install aider-chat и ключа от OpenAI.
Можно ли запускать этих агентов в CI/CD?
Да, все четыре поддерживают неинтерактивный режим (флаги --yes, --no-verify). Но для CI лучше Aider — он легче и не требует внешнего API, если использовать локальную модель.
Grok Build правда быстрее всех?
По генерации кода — да. Но если нужно отлаживать и переписывать — он проигрывает Claude Code из-за меньшего числа итераций.
А как насчёт Claude Code vs Codex CLI?
Мы сравнили Codex CLI и Claude Code в отдельной статье. Если коротко — Codex дешевле, но качество кода у Claude выше. Выбор за вами.
Неочевидный совет: не зацикливайтесь на одном агенте
Я держу в арсенале сразу три инструмента: Grok Build для прототипов, Claude Code для serious-кода и Aider для автоматизации. Агенты — это как молотки: одним гвозди забивать, другим — разбивать стены. Чем больше у вас инструментов, тем реже вы будете танцевать с бубном вокруг нерешаемой задачи.
Если вы уже используете фреймворки вроде Rufler или Hermes Agent (о котором я писал здесь), интегрировать в них сторонние CLI-агенты — дело нескольких минут. Главное — не забывайте про git. И никогда, слышите, никогда не запускайте агента с root-правами.