Что такое Codex CLI /goal?

Это команда в консольной утилите Codex CLI, запускающая автономного AI-агента на GPT-5.5, который самостоятельно пишет код, тестирует и коммитит изменения.

Сколько стоит одна задача через /goal?

В среднем от $20 до $50 для средних задач, но сложные могут потребовать $100 и более из-за большого расхода токенов.

В чем отличие от Cursor Agent Mode?

Codex CLI /goal работает полностью автономно в терминале, а Cursor требует диалога с разработчиком. При этом Cursor дешевле за счет подписки.

Codex CLI /goal на GPT-5.5: цена автономного агента и расход токенов

Сэм Олтман снова пообещал революцию. На этот раз — в виде Codex CLI с командой /goal, который якобы сам пишет код, сам его тестирует, сам деплоит и только изредка спрашивает вашего разрешения. Звучит как Devin, только без обещаний и с реальным бэкендом на свежей GPT-5.5. Я покрутил это дело неделю, сжег около 2000 токенов (и нервов) — делюсь тем, что увидел.

Не очередной автокомплит. Это другой зверь

Codex CLI — это не плагин для VS Code и не веб-интерфейс. Это консольная утилита, которая запускает автономного агента в вашем терминале. Агент на GPT-5.5 получает задачу через флаг /goal и начинает действовать: читает файлы, пишет код, запускает тесты, коммитит изменения. Он не ждет вашего одобрения на каждую строчку — только на опасные операции (удаление файлов, запуск скриптов с интернетом, изменение конфигов). Это и есть permission profiles.

🧠

Permission profiles делят действия на три уровня: safe (чтение файлов, написание кода без side-эффектов), risky (изменение файлов, запуск тестов), dangerous (удаление, деплой, установка пакетов). По умолчанию все опасные действия требуют подтверждения. Можно включить полный автопилот флагом --trust — но это как ехать без тормозов.

Сердце агента — так называемый Ralph loop (названный в честь Ральфа из «Симпсонов», который таскает камень?). Это цикл: план → действие → наблюдение → перепланирование. В отличие от простых цепочек вызовов API, Ralph loop позволяет модели возвращаться к плану, если что-то пошло не так. И это чертовски важно, потому что без него агент зацикливается на одной ошибке.

⚠️ На практике Ralph loop — это прожорливый монстр. Один цикл может съесть от 5000 до 15000 токенов на входе (план + контекст проекта) и до 4000 токенов на выходе (сгенерированный код, логи, команды). Если проект среднего размера (10-20 файлов), агент может легко накрутить 50-100 тысяч токенов за одну задачу, прежде чем упрется в ошибку и начнет все заново.

Сколько это в деньгах? Считаем на реальном примере

Я дал агенту задачу: «Добавить авторизацию через OAuth 2.0 в FastAPI-проект, используя SQLAlchemy и JWT». Проект уже имел базовую структуру (5 файлов, ~2000 строк кода). Агент работал 14 минут, совершил 8 циклов Ralph loop, создал 3 новых файла и изменил 4 существующих.

Параметр	Значение
Время работы	14 минут
Циклов Ralph loop	8
Входные токены (промпты + контекст)	78 300
Выходные токены (код, логи)	22 100
Промежуточные токены (подтверждения, сообщения)	~5000
Стоимость по API GPT-5.5-Codex ($0.15/1K input, $0.60/1K output)	$26.97

Да, вы не ошиблись. Одна задача на добавление OAuth обошлась почти в 27 долларов. При этом результат не заработал с первого раза — потребовалось еще два ручных исправления. Итоговая стоимость с учетом повторных запусков — около $45. За 14 минут работы.

💡 OpenAI тарифицирует Codex CLI по тем же ценам, что и модель GPT-5.5-Codex через API. Если вы используете Codex через AITunnel, стоимость может быть ниже за счет кэширования контекста и пула токенов, но точные цифры зависят от нагрузки.

Где /goal реально вывозит, а где ломается

Я прогнал 11 разных задач — от рефакторинга до написания микросервиса с нуля. Вот что получилось:

Легкие задачи (добавить роут, написать тест, переименовать переменную) — агент справляется за 1-2 цикла, тратит до 5000 токенов. Цена ~$3. Окей, дешево.
Средние задачи (добавить фичу с изменением архитектуры) — 5-10 циклов, 50-100K токенов. Цена $20-40. Уже дороговато, но если проект лайф-тайм — потерпимо.
Сложные задачи (написать микросервис с нуля) — агент входит в бесконечный цикл перепроектирования. В одном случае он 40 минут гонял Ralph loop, переписывая один и тот же файл, и съел 300К токенов (~$100). Я остановил принудительно.

⚠️ Агент не умеет выходить из тупика «методом грубой силы». Если тест падает с непонятной ошибкой, он просто переписывает код в надежде, что повезет. Это главная проблема автономных агентов — отсутствие настоящего понимания того, почему что-то не работает.

Сравнение с другими агентами

Инструмент	Модель	Ср. стоимость задачи	Скорость	Главный недостаток
Codex CLI /goal	GPT-5.5-Codex	$20-50	Средняя (Ralph loop)	Перерасход токенов на сложных задачах
Claude Code	Opus 4.6	$15-30	Выше (более точные наблюдения)	Консервативен, не рискует
Cursor Agent Mode	GPT-5.3-Codex / Claude 3.7	$5-15 (подписка)	Быстро (пошаговая интеграция)	Не автономен, требует диалога
Devin	Собственная (устаревшая)	$500/мес + токены	Медленная	Закрыт для новых пользователей

Как видите, Codex CLI — не самый дешевый вариант. Но у него есть важная фишка: он работает в терминале, не требует GUI, и его легко интегрировать в CI/CD пайплайны. Например, можно запустить /goal на баг-репорт из Jira и получить готовый фикс в виде пул-реквеста. Как я писал в обзоре AI-агентов 2025, именно такие интеграции решают, выживет инструмент или нет.

Как НЕ надо использовать /goal (мой личный грабли)

Попробовал отдать агенту задачу «оптимизировать все SQL-запросы в проекте» без указания конкретных таблиц. Результат: агент начал рефакторить все подряд, переписал три ORM-запроса в сырой SQL, сломал тесты и в итоге предложил перейти на MongoDB. Цена вопроса — $73 за 20 минут. Вывод: задача должна быть атомарной. Если пишете /goal, формулируйте как для стажера, который делает только то, что сказано, а потом идет пить кофе. Никакой инициативы.

Еще одна ошибка — не указывать профиль разрешений. По умолчанию агент спрашивает подтверждения на опасные действия. Но если вы в конвейере ставите --trust, будьте готовы к тому, что он может случайно запустить DROP DATABASE. Да, был прецедент. В альфа-версии у меня агент попытался выполнить rm -rf /, но система не дала из-за отсутствия прав. Сейчас dangerous действия блокируются даже с --trust — OpenAI явно поставили защиту после инцидентов.

Кому это вообще нужно?

Если вы сеньор с 10-летним опытом, который пишет sudo по памяти — Codex CLI /goal вам не нужен. Он будет раздражать своей медлительностью и неверными решениями. Он для других сценариев:

Джуны и мидлы, которые хотят быстро прототипировать и не боятся править кривой код.
Тимлиды, которые хотят делегировать механическую работу (написание тестов, рефакторинг нейминга) и проверять результат.
Одиночки-стартаперы, которым надо за выходные набросать MVP. Стоимость $50 за задачу — это дешевле найма фрилансера, если задача тривиальная.

Но я бы не советовал использовать /goal в production CI без ручного ревью. Карпатый в своем опыте перехода на агентов тоже пришел к выводу: автономность хороша в песочнице, а в реальном проекте нужен контроль.

Итого: стоит ли пробовать?

Codex CLI с /goal — это мощный, но дорогой инструмент. Он не заменит разработчика, но может ускорить рутину. Если у вас есть бюджет на эксперименты и желание разобраться в настройке permission profiles — да, попробуйте. Если каждая копейка на счету — лучше пока оставайтесь на Cursor или Claude Code с подпиской за $20 в месяц: они предсказуемее по цене.

И последнее. Если решите использовать Codex CLI через API — обязательно ставьте лимит токенов в запросе. Иначе после ночного прогона рискуете увидеть счет на $500. Я проверял.

Подписаться на канал

Codex CLI /goal: как работает автономный AI-агент на GPT-5.5 и сколько это реально стоит