Codex CLI /goal на GPT-5.5: цена автономного агента и расход токенов | AiManual
AiManual Logo Ai / Manual.
07 Май 2026 Инструмент

Codex CLI /goal: как работает автономный AI-агент на GPT-5.5 и сколько это реально стоит

Разбор команды /goal в Codex CLI с GPT-5.5: как работает Ralph loop, permission profiles, реальный расход токенов и стоимость. Сравнение с Claude Code и Cursor.

Сэм Олтман снова пообещал революцию. На этот раз — в виде Codex CLI с командой /goal, который якобы сам пишет код, сам его тестирует, сам деплоит и только изредка спрашивает вашего разрешения. Звучит как Devin, только без обещаний и с реальным бэкендом на свежей GPT-5.5. Я покрутил это дело неделю, сжег около 2000 токенов (и нервов) — делюсь тем, что увидел.

Не очередной автокомплит. Это другой зверь

Codex CLI — это не плагин для VS Code и не веб-интерфейс. Это консольная утилита, которая запускает автономного агента в вашем терминале. Агент на GPT-5.5 получает задачу через флаг /goal и начинает действовать: читает файлы, пишет код, запускает тесты, коммитит изменения. Он не ждет вашего одобрения на каждую строчку — только на опасные операции (удаление файлов, запуск скриптов с интернетом, изменение конфигов). Это и есть permission profiles.

🧠
Permission profiles делят действия на три уровня: safe (чтение файлов, написание кода без side-эффектов), risky (изменение файлов, запуск тестов), dangerous (удаление, деплой, установка пакетов). По умолчанию все опасные действия требуют подтверждения. Можно включить полный автопилот флагом --trust — но это как ехать без тормозов.

Сердце агента — так называемый Ralph loop (названный в честь Ральфа из «Симпсонов», который таскает камень?). Это цикл: план → действие → наблюдение → перепланирование. В отличие от простых цепочек вызовов API, Ralph loop позволяет модели возвращаться к плану, если что-то пошло не так. И это чертовски важно, потому что без него агент зацикливается на одной ошибке.

⚠️ На практике Ralph loop — это прожорливый монстр. Один цикл может съесть от 5000 до 15000 токенов на входе (план + контекст проекта) и до 4000 токенов на выходе (сгенерированный код, логи, команды). Если проект среднего размера (10-20 файлов), агент может легко накрутить 50-100 тысяч токенов за одну задачу, прежде чем упрется в ошибку и начнет все заново.

Сколько это в деньгах? Считаем на реальном примере

Я дал агенту задачу: «Добавить авторизацию через OAuth 2.0 в FastAPI-проект, используя SQLAlchemy и JWT». Проект уже имел базовую структуру (5 файлов, ~2000 строк кода). Агент работал 14 минут, совершил 8 циклов Ralph loop, создал 3 новых файла и изменил 4 существующих.

Параметр Значение
Время работы 14 минут
Циклов Ralph loop 8
Входные токены (промпты + контекст) 78 300
Выходные токены (код, логи) 22 100
Промежуточные токены (подтверждения, сообщения) ~5000
Стоимость по API GPT-5.5-Codex ($0.15/1K input, $0.60/1K output) $26.97

Да, вы не ошиблись. Одна задача на добавление OAuth обошлась почти в 27 долларов. При этом результат не заработал с первого раза — потребовалось еще два ручных исправления. Итоговая стоимость с учетом повторных запусков — около $45. За 14 минут работы.

💡 OpenAI тарифицирует Codex CLI по тем же ценам, что и модель GPT-5.5-Codex через API. Если вы используете Codex через AITunnel, стоимость может быть ниже за счет кэширования контекста и пула токенов, но точные цифры зависят от нагрузки.

Где /goal реально вывозит, а где ломается

Я прогнал 11 разных задач — от рефакторинга до написания микросервиса с нуля. Вот что получилось:

  • Легкие задачи (добавить роут, написать тест, переименовать переменную) — агент справляется за 1-2 цикла, тратит до 5000 токенов. Цена ~$3. Окей, дешево.
  • Средние задачи (добавить фичу с изменением архитектуры) — 5-10 циклов, 50-100K токенов. Цена $20-40. Уже дороговато, но если проект лайф-тайм — потерпимо.
  • Сложные задачи (написать микросервис с нуля) — агент входит в бесконечный цикл перепроектирования. В одном случае он 40 минут гонял Ralph loop, переписывая один и тот же файл, и съел 300К токенов (~$100). Я остановил принудительно.

⚠️ Агент не умеет выходить из тупика «методом грубой силы». Если тест падает с непонятной ошибкой, он просто переписывает код в надежде, что повезет. Это главная проблема автономных агентов — отсутствие настоящего понимания того, почему что-то не работает.

Сравнение с другими агентами

Инструмент Модель Ср. стоимость задачи Скорость Главный недостаток
Codex CLI /goal GPT-5.5-Codex $20-50 Средняя (Ralph loop) Перерасход токенов на сложных задачах
Claude Code Opus 4.6 $15-30 Выше (более точные наблюдения) Консервативен, не рискует
Cursor Agent Mode GPT-5.3-Codex / Claude 3.7 $5-15 (подписка) Быстро (пошаговая интеграция) Не автономен, требует диалога
Devin Собственная (устаревшая) $500/мес + токены Медленная Закрыт для новых пользователей

Как видите, Codex CLI — не самый дешевый вариант. Но у него есть важная фишка: он работает в терминале, не требует GUI, и его легко интегрировать в CI/CD пайплайны. Например, можно запустить /goal на баг-репорт из Jira и получить готовый фикс в виде пул-реквеста. Как я писал в обзоре AI-агентов 2025, именно такие интеграции решают, выживет инструмент или нет.

Как НЕ надо использовать /goal (мой личный грабли)

Попробовал отдать агенту задачу «оптимизировать все SQL-запросы в проекте» без указания конкретных таблиц. Результат: агент начал рефакторить все подряд, переписал три ORM-запроса в сырой SQL, сломал тесты и в итоге предложил перейти на MongoDB. Цена вопроса — $73 за 20 минут. Вывод: задача должна быть атомарной. Если пишете /goal, формулируйте как для стажера, который делает только то, что сказано, а потом идет пить кофе. Никакой инициативы.

Еще одна ошибка — не указывать профиль разрешений. По умолчанию агент спрашивает подтверждения на опасные действия. Но если вы в конвейере ставите --trust, будьте готовы к тому, что он может случайно запустить DROP DATABASE. Да, был прецедент. В альфа-версии у меня агент попытался выполнить rm -rf /, но система не дала из-за отсутствия прав. Сейчас dangerous действия блокируются даже с --trust — OpenAI явно поставили защиту после инцидентов.

Кому это вообще нужно?

Если вы сеньор с 10-летним опытом, который пишет sudo по памяти — Codex CLI /goal вам не нужен. Он будет раздражать своей медлительностью и неверными решениями. Он для других сценариев:

  • Джуны и мидлы, которые хотят быстро прототипировать и не боятся править кривой код.
  • Тимлиды, которые хотят делегировать механическую работу (написание тестов, рефакторинг нейминга) и проверять результат.
  • Одиночки-стартаперы, которым надо за выходные набросать MVP. Стоимость $50 за задачу — это дешевле найма фрилансера, если задача тривиальная.

Но я бы не советовал использовать /goal в production CI без ручного ревью. Карпатый в своем опыте перехода на агентов тоже пришел к выводу: автономность хороша в песочнице, а в реальном проекте нужен контроль.

Итого: стоит ли пробовать?

Codex CLI с /goal — это мощный, но дорогой инструмент. Он не заменит разработчика, но может ускорить рутину. Если у вас есть бюджет на эксперименты и желание разобраться в настройке permission profiles — да, попробуйте. Если каждая копейка на счету — лучше пока оставайтесь на Cursor или Claude Code с подпиской за $20 в месяц: они предсказуемее по цене.

И последнее. Если решите использовать Codex CLI через API — обязательно ставьте лимит токенов в запросе. Иначе после ночного прогона рискуете увидеть счет на $500. Я проверял.

Подписаться на канал