Сэм Олтман снова пообещал революцию. На этот раз — в виде Codex CLI с командой /goal, который якобы сам пишет код, сам его тестирует, сам деплоит и только изредка спрашивает вашего разрешения. Звучит как Devin, только без обещаний и с реальным бэкендом на свежей GPT-5.5. Я покрутил это дело неделю, сжег около 2000 токенов (и нервов) — делюсь тем, что увидел.
Не очередной автокомплит. Это другой зверь
Codex CLI — это не плагин для VS Code и не веб-интерфейс. Это консольная утилита, которая запускает автономного агента в вашем терминале. Агент на GPT-5.5 получает задачу через флаг /goal и начинает действовать: читает файлы, пишет код, запускает тесты, коммитит изменения. Он не ждет вашего одобрения на каждую строчку — только на опасные операции (удаление файлов, запуск скриптов с интернетом, изменение конфигов). Это и есть permission profiles.
--trust — но это как ехать без тормозов.Сердце агента — так называемый Ralph loop (названный в честь Ральфа из «Симпсонов», который таскает камень?). Это цикл: план → действие → наблюдение → перепланирование. В отличие от простых цепочек вызовов API, Ralph loop позволяет модели возвращаться к плану, если что-то пошло не так. И это чертовски важно, потому что без него агент зацикливается на одной ошибке.
⚠️ На практике Ralph loop — это прожорливый монстр. Один цикл может съесть от 5000 до 15000 токенов на входе (план + контекст проекта) и до 4000 токенов на выходе (сгенерированный код, логи, команды). Если проект среднего размера (10-20 файлов), агент может легко накрутить 50-100 тысяч токенов за одну задачу, прежде чем упрется в ошибку и начнет все заново.
Сколько это в деньгах? Считаем на реальном примере
Я дал агенту задачу: «Добавить авторизацию через OAuth 2.0 в FastAPI-проект, используя SQLAlchemy и JWT». Проект уже имел базовую структуру (5 файлов, ~2000 строк кода). Агент работал 14 минут, совершил 8 циклов Ralph loop, создал 3 новых файла и изменил 4 существующих.
| Параметр | Значение |
|---|---|
| Время работы | 14 минут |
| Циклов Ralph loop | 8 |
| Входные токены (промпты + контекст) | 78 300 |
| Выходные токены (код, логи) | 22 100 |
| Промежуточные токены (подтверждения, сообщения) | ~5000 |
| Стоимость по API GPT-5.5-Codex ($0.15/1K input, $0.60/1K output) | $26.97 |
Да, вы не ошиблись. Одна задача на добавление OAuth обошлась почти в 27 долларов. При этом результат не заработал с первого раза — потребовалось еще два ручных исправления. Итоговая стоимость с учетом повторных запусков — около $45. За 14 минут работы.
💡 OpenAI тарифицирует Codex CLI по тем же ценам, что и модель GPT-5.5-Codex через API. Если вы используете Codex через AITunnel, стоимость может быть ниже за счет кэширования контекста и пула токенов, но точные цифры зависят от нагрузки.
Где /goal реально вывозит, а где ломается
Я прогнал 11 разных задач — от рефакторинга до написания микросервиса с нуля. Вот что получилось:
- Легкие задачи (добавить роут, написать тест, переименовать переменную) — агент справляется за 1-2 цикла, тратит до 5000 токенов. Цена ~$3. Окей, дешево.
- Средние задачи (добавить фичу с изменением архитектуры) — 5-10 циклов, 50-100K токенов. Цена $20-40. Уже дороговато, но если проект лайф-тайм — потерпимо.
- Сложные задачи (написать микросервис с нуля) — агент входит в бесконечный цикл перепроектирования. В одном случае он 40 минут гонял Ralph loop, переписывая один и тот же файл, и съел 300К токенов (~$100). Я остановил принудительно.
⚠️ Агент не умеет выходить из тупика «методом грубой силы». Если тест падает с непонятной ошибкой, он просто переписывает код в надежде, что повезет. Это главная проблема автономных агентов — отсутствие настоящего понимания того, почему что-то не работает.
Сравнение с другими агентами
| Инструмент | Модель | Ср. стоимость задачи | Скорость | Главный недостаток |
|---|---|---|---|---|
| Codex CLI /goal | GPT-5.5-Codex | $20-50 | Средняя (Ralph loop) | Перерасход токенов на сложных задачах |
| Claude Code | Opus 4.6 | $15-30 | Выше (более точные наблюдения) | Консервативен, не рискует |
| Cursor Agent Mode | GPT-5.3-Codex / Claude 3.7 | $5-15 (подписка) | Быстро (пошаговая интеграция) | Не автономен, требует диалога |
| Devin | Собственная (устаревшая) | $500/мес + токены | Медленная | Закрыт для новых пользователей |
Как видите, Codex CLI — не самый дешевый вариант. Но у него есть важная фишка: он работает в терминале, не требует GUI, и его легко интегрировать в CI/CD пайплайны. Например, можно запустить /goal на баг-репорт из Jira и получить готовый фикс в виде пул-реквеста. Как я писал в обзоре AI-агентов 2025, именно такие интеграции решают, выживет инструмент или нет.
Как НЕ надо использовать /goal (мой личный грабли)
Попробовал отдать агенту задачу «оптимизировать все SQL-запросы в проекте» без указания конкретных таблиц. Результат: агент начал рефакторить все подряд, переписал три ORM-запроса в сырой SQL, сломал тесты и в итоге предложил перейти на MongoDB. Цена вопроса — $73 за 20 минут. Вывод: задача должна быть атомарной. Если пишете /goal, формулируйте как для стажера, который делает только то, что сказано, а потом идет пить кофе. Никакой инициативы.
Еще одна ошибка — не указывать профиль разрешений. По умолчанию агент спрашивает подтверждения на опасные действия. Но если вы в конвейере ставите --trust, будьте готовы к тому, что он может случайно запустить DROP DATABASE. Да, был прецедент. В альфа-версии у меня агент попытался выполнить rm -rf /, но система не дала из-за отсутствия прав. Сейчас dangerous действия блокируются даже с --trust — OpenAI явно поставили защиту после инцидентов.
Кому это вообще нужно?
Если вы сеньор с 10-летним опытом, который пишет sudo по памяти — Codex CLI /goal вам не нужен. Он будет раздражать своей медлительностью и неверными решениями. Он для других сценариев:
- Джуны и мидлы, которые хотят быстро прототипировать и не боятся править кривой код.
- Тимлиды, которые хотят делегировать механическую работу (написание тестов, рефакторинг нейминга) и проверять результат.
- Одиночки-стартаперы, которым надо за выходные набросать MVP. Стоимость $50 за задачу — это дешевле найма фрилансера, если задача тривиальная.
Но я бы не советовал использовать /goal в production CI без ручного ревью. Карпатый в своем опыте перехода на агентов тоже пришел к выводу: автономность хороша в песочнице, а в реальном проекте нужен контроль.
Итого: стоит ли пробовать?
Codex CLI с /goal — это мощный, но дорогой инструмент. Он не заменит разработчика, но может ускорить рутину. Если у вас есть бюджет на эксперименты и желание разобраться в настройке permission profiles — да, попробуйте. Если каждая копейка на счету — лучше пока оставайтесь на Cursor или Claude Code с подпиской за $20 в месяц: они предсказуемее по цене.
И последнее. Если решите использовать Codex CLI через API — обязательно ставьте лимит токенов в запросе. Иначе после ночного прогона рискуете увидеть счет на $500. Я проверял.