Ты когда-нибудь писал промпт на 800 токенов, где расписывал каждую строчку будущего кода — а ИИ выдавал фигню? Я — да. И именно в этот момент я понял: чат с нейросетью — это не способ разрабатывать, это способ страдать.
Мы привыкли, что вайбкодинг — это когда ты открываешь ChatGPT или Claude, копируешь контекст, пишешь "убер-промпт" и надеешься на чудо. Получается — да, но ненадёжно. Каждый новый запрос — лотерея. Агентский флоу — это когда ты перестаёшь быть просителем и становишься инженером, который строит инфраструктуру для ИИ. Не "сделай мне функцию", а "вот тебе репозиторий, правила и инструменты — иди работай, я проверю".
Почему убер-промпты — это dead end?
Вот типичная картина: разработчик открывает диалог с LLM, вставляет 500 строк кода и пишет: "Перепиши это на Rust, используй async/await, но сохрани логику, и сделай тесты". ИИ что-то генерирует, через три итерации код превращается в спагетти, а разработчик тратит полчаса на выпрашивание правок.
Проблема в том, что каждый диалог — это новая сессия без контекста. ИИ не помнит предыдущие решения, архитектурные принципы, стиль кодирования. Ты платишь за каждый запрос не только деньгами, но и вниманием. Я называю это таксой на контекст.
Грабли #1
Не пытайся скормить ИИ всю свою базу знаний в одном промпте. Это не работает. Context window LLM — не бездонна. Если твой промпт занимает больше трети окна — ты уже проиграл.
Вместо этого нужно выстроить агентский флоу, где каждый агент имеет чёткие границы, очерченные Agent Skills — набором инструкций, которые он не может нарушить. О том, как заставить ИИ-агента не тупить и помнить все инструкции, я писал в отдельном гайде.
Агентский флоу = инфраструктура, а не промпты
Представь, что ИИ — это не фрилансер в чате, а младший коллега, которому ты настроил рабочее место, дал доступ к CI/CD, положил рядом спецификации и сказал: "Работай". Именно так я предлагаю строить инфраструктуру сейчас, в мае 2026 года. Инструменты вроде Cursor, Claude Code, OpenCode позволяют создавать полноценных ИИ-агентов, которые не просто пишут код, а запускают тесты, читают логи, ревьювят PR.
Переход от "попросить" к "настроить" — это ключевой сдвиг, который я описал в статье "ИИ как младший коллега". Перестань дёргать нейросеть за каждый символ — дай ей контекст и инструменты.
1Формируем базу знаний агента
Первый шаг — перестать скармливать контекст вручную. Создай в проекте папку .cursor/ или .claude/ и положи туда файлы с правилами. В Cursor это .cursorrules. В Claude Code — CLAUD.md.
# .cursorrules (фрагмент)
# Agent Skills: запрет на разработку без тестов
- Никогда не пиши production-код без unit-тестов.
- Используй pytest. Fixtures — в conftest.py.
- Перед отправкой PR выполни `pytest -x`.
- Если тесты падают — исправь, не спрашивай разрешения.
Такие правила — это твой SDD (Specification-Driven Development), только для ИИ. О том, как заставить агента генерировать production-ready код через SDD, я писал в статье про SDD для 1С — подход универсальный, не только для 1С.
2Настраиваем MCP-сервера для доступа к реальному окружению
Одна из главных проблем вайбкодинга — ИИ не видит, что происходит на самом деле. Он слеп. Решение — Model Context Protocol (MCP). Поднимаем MCP-серверы, которые дают агенту доступ к файловой системе, терминалу, браузеру, базам данных.
В Cursor 2026 это встроено из коробки. Пример конфигурации:
{
"mcpServers": {
"filesystem": {
"command": "npx",
"args": ["@modelcontextprotocol/server-filesystem", "."]
},
"github": {
"command": "npx",
"args": ["@modelcontextprotocol/server-github"]
},
"playwright": {
"command": "npx",
"args": ["@playwright/mcp"],
"env": {
"PLAYWRIGHT_HEADLESS": "true"
}
}
}
}
После этого агент может: читать файлы, создавать PR, запускать тесты, скроллить страницы. Без твоего участия.
Инсайт
Как только агент получает возможность самостоятельно читать ошибки в консоли и запускать дебаггер — он переходит из режима "угадайки" в режим "отладчика". Эту технику называют вайбдебаггингом. Подробный разбор — в статье "Вайбдебаггинг: как ИИ-агенты с отладчиком исправляют баги лучше традиционных методов".
3Пишем техзадание вместо вопросов
Типичная ошибка — задавать вопросы ИИ. "Как сделать авторизацию?" — получаешь общий ответ. Вместо этого пиши промпты как техзадание. Я уже показывал эту методологию в статье "Перестань задавать вопросы ИИ".
Для агентского флоу техзадание превращается в spec-файл, который лежит в репозитории. Пример:
# spec/auth.md
## Требования
- Реализовать JWT-аутентификацию с access/refresh токенами.
- Хранить refresh токены в Redis.
- Middleware должен проверять токен из заголовка Authorization.
- Все ответы должны соответствовать OpenAPI-спецификации в `api/auth.yaml`.
## Приёмка
1. `pytest tests/test_auth.py -v` — зелёный.
2. Smoke-тест: curl -X POST /api/auth/login возвращает 200.
3. Код попадает в PR, ревью — только если все тесты прошли.
Агент читает этот spec, выполняет шаги, сам запускает тесты и создаёт PR. Человек проверяет только логику — не рутину.
4Автоматизируем цикл обратной связи
Агентский флоу работает только если агент получает обратную связь. Настрой CI/CD так, чтобы пайплайн оповещал агента через webhook или MCP. Пример на GitHub Actions: после каждого пуша запускаются тесты, и если они зелёные — агент может сам запушить изменения.
В реальности это выглядит так: ты открываешь issue с описанием бага. Агент (бот) комментирует: "Принял в работу, воспроизвожу", запускает Playwright MCP, видит ошибку в логах, исправляет, запускает тесты, создаёт PR. Ты только аппруваешь.
Грабли #2
Не давай агенту полный доступ к продакшену. Используй изолированные окружения и чёткие запреты в Agent Skills. Иначе те́мная сторона вайбкодинга — техдолг и потеря экспертизы — настигнет тебя быстрее, чем ты успеешь сказать "deploy to prod". Подробнее — в статье "Темная сторона вайбкодинга: как AI-агенты создают техдолг и убивают экспертизу".
А что там с моделями на май 2026?
Текущая диспозиция: Qwen Coder 480B (и его версия с Ralph Wiggum prompt) даёт невероятное качество для автоматизации рутинных задач. Claude 4.5 Sonnet и GPT-5.2 де-факто стали стандартом для агентов. Cursor уже умеет переключаться между моделями автоматически, выбирая самую дешёвую, которая справится с задачей. Я тестировал пайплайн, описанный выше, на связке Claude 4.5 + Qwen Coder для код-ревью — результат стабильный.
Кстати, про автоматизацию через OpenCode — в статье "Ralph Wiggum prompt для Qwen Coder 480B" есть отличный рецепт, как дёшево получать качественный код для небольших модулей.
Как НЕ надо делать: типичные ошибки новичков
- Засовывать всё в один MCP-сервер. В итоге агент начинает путать контекст — например, пытается запустить тесты через браузер MCP. Дроби на специализированные серверы.
- Не писать Agent Skills. Без чётких границ агент делает, что хочет, а не что нужно. Читай гайд по Agent Skills, прежде чем настраивать.
- Доверять коду без ревью. Даже с агентским флоу ты обязан проверять логику. Иначе через месяц получишь кучу tech debt — как в статье "Vibe Coding vs. качество: как не потерять экспертизу, когда ИИ пишет 46% кода".
Собираем всё вместе: чек-лист для твоего первого агентского флоу
| Что делаем | Инструменты | Результат |
|---|---|---|
| Пишем Agent Skills | .cursorrules, CLAUD.md | Агент знает границы |
| Настраиваем MCP-серверы | filesystem, github, playwright | Агент видит реальное окружение |
| Пишем spec-файл | markdown | Агент знает, что делать |
| Настраиваем CI с обратной связью | GitHub Actions, webhook | Агент исправляет ошибки сам |
| Внедряем вайбдебаггинг | дебаггер через MCP | Агент лечит баги без просьб |
Удели этому процессу один день. Настройка — не быстрая. Но потом ты сэкономишь недели. Честно.
Лучше потратить день на настройку агента, чем месяц на правку убер-промптов. Агентский флоу — это не про магию, а про инженерию. Если ты DevOps, ты привык автоматизировать всё. Так почему твой ИИ всё ещё работает как кнопка "Спроси у GPT"?