Ты когда-нибудь писал промпт на 800 токенов, где расписывал каждую строчку будущего кода — а ИИ выдавал фигню? Я — да. И именно в этот момент я понял: чат с нейросетью — это не способ разрабатывать, это способ страдать.

Мы привыкли, что вайбкодинг — это когда ты открываешь ChatGPT или Claude, копируешь контекст, пишешь "убер-промпт" и надеешься на чудо. Получается — да, но ненадёжно. Каждый новый запрос — лотерея. Агентский флоу — это когда ты перестаёшь быть просителем и становишься инженером, который строит инфраструктуру для ИИ. Не "сделай мне функцию", а "вот тебе репозиторий, правила и инструменты — иди работай, я проверю".

💡

В этой статье я покажу, как собрать агентский пайплайн, который реально работает в production среде. Без воды, с кодом и граблями.

Почему убер-промпты — это dead end?

Вот типичная картина: разработчик открывает диалог с LLM, вставляет 500 строк кода и пишет: "Перепиши это на Rust, используй async/await, но сохрани логику, и сделай тесты". ИИ что-то генерирует, через три итерации код превращается в спагетти, а разработчик тратит полчаса на выпрашивание правок.

Проблема в том, что каждый диалог — это новая сессия без контекста. ИИ не помнит предыдущие решения, архитектурные принципы, стиль кодирования. Ты платишь за каждый запрос не только деньгами, но и вниманием. Я называю это таксой на контекст.

Грабли #1

Не пытайся скормить ИИ всю свою базу знаний в одном промпте. Это не работает. Context window LLM — не бездонна. Если твой промпт занимает больше трети окна — ты уже проиграл.

Вместо этого нужно выстроить агентский флоу, где каждый агент имеет чёткие границы, очерченные Agent Skills — набором инструкций, которые он не может нарушить. О том, как заставить ИИ-агента не тупить и помнить все инструкции, я писал в отдельном гайде.

Агентский флоу = инфраструктура, а не промпты

Представь, что ИИ — это не фрилансер в чате, а младший коллега, которому ты настроил рабочее место, дал доступ к CI/CD, положил рядом спецификации и сказал: "Работай". Именно так я предлагаю строить инфраструктуру сейчас, в мае 2026 года. Инструменты вроде Cursor, Claude Code, OpenCode позволяют создавать полноценных ИИ-агентов, которые не просто пишут код, а запускают тесты, читают логи, ревьювят PR.

Переход от "попросить" к "настроить" — это ключевой сдвиг, который я описал в статье "ИИ как младший коллега". Перестань дёргать нейросеть за каждый символ — дай ей контекст и инструменты.

1Формируем базу знаний агента

Первый шаг — перестать скармливать контекст вручную. Создай в проекте папку .cursor/ или .claude/ и положи туда файлы с правилами. В Cursor это .cursorrules. В Claude Code — CLAUD.md.

# .cursorrules (фрагмент)
# Agent Skills: запрет на разработку без тестов
- Никогда не пиши production-код без unit-тестов.
- Используй pytest. Fixtures — в conftest.py.
- Перед отправкой PR выполни `pytest -x`.
- Если тесты падают — исправь, не спрашивай разрешения.

Такие правила — это твой SDD (Specification-Driven Development), только для ИИ. О том, как заставить агента генерировать production-ready код через SDD, я писал в статье про SDD для 1С — подход универсальный, не только для 1С.

2Настраиваем MCP-сервера для доступа к реальному окружению

Одна из главных проблем вайбкодинга — ИИ не видит, что происходит на самом деле. Он слеп. Решение — Model Context Protocol (MCP). Поднимаем MCP-серверы, которые дают агенту доступ к файловой системе, терминалу, браузеру, базам данных.

В Cursor 2026 это встроено из коробки. Пример конфигурации:

{
  "mcpServers": {
    "filesystem": {
      "command": "npx",
      "args": ["@modelcontextprotocol/server-filesystem", "."]
    },
    "github": {
      "command": "npx",
      "args": ["@modelcontextprotocol/server-github"]
    },
    "playwright": {
      "command": "npx",
      "args": ["@playwright/mcp"],
      "env": {
        "PLAYWRIGHT_HEADLESS": "true"
      }
    }
  }
}

После этого агент может: читать файлы, создавать PR, запускать тесты, скроллить страницы. Без твоего участия.

Инсайт

Как только агент получает возможность самостоятельно читать ошибки в консоли и запускать дебаггер — он переходит из режима "угадайки" в режим "отладчика". Эту технику называют вайбдебаггингом. Подробный разбор — в статье "Вайбдебаггинг: как ИИ-агенты с отладчиком исправляют баги лучше традиционных методов".

3Пишем техзадание вместо вопросов

Типичная ошибка — задавать вопросы ИИ. "Как сделать авторизацию?" — получаешь общий ответ. Вместо этого пиши промпты как техзадание. Я уже показывал эту методологию в статье "Перестань задавать вопросы ИИ".

Для агентского флоу техзадание превращается в spec-файл, который лежит в репозитории. Пример:

# spec/auth.md
## Требования
- Реализовать JWT-аутентификацию с access/refresh токенами.
- Хранить refresh токены в Redis.
- Middleware должен проверять токен из заголовка Authorization.
- Все ответы должны соответствовать OpenAPI-спецификации в `api/auth.yaml`.

## Приёмка
1. `pytest tests/test_auth.py -v` — зелёный.
2. Smoke-тест: curl -X POST /api/auth/login возвращает 200.
3. Код попадает в PR, ревью — только если все тесты прошли.

Агент читает этот spec, выполняет шаги, сам запускает тесты и создаёт PR. Человек проверяет только логику — не рутину.

4Автоматизируем цикл обратной связи

Агентский флоу работает только если агент получает обратную связь. Настрой CI/CD так, чтобы пайплайн оповещал агента через webhook или MCP. Пример на GitHub Actions: после каждого пуша запускаются тесты, и если они зелёные — агент может сам запушить изменения.

В реальности это выглядит так: ты открываешь issue с описанием бага. Агент (бот) комментирует: "Принял в работу, воспроизвожу", запускает Playwright MCP, видит ошибку в логах, исправляет, запускает тесты, создаёт PR. Ты только аппруваешь.

Грабли #2

Не давай агенту полный доступ к продакшену. Используй изолированные окружения и чёткие запреты в Agent Skills. Иначе те́мная сторона вайбкодинга — техдолг и потеря экспертизы — настигнет тебя быстрее, чем ты успеешь сказать "deploy to prod". Подробнее — в статье "Темная сторона вайбкодинга: как AI-агенты создают техдолг и убивают экспертизу".

А что там с моделями на май 2026?

Текущая диспозиция: Qwen Coder 480B (и его версия с Ralph Wiggum prompt) даёт невероятное качество для автоматизации рутинных задач. Claude 4.5 Sonnet и GPT-5.2 де-факто стали стандартом для агентов. Cursor уже умеет переключаться между моделями автоматически, выбирая самую дешёвую, которая справится с задачей. Я тестировал пайплайн, описанный выше, на связке Claude 4.5 + Qwen Coder для код-ревью — результат стабильный.

Кстати, про автоматизацию через OpenCode — в статье "Ralph Wiggum prompt для Qwen Coder 480B" есть отличный рецепт, как дёшево получать качественный код для небольших модулей.

Как НЕ надо делать: типичные ошибки новичков

Засовывать всё в один MCP-сервер. В итоге агент начинает путать контекст — например, пытается запустить тесты через браузер MCP. Дроби на специализированные серверы.
Не писать Agent Skills. Без чётких границ агент делает, что хочет, а не что нужно. Читай гайд по Agent Skills, прежде чем настраивать.
Доверять коду без ревью. Даже с агентским флоу ты обязан проверять логику. Иначе через месяц получишь кучу tech debt — как в статье "Vibe Coding vs. качество: как не потерять экспертизу, когда ИИ пишет 46% кода".

Собираем всё вместе: чек-лист для твоего первого агентского флоу

Что делаем	Инструменты	Результат
Пишем Agent Skills	.cursorrules, CLAUD.md	Агент знает границы
Настраиваем MCP-серверы	filesystem, github, playwright	Агент видит реальное окружение
Пишем spec-файл	markdown	Агент знает, что делать
Настраиваем CI с обратной связью	GitHub Actions, webhook	Агент исправляет ошибки сам
Внедряем вайбдебаггинг	дебаггер через MCP	Агент лечит баги без просьб

Удели этому процессу один день. Настройка — не быстрая. Но потом ты сэкономишь недели. Честно.

Лучше потратить день на настройку агента, чем месяц на правку убер-промптов. Агентский флоу — это не про магию, а про инженерию. Если ты DevOps, ты привык автоматизировать всё. Так почему твой ИИ всё ещё работает как кнопка "Спроси у GPT"?

Подписаться на канал

От вайбкодинга к агентскому флоу: как перестать писать убер-промпты и начать формировать инфраструктуру для работы с ИИ