24 рабочих примера агентов на CUGA от IBM: обзор и код | AiManual
AiManual Logo Ai / Manual.
23 Июн 2026 Инструмент

Создаём агентные приложения с CUGA: обзор 24 рабочих примеров на лёгком каркасе от IBM

Обзор 24 готовых примеров агентных приложений на CUGA — легком каркасе от IBM. pip install cuga, архитектура, сравнение с LangChain, советы разработчикам.

Реклама
cliv2

Сколько раз вы начинали писать AI-агента, а заканчивали тем, что тонули в инфраструктурном коде? Маршрутизация запросов, обработка ошибок, конфигурация инструментов, управление состоянием. Знакомо. А теперь представьте, что кто-то уже упаковал всё это в 24 готовых скрипта, которые можно запустить одной командой. Добро пожаловать в мир CUGA.

IBM открыла исходники CUGA (Configurable Universal Grounding Agent) ещё в январе 2026, но только сейчас — к лету — сообщество накопило коллекцию из 24 реальных рабочих примеров. Это не игрушечные демки с разными цветами кнопок, а полноценные сценарии: от мониторинга цен на авиабилеты до автоматизации HR-онбординга. И да, всё это ставится через pip install cuga.

Кстати, если вы ещё не видели, как CUGA выглядит в деле на Hugging Face Spaces, советую заглянуть в наш обзор CUGA: конфигурируемый агент для веб и API задач. Там же и демо.

24 примера — не маркетинг, а реальность

В официальном репозитории CUGA на GitHub разложены по папкам 24 независимых сценария. Каждый — законченное приложение с README, конфигом и кодом. Они покрывают четыре больших домена:

  • Веб-автоматизация — скрапинг, заполнение форм, мониторинг изменений на сайтах;
  • API-интеграции — вызов REST, GraphQL, SOAP с обработкой ошибок;
  • Тестирование — генерация тестовых сценариев, регресс-чеки, сравнение скриншотов;
  • Бизнес-логика — агенты для онбординга, расчёта KPI, генерации отчётов.

Взглянем на три самых ярких.

1 Мониторинг цен на авиабилеты

Агент каждые 30 минут проверяет страницу поиска Skyscanner, извлекает цены и сравнивает с порогом. Если цена упала — шлёт уведомление в Telegram. Реализация — 120 строк Python.

from cuga import CugaAgent, CugaConfig

config = CugaConfig(
    planner="gpt-4o",
    executor="local/qwen2.5-7b",
    actions=["fetch_url", "parse_html", "compare_values", "send_telegram"]
)
agent = CugaAgent(config)
await agent.run()  # и понеслась

Сравните с тем, что пришлось бы писать на голом LangChain — примерно 400 строк связующего кода. Здесь же каркас берёт на себя управление контекстом, повторные попытки и логирование.

2 Автоматизация HR-онбординга

При заведении нового сотрудника в ATS агент создаёт аккаунты в Slack, Jira, GitLab, высылает welcome-письмо и назначает задачи наставнику. Всё через REST API — CUGA строит DAG вызовов и выполняет с ретраями.

from cuga import Pipeline

pipeline = Pipeline.from_yaml("onboarding_workflow.yaml")
result = pipeline.execute({"employee_name": "Иван", "position": "ML Engineer"})

YAML-файл описывает граф действий, а CUGA заботится о параллелизации и обработке ошибок. Если Jira упала — агент трижды повторит вызов, а потом запишет инцидент в лог и продолжит.

3 Генератор тестов для UI

Агент открывает staging-ссылку, делает скриншот, описывает элементы, генерирует Playwright-тесты и запускает их. Всё одной командой. Код — 80 строк.

from cuga import TestGenerator
gen = TestGenerator(model="gpt-4o")
tests = gen.create_from_url("https://staging.example.com")
# tests — список готовых Pytest-функций

Этот пример особенно полезен на фоне статей про автоматизацию тестирования смартфона — подход тот же, только CUGA делает это без танцев с бубном.

А что под капотом? (спойлер: меньше кода, чем вы думаете)

Архитектура CUGA — классический planner-executor, но с твистом. Планировщик не просто строит последовательность шагов, а учитывает историю ошибок и может перепланировать на лету. Исполнитель умеет вызывать инструменты (fetch, parse, API-call, send_message) и контролировать их выполнение.

Главная фишка — конфигурируемость. Вы не пишете код под каждый сценарий, а описываете поведение в YAML или Python-словаре. Это резко снижает порог входа. Хотите добавить новый инструмент? Регистрируете функцию-обработчик и указываете её в конфиге.

Звучит как очередной фреймворк? Нет, CUGA — именно каркас: он даёт скелет, а мясо вы наращиваете сами. Никакого vendor lock-in, внутри можно менять даже планировщик.

Сравнение с альтернативами: цифры и нервы

Инструмент Строк кода (типовой агент) Обучение команды Производительность (AppWorld)
CUGA ~120 1 день 82.1%
LangChain ~400 2-3 дня 65%
AutoGPT ~300 3 дня 45%
Скрипты + LLM ~600 1 неделя 30% (рукописная логика)

LangChain мощный, но напоминает швейцарский нож, у которого вы используете только одно лезвие, а остальные мешают. AutoGPT креативен, но для продакшена слишком непредсказуем. CUGA — золотая середина: достаточно абстракции, чтобы не писать велосипеды, и достаточно контроля, чтобы не ловить black box.

Кстати, если вы фанат локальных LLM, присмотритесь к статье Лёгкие coding-агенты для локальных LLM — CUGA дружит с Qwen 2.5, Llama 3 и другими open-source моделями.

Кому реально пригодится (кроме энтузиастов)

  • DevOps-инженеры, уставшие писать скрипты для мониторинга и деплоя. 24 примера — 24 готовых пайплайна.
  • QA-автоматизаторы, которым надоело вручную править селекторы. CUGA сам генерирует тесты по скриншоту.
  • Продуктовые разработчики, интегрирующие AI-функции — CUGA можно обернуть в FastAPI за 10 минут. Пример из статьи Cursor 3.0 и agent-first подход показывает схожий паттерн.
  • Исследователи, которым нужен быстрый прототип агента для экспериментов. Всё ставится за 5 минут.

Особый респект — CUGA отлично работает с локальными моделями на Mac M3. Никакого облака, конфиденциальность данных соблюдена.

💡
Неочевидный совет: начните не с чистого листа, а с одного из 24 примеров — скопируйте папку, измените YAML-конфиг и запустите. Так вы поймёте логику фреймворка за 15 минут, а не за 2 дня чтения доки.

Где брать?

Весь код открыт на GitHub IBM, а также доступен на Hugging Face Spaces. Установка — классический pip install cuga. Никаких проприетарных зависимостей, только open-source.

Если вы всё ещё сомневаетесь — прочитайте нашу статью CUGA от IBM: агент, который не просто кликает, а думает. Там разобрана архитектура и цифры на бенчмарках. Или гляньте, как агентные паттерны применяются в других продуктах — четыре мира, один принцип.

Лично я после месяца работы с CUGA перестал писать агентов с нуля. И вам советую попробовать. Хотя бы ради того, чтобы посмотреть на 24 строки import cuga и понять: да, можно проще.

Подписаться на канал