Наконец-то: Agent Builder стал полноценным продуктом
Помните тот момент, когда вы в сотый раз настраивали цепочки промптов для очередного агента? Когда каждая новая задача требовала переписывать половину кода? Когда интеграция с новым API превращалась в многочасовой квест?
Забудьте.
30 января 2026 года LangSmith объявил о выходе Agent Builder из бета-версии. Это не просто "обновление". Это смена парадигмы. Теперь создать рабочего агента можно буквально за минуты, просто описав словами, что он должен делать.
Важное уточнение: Agent Builder в GA версии получил полностью переработанную систему планирования задач. Если в бете агенты иногда "зацикливались" на простых задачах, то теперь они используют улучшенный алгоритм разбиения на суб-задачи с автоматической проверкой корректности выполнения.
Что изменилось с выходом из беты?
То, что раньше называлось "бета", было скорее техническим демо. Сейчас перед нами полноценный инструмент для продакшена. Вот ключевые изменения:
| Функция | Бета (2025) | GA (январь 2026) |
|---|---|---|
| Модели планирования | GPT-4o-mini, Claude 3.5 Sonnet | GPT-4o-2026, Claude 3.7 Haiku, Gemini 3.0 Pro |
| Автоматический подбор инструментов | Ограниченный набор | Интеллектуальный анализ доступных API + рекомендации |
| Обработка ошибок | Базовые ретраи | Многоуровневая система восстановления |
| Интеграция с LangSmith | Отдельный интерфейс | Полная интеграция в пайплайн мониторинга |
Самое важное изменение — появилась функция "Natural Language Agent Creation". Раньше нужно было собирать агента из кусочков: выбирать модели, настраивать промпты, подключать инструменты. Теперь достаточно написать: "Создай агента, который анализирует новости о технологических компаниях и отправляет дайджест в Slack каждый день в 9 утра".
Система сама:
- Подберет оптимальную модель для задачи (для новостей — Gemini 3.0 Pro с расширенным контекстом)
- Настроит цепочку промптов с учетом временных интервалов
- Предложит подключить RSS-агрегатор и Slack Webhook
- Сгенерирует код для планировщика задач
Как это работает на практике: создаем агента за 3 шага
1 Описываем задачу человеческим языком
Открываем Agent Builder в LangSmith. Видим поле "Опишите, что должен делать агент". Пишем максимально подробно:
Мне нужен агент для технической поддержки. Он должен:
1. Читать тикеты из Jira Service Management
2. Анализировать описание проблемы
3. Искать похожие решения в базе знаний Confluence
4. Предлагать варианты решения
5. Если проблема сложная — эскалировать к конкретному инженеру
6. Отвечать пользователю в Slack
2 Проверяем и корректируем предложенный план
Система анализирует описание и генерирует план агента. Выглядит это примерно так:
Внимание: система иногда "переоптимизирует". Например, может предложить использовать сложную цепочку суб-агентов там, где достаточно одного. Всегда проверяйте план перед подтверждением.
Что видим в плане:
- Jira Reader Agent — читает новые тикеты каждые 5 минут
- Problem Analyzer — классифицирует проблему (баг, вопрос, запрос функции)
- Confluence Search Agent — ищет решения в базе знаний
- Solution Generator — генерирует ответ на основе найденного
- Escalation Manager — определяет, нужна ли эскалация
- Slack Responder — отправляет ответ пользователю
Здесь можно отредактировать: удалить лишние шаги, изменить интервалы, выбрать другую модель для конкретного суб-агента.
3 Настраиваем интеграции и запускаем
Agent Builder показывает список необходимых интеграций:
- Jira Service Management API (OAuth 2.0)
- Confluence REST API
- Slack Bot Token
- База сотрудников для эскалации (CSV или API HR-системы)
Для каждой интеграции есть пошаговая инструкция. Для популярных сервисов вроде Jira и Slack — готовые формы с полями для токенов. Для кастомных API — генератор кода на основе OpenAPI-спецификации.
После настройки нажимаем "Create Agent". Система генерирует весь необходимый код, разворачивает агента в вашем LangSmith проекте и показывает дашборд мониторинга.
Новые фичи GA релиза, о которых мало кто знает
Автоматический промпт-инжиниринг
Раньше приходилось вручную писать промпты для каждого суб-агента. Теперь система анализирует задачу и генерирует оптимизированные промпты. Более того — она постоянно их улучшает на основе обратной связи.
Пример: для агента анализа новостей система может сгенерировать такой промпт для суммаризации:
Ты — аналитик новостей. Твоя задача:
1. Выдели 3 ключевых факта из статьи
2. Определи тональность (позитивная/негативная/нейтральная)
3. Оцени влияние на акции компании (высокое/среднее/низкое)
4. Суммаризируй в 2-3 предложениях
Статья: {article_text}
Формат ответа JSON:
{
"key_facts": ["...", "...", "..."],
"sentiment": "...",
"impact": "...",
"summary": "..."
}
Интеллектуальный подбор инструментов
Система теперь понимает семантику инструментов. Если вы говорите "нужен поиск в интернете", она предложит не просто Google Search API, а конкретную реализацию с фильтрацией по доменам, языку и дате.
Еще круче: если в описании задачи есть "работа с PDF" или "анализ таблиц", система автоматически подключит соответствующие парсеры и библиотеки.
Динамическое масштабирование суб-агентов
В бета-версии количество суб-агентов было фиксированным. Теперь система может создавать их динамически в зависимости от сложности задачи.
Пример: агент для анализа отзыва клиента. Если отзыв короткий — один суб-агент. Если длинный с множеством аспектов — система создает отдельного суб-агента для анализа каждого аспекта (цена, качество, сервис, доставка).
Типичные ошибки (и как их избежать)
Ошибка 1: Слишком общее описание задачи.
Плохо: "Агент для работы с документами"
Хорошо: "Агент, который читает PDF-документы из папки Google Drive, извлекает таблицы с финансовыми данными, конвертирует их в Excel и отправляет на почту бухгалтерии каждый понедельник"
Ошибка 2: Игнорирование проверки плана.
Система иногда предлагает избыточную архитектуру. Особенно для простых задач. Всегда смотрите на количество суб-агентов — для большинства задач достаточно 2-3.
Ошибка 3: Неправильные настройки частоты опроса.
Если ваш агент читает почту каждую минуту — вы быстро исчерпаете лимиты API. Настраивайте разумные интервалы: для почты — 5-15 минут, для тикетов — 1-5 минут, для аналитических отчетов — раз в день.
Реальные примеры из практики
Пример 1: Агент для HR-отдела
Задача: "Создай агента, который анализирует резюме кандидатов, сравнивает с требованиями вакансий, задает уточняющие вопросы по email и составляет краткое досье"
Что сгенерировал Agent Builder:
- PDF парсер для резюме (подключил библиотеку PyPDF2)
- Векторный поиск по базе требований вакансий
- Генератор персонализированных email с вопросами
- Суб-агент для составления досье с оценкой по 10-балльной шкале
- Интеграцию с Greenhouse (HR-система)
Пример 2: Агент мониторинга инцидентов
Задача: "Агент, который следит за логами приложения в Datadog, обнаруживает аномалии, определяет критичность и создает инциденты в PagerDuty с автоматическим назначением ответственного"
Здесь система использовала готовый шаблон Incident Manager и донастроила его под конкретные метрики приложения.
Как проверить, что агент работает правильно?
LangSmith предоставляет полный стек мониторинга:
- Трассировка выполнения — видите каждый шаг агента, промпты, ответы моделей
- Метрики качества — точность, время ответа, стоимость вызовов
- Автоматическое тестирование — система генерирует тест-кейсы на основе описания задачи
- A/B тестирование моделей — можно сравнить, какая модель лучше справляется с задачей
Особенно полезно смотреть на трассировки в первые дни работы агента. Часто обнаруживаются неочевидные проблемы: например, агент слишком часто вызывает дорогую модель или зацикливается на определенном шаге.
Что делать, когда агент "тупит"?
Да, такое бывает даже с автоматически созданными агентами. Вот алгоритм действий:
- Проверьте трассировку — на каком шаге возникает проблема?
- Упростите задачу — разбейте на более мелкие подзадачи
- Замените модель — иногда GPT-4o справляется лучше, чем Claude
- Добавьте примеры — система позволяет добавить few-shot примеры прямо в интерфейсе
- Используйте Agent Skills — предварительно обученные навыки для конкретных задач
Если агент постоянно ошибается в одном и том же месте — это повод пересмотреть архитектуру. Возможно, нужно выделить отдельный суб-агент для этой подзадачи или использовать специализированную модель.
Стоимость и лимиты
Agent Builder доступен во всех платных тарифах LangSmith. На стартовом тарифе ($99/месяц) можно создавать до 10 агентов с ограничением 1000 вызовов в месяц на агента.
Важный момент: стоимость складывается из:
- Стоимости вызовов моделей (GPT-4, Claude и т.д.)
- Стоимости хранения трассировок в LangSmith
- Стоимости вызовов внешних API (если используются)
Для тестирования можно использовать более дешевые модели (GPT-4o-mini вместо GPT-4o), а потом переключиться на более качественные.
Что дальше? Будущее Agent Builder
По слухам, команда LangSmith уже работает над:
- Мультимодальными агентами — работа с изображениями, видео, аудио
- Автоматической оптимизацией стоимости — система будет сама выбирать самые дешевые модели, которые справляются с задачей
- Генерацией документации — автоматическое создание документации по работе агента
- Интеграцией с локальными моделями — возможность использовать локальные модели вроде AgentCPM для конфиденциальных данных
Но самое интересное — обещают функцию "обучения агентов на лету". Агент будет анализировать свои ошибки, корректировать промпты и даже предлагать изменения архитектуры.
Пока этого нет, можно использовать старый добрый подход с суб-агентами и ручной настройкой. Но скоро, возможно, и это станет ненужным.
Совет на будущее: начните с простых агентов. Создайте что-то вроде "анализатора RSS-лент" или "отвечателя на частые вопросы". Поймите, как работает система, какие настройки влияют на качество. И только потом беритесь за сложные бизнес-процессы.
Правда в том, что Agent Builder не заменит опытного инженера по машинному обучению. Сложные агенты с кастомной логикой все равно придется писать вручную. Но он избавит от рутины — настройки промптов, подключения API, мониторинга.
Попробуйте создать своего первого агента сегодня. Даже если вы никогда не писали код для AI. Просто опишите задачу словами — и посмотрите, что получится. Иногда результат удивляет даже опытных разработчиков.