Банк, который решил, что люди слишком дороги для ответов на "Как сбросить PIN?"
Голландский необанк bunq обнародовал цифры, которые заставят почесать затылок любого руководителя кол-центра. С января 2024 года их ИИ-агент на Amazon Bedrock обработал 12.8 миллионов запросов. Из них 97% были решены полностью автономно, без передачи живому агенту. Среднее время ответа - 2.3 секунды. Стоимость обработки одного тикета упала на 91%.
Это не чат-бот на правилах. Это полноценный агентный ИИ, который умеет не только отвечать, но и действовать: проверять статус переводов, блокировать карты, объяснять комиссии на примере реальных транзакций пользователя.
Ключевая метрика - не просто "процент автоматизации", а First Contact Resolution Rate (FCRR) - процент вопросов, решенных при первом обращении. У bunq он составил 94.7%. Для сравнения, средний показатель по индустрии - около 70-75% с участием человека.
Архитектура: агент, который не просто болтает, а лезет в системы
В bunq отказались от идеи единого монолитного промпта. Вместо этого построили систему из специализированных агентов на платформе Amazon Bedrock AgentCore, релиз которой в конце 2024 года как раз и позволил реализовать эту архитектуру.
1 Диспетчер, который понимает намерение
Первым делом запрос попадает к диспетчеру - легкой модели Anthropic Claude 3.5 Sonnet (последняя стабильная версия на январь 2026). Его задача одна: понять, что хочет пользователь, и передать запрос нужному специализированному агенту. Не генерировать ответ. Не вести диалог. Только классифицировать.
"Это было самое сложное, - признается технический директор bunq. - Заставить модель НЕ пытаться помочь, а просто маршрутизировать. Мы потратили месяцы на промпт-инжиниринг, пока не добились точности в 99.2%".
2 Специализированные агенты с доступом к API
После диспетчера запрос идет к одному из 14 специализированных агентов. Вот некоторые из них:
- Агент транзакций - имеет доступ к read-only API банковской системы. Может показать историю операций, объяснить конкретный платеж, проверить статус перевода.
- Агент безопасности - умеет блокировать карты, менять лимиты, объяснять правила безопасности. Для действий, меняющих состояние, требует подтверждения по push-уведомлению в приложении.
- Агент тарифов - знает все тарифные планы, скрытые условия, промо-акции. Может спрогнозировать, сколько пользователь заплатит в следующем месяце.
- Агент документации - ищет в базе знаний (векторизованные PDF с условиями обслуживания, FAQ, гайдами). Особенность: умеет цитировать конкретные пункты договора.
Каждый агент работает на своей комбинации моделей Bedrock. Для простых фактологических запросов - Amazon Titan Text G1 Express (дешево и быстро). Для сложных аналитических вопросов - Claude 3.5 Sonnet или даже Claude 3.7 Haiku для баланса между скоростью и качеством.
Главный секрет: как заставить ИИ не врать о балансе на счете
Самая страшная ночь для любого банка - ИИ-агент начнет галлюцинировать цифры. "Наш баланс - $1,000,000", "Ваша карта не заблокирована" (хотя только что заблокирована), "Комиссия за перевод - 0%" (на самом деле 1.5%).
bunq решил проблему радикально: никаких цифр из контекста промпта. Все числовые данные - только через API. Агент транзакций не "помнит", что у клиента обычно переводы по $100. Он каждый раз запрашивает API и получает актуальную выписку.
Архитектура доступа к данным:
| Тип данных | Источник | Частота обновления | Пример запроса |
|---|---|---|---|
| Баланс, транзакции | Core Banking API (реальное время) | По каждому запросу | GET /accounts/{id}/balance |
| Тарифы, условия | Product Catalog API | Раз в сутки | GET /tariffs/{code}/details |
| Базовые знания о банке | Векторная база знаний (Pinecone) | Раз в неделю | Semantic search по документам |
"Мы запретили агентам что-либо 'знать' о клиенте, - объясняет архитектор системы. - Они могут знать, что bunq работает в 30 странах. Но не могут 'помнить', что у пользователя из Амстердама тариф 'Premium'. Это они должны запросить через API. Каждый раз."
3% провалов: что не смог ИИ и почему это нормально
Тот самый неудачный процент в 3% - около 384,000 запросов за год - оказался золотой жилой для улучшения системы. bunq анализирует каждый провал. Категории самые предсказуемые:
- Юридические споры (45%) - "Почему вы заблокировали мой аккаунт?", "Требую компенсацию за овердрафт". ИИ распознает эмоциональную нагрузку и сразу передает человеку.
- Технические проблемы с приложением (30%) - "Не могу войти", "Не загружается страница перевода". Требует диагностики, которую ИИ пока не умеет.
- Сложные финансовые консультации (15%) - "Какой тариф лучше для моей ситуации: я получаю доход в евро, но трачу в долларах и иногда в фунтах?".
- Ошибки самой системы ИИ (10%) - "Я спросил про комиссию за перевод в Турцию, а вы ответили про Польшу".
Интересный факт: bunq намеренно оставили порог передачи человеку очень низким. Если агент не уверен в ответе на 95% - передает живому оператору. "Лучше передать лишний раз, чем дать неправильный ответ о деньгах", - говорят в банке.
Что случилось с живыми операторами? Их всех уволили?
Вопреки ожиданиям, массовых увольнений не было. Вместо этого bunq переучил 80% сотрудников поддержки. Теперь они занимаются:
- Обучением ИИ - размечают сложные кейсы, пишут промпты для новых сценариев. Зарплата выросла на 40% (теперь это senior AI trainers).
- Эскалациями - работают с теми самыми 3% сложных запросов.
- Контролем качества - выборочно проверяют диалоги ИИ, ставят оценки, корректируют поведение агентов.
"Мы превратили операторов из людей, которые отвечают на одни и те же вопросы, в инженеров, которые улучшают систему, - говорит HR-директор. - Сложность работы выросла, удовлетворенность сотрудников тоже."
Этот подход перекликается с трендом, который мы видели в материале про сокращения в банках. Но bunq показал альтернативу - не увольнять, а перепрофилировать.
Сколько это стоило и когда окупилось?
Цифры bunq не раскрывает полностью, но по нашим расчетам на основе публичных данных:
- Разработка: ~6 месяцев работы команды из 12 человек (архитекторы, ML-инженеры, промпт-инженеры)
- Инфраструктура: Amazon Bedrock AgentCore, Pinecone для векторного поиска, кастомные API-шлюзы
- Модели: смесь Claude 3.5 Sonnet, Claude 3.7 Haiku и Amazon Titan в зависимости от задачи
- Окупаемость: по заявлениям bunq, инвестиции отбились за 4 месяца за счет сокращения затрат на поддержку
Главная экономия - не в зарплатах операторов (их почти не сократили), а в масштабируемости. Обработать дополнительные 5 миллионов запросов в год теперь стоит копейки - нужно просто добавить capacity в Bedrock.
А что с Vodafone и Fastweb? Они тоже так могут?
Интересно сравнить с другим громким кейсом - Vodafone и Fastweb. Телекомы добились 85% автоматизации, но их подход другой:
- Использовали LangGraph + LangSmith вместо нативного Bedrock AgentCore
- Сделали ставку на единого мощного агента, а не на специализированных
- Имеют более сложную продуктовую линейку (телефония, интернет, ТВ, мобильная связь)
bunq выиграл в простоте: банковские продукты проще телекомовых. Но проиграл в гибкости: их система заточена под конкретные сценарии. Добавить поддержку нового продукта (например, ипотеки) - нужно писать нового агента почти с нуля.
Что дальше? Агент, который не только отвечает, но и продает
Следующий этап в bunq - коммерческий ИИ. Агент, который:
- Анализирует поведение клиента (траты, доходы, цели)
- Предлагает подходящие продукты (накопительный счет с повышенным процентом, кредитную карту с кешбэком на АЗС)
- Оформляет продажу полностью в чате
"Мы уже тестируем прототип, - делится планами CEO bunq. - Клиент пишет 'Хочу накопить на отпуск'. ИИ анализирует его расходы, предлагает автоматическое округление транзакций с переводом разницы на накопительный счет, показывает прогноз, сколько накопится к дате отпуска. И все это в 5 сообщениях."
Риск очевиден: агрессивный апселлинг испортит пользовательский опыт. Но потенциальная выгода - увеличение average revenue per user (ARPU) на 15-20% - слишком заманчива.
Так стоит ли бежать внедрять агентный ИИ в своем банке?
Если вы руководитель финтех-компании и после этой статьи хотите завтра же запустить своего ИИ-агента - остановитесь. bunq смог, потому что:
- Имеет современную API-архитектуру (микросервисы, четкие контракты)
- Инвестировал в промпт-инжиниринг как отдельную компетенцию
- Не боялся переучить, а не уволить людей
- Начал с простых сценариев (справка о балансе), а не со сложных (юридические споры)
Главный урок от bunq: 97% автоматизации - это не про технологию. Это про готовность перестроить процессы вокруг ИИ. Про то, чтобы дать моделям доступ к реальным данным через API, а не кормить их устаревшими CSV. Про то, чтобы измерять не "нравится ли клиентам ИИ", а "решает ли ИИ их проблемы".
И да, это про готовность признать: иногда (в 3% случаев) ИИ все еще глупее человека. И это нормально. Пока.