Amazon Nova Act: Визуальные агенты для QA. Автоматизация UI-тестов без селекторов | 2026 | AiManual
AiManual Logo Ai / Manual.
31 Мар 2026 Новости

Amazon Nova Act: как визуальные агенты меняют автоматизацию тестирования (QA)

AWS анонсировала Nova Act – сервис на базе ИИ, который автоматизирует тестирование интерфейсов через компьютерное зрение. Как это изменит работу QA-инженеров к

Вы только что обновили CSS-класс кнопки 'Отправить'. Ваши 150 UI-тестов падают. Команда тратит неделю на переписывание селекторов. Знакомо? Amazon говорит, что с Nova Act это останется в прошлом.

На AWS re:Invent 2025 компания тихо анонсировала предварительный доступ к Amazon Nova Act – сервису, который обещает убить хрупкую автоматизацию на селекторах. Вместо того чтобы искать элемент по XPath, агент Nova Act просто 'смотрит' на интерфейс и понимает, что перед ним кнопка, форма или выпадающий список. Звучит как магия, но к 31 марта 2026 года первые пилотные проекты уже показывают результаты, которые заставят пересмотреть все, что вы знали об автотестах.

Хрупкие селекторы и бесконечные переписывания: почему UI-автоматизация бесит

Традиционные фреймворки вроде Selenium или Cypress работают по принципу 'найди и кликни'. Они привязаны к структуре DOM – к ID, классам, атрибутам. Один рефакторинг фронтенда – и ваша тестовая палатка рушится. Поддержка таких тестов съедает до 40% времени QA-инженеров. Это не автоматизация, а налог на изменения.

Ирония в том, что AI-агенты генерируют код быстрее, чем команды успевают писать тесты. Разрыв между разработкой и обеспечением качества растет лавинообразно.

Nova Act: когда интерфейс 'видит' сам себя

Вместо парсинга HTML Nova Act использует каплю компьютерного зрения и большую порцию LLM. Сервис разворачивает визуального агента, который в реальном времени анализирует скриншоты или видеострим интерфейса. Агент построен на базе обновленной платформы Amazon Bedrock и использует специализированную модель Amazon Titan Visual Agent v2, дообученную на миллионах скриншотов UI-компонентов.

Как это выглядит на практике? Вы даете агенту сценарий на естественном языке: 'Зарегистрируй нового пользователя через форму на главной'. Агент открывает браузер, анализирует экран, находит поля 'Имя', 'Email', 'Пароль', вводит данные и нажимает кнопку 'Создать аккаунт'. Все без единого селектора.

💡
Под капотом агент использует технику Visual Grounding – он сопоставляет текстовые инструкции с визуальными элементами. Модель понимает не только примитивы ('кнопка'), но и семантику ('основная кнопка призыва к действию в шапке').

Что ломается первым? Ограничения визуальных агентов в 2026

Технология не идеальна. Ранние тестировщики Nova Act отмечают три больные точки.

  • Скорость. Анализ скриншотов и принятие решений занимают в 2-3 раза больше времени, чем прямой вызов DOM API. Для больших регрессионных прогонов это может быть критично.
  • Динамический контент. Бегущие строки, сложные анимации, кастомные canvas-элементы сбивают агента с толку. Он может 'не увидеть' элемент, который явно присутствует на экране.
  • Стоимость. Использование тяжелых мультимодальных моделей на Bedrock стоит дороже, чем запуск облачного Selenium Grid. Для стартапов это может быть барьером.

Но главный страх – 'черный ящик'. Когда тест падает, непонятно почему. Это баг в приложении или агент ошибся? Amazon решает это через детальные логи с аннотациями скриншотов, где модель объясняет свое решение. Пока что эти объяснения требуют проверки человеком.

Симбиоз, а не замена: куда движется профессия

Nova Act не убьет профессию тестировщика. Он ее трансформирует. Вместо написания скриптов инженер будет проектировать сценарии высокого уровня, обучать агентов распознавать специфичные для продукта элементы и анализировать их логи. Это требует другого навыка – Agent Engineering.

Курс Ручное тестирование (Manual QA) по-прежнему важен, потому что именно человек учит агента, что правильно, а что нет. Но будущее за гибридными специалистами.

Интересно, что Nova Act идеально ложится в фреймворк оценки агентов от Amazon, о котором мы писали ранее. Главная метрика для визуального агента – не точность распознавания элементов (хотя и она важна), а Task Success Rate (TSR). Выполнил ли он сквозную бизнес-задачу от начала до конца?

Прогноз: что будет через год?

К концу 2026 года визуальные агенты станут стандартным инструментом для smoke- и регрессионного тестирования больших веб-приложений с относительно стабильным дизайном. Они не заменят всю автоматизацию, но съедят значительную часть рутины.

Главный бенефициар – команды, которые уже используют мультиагентные системы для генерации тест-кейсов. Nova Act станет для них естественным исполнительным звеном.

Стоит ли сейчас бросаться изучать Nova Act? Если вы лид QA в крупном продукте – да, запросите ранний доступ. Если вы начинающий инженер, основательно освойте классическую автоматизацию, например, через Профессию Инженер по автоматизации тестирования. Потому что понимать, что автоматизировать и как проверить результат, всегда будет важнее, чем знать последний фреймворк.

А самый большой вызов для Amazon – заставить Nova Act работать не только в идеальных условиях своих демо-сред, а в хаосе реальных продуктов. Именно об этой проблеме кричит бенчмарк ABC-Bench. Если они справятся, это будет не эволюция, а революция. Тихая, но с далеко идущими последствиями.

Подписаться на канал