Проблема, которая сводит с ума: 3 миллиона ложных срабатываний в день

Представьте: у вас 5 камер видеонаблюдения. Каждая "видит" движение. Каждое движение - уведомление. Дерево качается - уведомление. Кошка пробежала - уведомление. Тень от облака - уведомление. Теперь умножьте на 2.3 миллиона активных устройств Swann по всему миру. Получается цифра, от которой у любого инженера начнётся нервный тик: 3-5 миллионов уведомлений в день, из которых 94% - полная ерунда.

Усталость от уведомлений - это не просто раздражение пользователя. Это реальная угроза безопасности. Когда человек получает 50 ложных срабатываний подряд, он либо отключает все уведомления, либо перестаёт обращать внимание. В обоих случаях пропускает настоящее вторжение.

Традиционные методы фильтрации работали по принципу "если X, то Y". Если движение в зоне А - важное. Если в зоне Б - неважное. Проблема в том, что реальный мир не укладывается в простые правила. Тот же кот может быть важным (залез на стол с документами) или неважным (прошёл по траве). Ребёнок, играющий во дворе - норма. Незнакомец, заглядывающий через забор - тревога.

Генеративный AI как контекстный фильтр: почему Swann выбрал Bedrock

В 2024 году команда Swann начала эксперименты с локальными моделями. Пробовали всё: от fine-tuned BERT до специализированных компьютерного зрения. Результат? Либо слишком медленно (2-3 секунды на обработку), либо слишком дорого (представьте GPU ферму на миллионы запросов в час), либо слишком глупо (модель не понимала контекст).

Поворотный момент наступил в начале 2025, когда Amazon Bedrock представил Claude 4.5 с улучшенным пониманием контекста и сниженной задержкой. Swann увидел в этом три ключевых преимущества:

Мультимодальность из коробки: модель анализирует не только текст уведомления, но и снимок с камеры, временные метки, историю событий
Гибкая настройка через систему промптов: можно быстро менять логику фильтрации без переобучения моделей
Предсказуемая стоимость

💡

К февралю 2026 Claude 4.5 на Bedrock обрабатывает 128K токенов контекста с задержкой менее 400 мс на запрос. Для сравнения: предыдущая версия Claude 3.5 Sonnet давала 600-800 мс при том же объёме. Разница кажется небольшой, но при 5000 запросов в секунду это экономия 1000 часов процессорного времени в сутки.

Архитектура, которая не ломается под нагрузкой

Вот как выглядит конвейер обработки в 2026 году (упрощённо):

Компонент	Технология	Задача
IoT Gateway	AWS IoT Core	Приём событий с устройств, базовая валидация
Event Buffer	Amazon Kinesis Data Streams	Буферизация пиковых нагрузок (до 15K событий/сек)
Pre-filter	Lambda + простые правила	Отсев очевидного мусора (50% событий)
AI Processing	Bedrock + Claude 4.5	Контекстный анализ оставшихся событий
Result Router	Step Functions	Маршрутизация по важности: срочное/отложенное/игнор

Самое интересное происходит на этапе AI Processing. Swann использует технику, которую они называют "контекстным наслаиванием". Вместо того чтобы отправлять в модель голое событие "движение обнаружено", система собирает контекстный пакет:

{
  "current_event": {
    "type": "motion",
    "zone": "backyard",
    "confidence": 0.92,
    "image_url": "s3://...",
    "timestamp": "2026-02-11T14:30:00Z"
  },
  "recent_history": [
    {"type": "motion", "zone": "backyard", "time_ago_min": 5},
    {"type": "sound", "decibels": 45, "time_ago_min": 12}
  ],
  "user_context": {
    "location": "away",
    "schedule": "working_hours",
    "preferences": {"pets": true, "children": true}
  },
  "environment": {
    "weather": "sunny",
    "time_of_day": "afternoon",
    "day_of_week": "tuesday"
  }
}

1 Промпт-инженерия для реального мира

Промпт Swann - это не просто "проанализируй событие". Это многоуровневая инструкция с чёткими критериями. Вот как выглядит его ядро (упрощённо):

Ты - система фильтрации уведомлений для домашней безопасности.

АНАЛИЗИРУЙ:
1. Что именно произошло (объект, действие)
2. Контекст (время, погода, история)
3. Риск (шкала 1-10)
4. Срочность (требует немедленного внимания?)

КРИТЕРИИ ВАЖНОСТИ:
- ВЫСОКАЯ: незнакомые люди, подозрительное поведение, признаки взлома
- СРЕДНЯЯ: знакомые люди в необычное время, неопасные животные
- НИЗКАЯ: известные животные, погодные явления, тени

ВЕРНИ JSON:
{
  "importance": "high|medium|low",
  "reason": "краткое объяснение",
  "action": "notify_now|delay|ignore",
  "confidence": 0.0-1.0
}

Зачем такая структура? Потому что модель должна не просто классифицировать, но и объяснять решение. Когда пользователь видит "движение во дворе - низкая важность (ваша собака играет с мячом)", он доверяет системе. Когда видит "движение у задней двери - высокая важность (незнакомый человек пытается открыть дверь)", он действует.

Swann использует Amazon Bedrock Guardrails для предотвращения hallucinations. Модель не может "придумать" объекты, которых нет на изображении. Если на снимке только трава, а модель говорит "человек в камуфляже", Guardrails блокирует ответ как ненадёжный.

Числа, которые заставляют поверить в магию

К февралю 2026 система работает в production 14 месяцев. Вот что изменилось:

Уведомлений на пользователя: было 40-60 в день, стало 5-8
Точность определения важности: 94% против 67% у rule-based системы
Задержка обработки: 450 мс в среднем (p95 - 800 мс)
Стоимость на устройство: $0.12/месяц против $0.08 у старой системы
Отключение уведомлений пользователями: снизилось с 31% до 4%

Да, система дороже. На 50%. Но она в 12 раз реже беспокоит пользователя ерундой. И когда беспокоит - это действительно важно. Пользователи готовы платить эти $0.04 в месяц за спокойный сон.

Подводные камни, о которых не пишут в пресс-релизах

Первый запуск провалился. Катастрофически. Не из-за модели, а из-за архитектуры. Вот три ошибки, которые Swann совершил в начале:

Отсутствие fallback: когда Bedrock возвращал ошибку 429 (лимит запросов), события терялись. Решение: двухуровневая очередь с ретраями и downgrade на rule-based логику при сбоях.
Наивное кэширование: пытались кэшировать ответы модели по хэшу изображения. Оказалось, что одно и то же изображение может быть важным днём (ребёнок один дома) и неважным вечером (вся семья дома).
Игнорирование региональных особенностей: модель, обученная на американских данных, не понимала австралийских опоссумов (приняла за крыс) и европейских ёжиков (приняла за мышей). Пришлось дообучать на локальных данных.

Сейчас система использует глобальную инфраструктуру Bedrock с репликацией промптов и конфигураций. Когда основной регион (us-east-1) тормозит, трафик автоматически переключается на eu-west-1 или ap-southeast-2. Разница в задержке? 30-50 мс. Разница в качестве? Нулевая.

Что дальше? От фильтрации к предсказанию

Сейчас система отвечает на вопрос "что происходит?". Следующий шаг - отвечать на вопрос "что произойдёт?". Swann уже тестирует предиктивную аналитику:

Если в 14:00 обычно приходит почтальон, а сегодня в 14:30 кто-то подходит к дверям - это может быть важно
Если соседская собака лает 5 минут, а потом резко замолкает - возможно, произошло что-то странное
Если за последний час было 3 ложных срабатывания от ветра, а сейчас четвёртое - вероятно, тоже ветер

Для этого нужна более сложная архитектура с долгосрочной памятью. Swann экспериментирует с мультимодальным RAG, где вместо текстовых документов - исторические события с камер. Модель ищет паттерны: "в прошлый раз, когда так качались деревья, через 10 минут начался дождь".

💡

Ключевой инсайт: лучшая фильтрация - это не когда система молчит. Лучшая фильтрация - когда система говорит в нужный момент о нужных вещах. Генеративный AI здесь не замена правилам, а их эволюция. Правила говорят "если X, то Y". AI говорит "если X в контексте C, то Y с вероятностью P". Разница как между картой и GPS-навигатором.

Если вы строите похожую систему

Возьмите эти четыре принципа (Swann заплатил за них миллионами ложных срабатываний):

Начинайте с простого: не пытайтесь сразу анализировать всё. Выделите 3-5 самых частых ложных срабатываний и решите их в первую очередь.
Измеряйте качество, а не точность: 95% точности звучит хорошо. Но если 5% ошибок - это пропущенные ограбления, система бесполезна. Лучше 80% точности с нулём пропущенных угроз.
Проектируйте для отказа: AI сервисы ломаются. Правила устаревают. Архитектура должна деградировать gracefully, а не падать.
Добавляйте объяснения: пользователь простит ошибку, если поймёт логику. "Я подумал, что это ваш сын (похожая куртка), но это был незнакомец" - лучше чем "движение обнаружено".

Swann доказал: генеративный AI в IoT - не маркетинговая уловка. Это рабочий инструмент, который меняет фундаментальный принцип работы с уведомлениями. От reactive (реагируем на всё) к intelligent (реагируем на важное). От количества к качеству. От раздражения к доверию.

И самое ироничное? Чем лучше система фильтрует, тем меньше данных ей нужно для обучения. Потому что пользователи перестают её отключать.

Swann против уведомлений: как Amazon Bedrock превращает миллионы IoT-оповещений в осмысленные сигналы