Публикация AiManual

Кейлоггинг, скриншоты, слежка: как Meta собирает данные сотрудников для обучения AI-агентов

Раскрываем методы Meta по сбору данных о сотрудниках для обучения AI-агентов. Кейлоггинг, скриншоты, этические дилеммы. Актуальная информация на 21 апреля 2026

4 мин чтения 21.04.2026

Коротко

Что будет в материале

01
Ваши клавиши рассказывают секреты
02
Арсенал слежки: от мыши до мемов
03
Этический обрыв: где кончается инновация и начинается дистопия?
04
Зачем это все? Рождение агентов нового поколения

Ваши клавиши рассказывают секреты

Внутренние переписки, нажатия клавиш, движения мыши и даже случайные скриншоты вашего рабочего стола. Для Meta это не паранойя. Это золотая жила тренировочных данных. Пока общественность обсуждает этику публичных моделей, внутри компании развернулась тихая охота за каждым байтом, который генерируют её собственные инженеры.

Источники, знакомые с инициативой Model Capability Initiative (MCI), запущенной в 2025 году, описывают систему сбора как тотальную. Цель проста и цинична: создать самый качественный в мире датасет о том, как профессионалы решают реальные задачи. Клик за кликом, коммит за коммитом.

💡

Model Capability Initiative — это внутренняя программа Meta по агрегации данных о поведении сотрудников для обучения узкоспециализированных AI-агентов. Информация актуальна по состоянию на апрель 2026 года.

Арсенал слежки: от мыши до мемов

Технологический стек MCI не оставляет шансов на приватность. Он состоит из нескольких взаимосвязанных слоев, каждый из которых выжимает данные из разных аспектов работы.

Слой сбора	Что фиксирует	Частота
Activity Monitor	Нажатия клавиш, движение курсора, активные окна, время бездействия	Каждые 100-500 мс
Context Capture	Скриншоты экрана, фокус приложения, открытые вкладки браузера	Случайно, по триггерам (например, при ошибке компиляции)
Communication Sniffer	Анонимизированный текст из Workplace Chats, комментарии в коде, треды в интранете	В реальном времени (с отсевом конфиденциальных слов)

"Activity Monitor" — это не просто софт для учета рабочего времени. Это тонкий инструмент, который учит ИИ паттернам продуктивности. Как разработчик переключается между IDE и документацией? Как дизайнер ищет вдохновение? Какие последовательности клавиш приводят к отладке успешной, а какие — к провальной? Это чистая бихевиористская мечта.

Контекстные скриншоты — самый спорный элемент. Хотя система теоретически маскирует чувствительные данные (пароли, личные сообщения), на практике алгоритмы распознавания образов могут ошибаться. Один промах — и приватный ключ или медицинская справка попадают в обучающий пайплайн.

Этический обрыв: где кончается инновация и начинается дистопия?

В теории всё звучит логично. Чтобы создать AI-агента, который реально помогает инженерам, его нужно обучать на данных реальных инженеров. Но практика — это ад из юридических формулировок и выжатого согласия.

Сотрудники Meta, поступая на работу, подписывают обновленный кодекс цифровой активности. В 37-м пункте, между политикой использования микроволновки и правилами парковки, зарыта фраза о "возможности сбора анонимизированных метаданных для улучшения внутренних инструментов и исследовательских целей". Согласие? Формально — да. Осознанное? Вряд ли.

Эта ситуация перекликается со скандалом вокруг OpenAI, который платит подрядчикам за разметку ваших рабочих файлов. Разница в масштабе и прямом доступе. Meta не нужно ждать, пока вы загрузите файл в чат — она уже внутри вашего рабочего процесса.

Зачем это все? Рождение агентов нового поколения

Собранные данные становятся топливом для проекта "Meta Coder", наследника CodeLlama. Цель — создать AI-агента, который не просто дополняет код, а полностью понимает контекст задачи: от тикета в Jira до чата с тимлидом.

Но аппетиты растут. В дорожной карте MCI на 2026-2027 годы, фрагменты которой просочились в сеть, есть пункт о "многомодальных агентах для управления инфраструктурой". Проще говоря, ИИ, который сможет автономно деплоить сервисы, основываясь на исторических данных о том, как это делали лучшие SRE-инженеры компании. Звучит круто, пока не вспомнишь инцидент с агентом OpenClaw, устроившим утечку тысяч документов. Обучая агента на всех действиях, вы рискуете скопировать и все ошибки.

Некоторые специалисты уже голосуют ногами. Волна ухода талантливых AI-исследователей из больших корпораций, о которой мы писали ранее, отчасти связана и с таким вот тотальным сбором. Нельзя творить, чувствуя на себе цифровой взгляд каждую секунду.

Парадокс: сами сотрудники, чьи данные собирают, начинают использовать внешние AI-инструменты вроде Claude для решения рабочих задач, что порождает новые риски утечек. Порочный круг, который не разорвать.

Что дальше? Совет от скептика

Если вы руководитель отдела, не спешите внедрять подобные системы слежения, вдохновившись примером гигантов. Помните, что данные — это не только сырье, но и токсичные отходы. Одна утечка — и репутационные потери перекроют все выгоды. Если же вы хотите анализировать эффективность команды, начните с азов HR-аналитики, где фокус на метриках, а не на каждом движении мыши.

Прогноз на 2027 год прост. Давление со стороны регуляторов (особенно в ЕС) заставит Meta и ей подобных формализовать и ограничить эти практики. Но до этого момента будет собрано достаточно данных, чтобы создать агентов, которые будут знать о нас больше, чем мы сами. И хорошо, если они останутся просто помощниками в написании кода.

Подписаться на канал