Кто собирает данные для обучения человекоподобных роботов?

В основном гиг-работники в странах с низкими доходами, таких как Нигерия, Индия, Кения и Филиппины, через онлайн-платформы типа Micro1. Они аннотируют изображения и видео, чтобы научить ИИ физическим действиям.

Почему эту работу выполняют в Нигерии и Индии?

Из-за сочетания низкой стоимости труда, высокого уровня технического образования и широкого распространения английского языка. Это делает сбор данных экономически эффективным для западных и азиатских компаний.

Какие этические проблемы связаны с этим процессом?

Основные проблемы - низкая оплата труда, отсутствие социальных гарантий, использование изображений людей без их согласия и создание зависимости, где работники помогают создавать технологии, которые могут лишить их доходов в будущем.

Гиг-экономика для ИИ: сбор данных в Нигерии и Индии для роботов

Невидимые руки для железных кулаков

Лагос, Нигерия. 3 часа ночи. Джон скроллит задания на экране смартфона. Не доставку еды, не поездку на такси. Он учит роботов, как быть человеком. За $1.50 в час. Его работа - отмечать тысячи кадров видео: вот локоть сгибается, вот пальцы обхватывают чашку, вот стопа ставится на неровную поверхность. Каждый клик - еще один кирпичик в фундаменте физического интеллекта для машин, которые вскоре заменят его самого.

Это новый цех. Конвейер не для шитья футболок или сборки телефонов, а для производства самого ценного сырья 2026 года - аннотированных датасетов. Без них не пошевелится ни один новый робот за $2 в час. И этот цех глобален, но сосредоточен в нескольких точках на карте: Нигерия, Индия, Кения, Филиппины.

По данным на начало 2026 года, рынок аннотации данных для робототехники и компьютерного зрения вырос до $8.2 млрд. Около 65% этих работ выполняется через гиг-платформы в странах с низким доходом.

Алгоритмический конвейер в Бангалоре и Лагосе

Почему именно здесь? Ответ прост и циничен: стоимость. Высокий уровень образования (особенно технического), свободный английский и низкие экономические ожидания создали идеальный шторм. Платформы вроде Micro1 нанимают инженеров и студентов для задач, которые кажутся им «продвинутыми»: сегментация объектов в LiDAR-сканах, разметка сложных человеческих поз, верификация результатов работы модеей, таких как Nemotron-Personas-India v3.1.

«Вчера я восемь часов подряд описывал, как люди открывают разные типы дверей - ручкой, толкателем, локтем, когда руки заняты, - рассказывает Амит из Бангалора. - Задание пришло от какого-то стартапа из Калифорнии. Оплата поштучная. Если сосредоточиться, можно заработать $12 за день».

Эти данные - кровь для проектов вроде Physical Intelligence или китайских гигантов, спешащих обучить своих человекоподобных роботов. Задача - не просто распознать объект, а понять контекст физического мира: силу нажатия, баланс, последовательность микро-действий. Тому, что людям дано от природы, роботов учат тысячами Амитов и Джонов.

Распространенная практика - использование кадров из публичных веб-камер или даже записей с дверных звонков для обучения моделей. Согласие людей, чьи изображения используются, редко запрашивается. Этический вакуум - стандартное состояние дел.

Этика? Добавьте в корзину

Здесь кроется главный парадокс. Индия, которая вливает миллиарды в свой ИИ-суверенитет, одновременно является фабрикой по производству данных для западных и китайских компаний. Национальные амбиции сталкиваются с экономической реальностью: гиг-работа - это часто единственный шанс для выпускника инженерного вуза.

Условия? Типичные для платформенной экономики: нет контракта, нет страховки, оплата может быть задержана или снижена, если алгоритм контроля качества (еще один ИИ) сочтет работу недостаточно точной. Ты соревнуешься с тысячами таких же, а твой рейтинг определяет, получишь ли ты доступ к самым высокооплачиваемым задачам.

«Иногда они просят пометить эмоции на лицах людей в толпе, - говорит Чинеду из Нигерии. - Фотографии явно сделаны без ведома. Чувствуешь себя неловко. Но если откажешься - получишь низкий рейтинг. А дальше - только простейшая разметка изображений по цене в три раза ниже».

Это напоминает сюжет из статьи про DoorDash Tasks, только масштаб глобальнее, а последствия серьезнее. Данные для робота-гуманоида критичнее данных для рекомендательной системы пиццы.

Синтетическое будущее и реальные жертвы

Индустрия знает о проблеме. Ответ - синтетические данные. Зачем платить людям, если можно сгенерировать миллионы фотографий «индийцев» или «нигерийцев» в разных позах с помощью моделей типа Nemotron-Personas-India v3.2? Наша статья о синтетических индийцах подробно разбирает этот тренд.

Но здесь загвоздка. Синтетика - хороша, но не идеальна для обучения физическому интеллекту. Микро-нюансы реального мира - дрожание руки, истинная текстура старой двери, поведение ткани на ветру - модели пока воспроизводят с ошибками. Поэтому гибридный подход: тонны синтетических данных плюс ключевые реальные датасеты, размеченные теми самыми гиг-работниками.

Обучение с подкреплением для роботов, о котором мы писали в материале «Распределённое обучение с подкреплением: до сих пор ад», тоже требует начальных человеческих демонстраций. Кто-то должен тысячи раз показать роботу, как держать яйцо. Виртуально или физически. И этот «кто-то» часто сидит в другом полушарии.

💡

Совет инсайдера: если вы разрабатываете робота и ищете данные, не экономьте на этническом и средовом разнообразии датасетов. Робот, обученный только на действиях белых мужчин в современных американских кухнях, потерпит фиаско в 80% мировых домохозяйств. Это технический долг, который аукнется громче любого бага.

Что дальше? Роботы научатся, люди - останутся

Логичный финал этой истории - самоуничтожение гиг-экономики для ИИ. Как только роботы, обученные на данных от Джона и Амита, станут достаточно умными, они смогут генерировать реалистичные симуляции и аннотировать данные друг для друга. Круг закроется.

Но до этого момента - еще годы. А пока что тысячи людей выполняют работу, которая сделает их самих ненужными. Ирония толщиной в стальной корпус человекоподобного андроида.

Проблема не в ИИ и не в роботах. Проблема, как всегда, в нас. В готовности покупать дешевый интеллект, не глядя на цену, которую платят другие. История «Люди как роботы» становится буквальной.

Так что, когда в следующий раз увидите видео с плавно двигающимся роботом Грином или новым творением Figure AI, вспомните. Где-то в душной комнате в Лагосе человек, моргая от усталости, ставит еще одну точку на экране. Он учит машину жить. И сам не понимает, что копает себе могилу лопатой под названием «прогресс».

Подписаться на канал

Гиг-экономика для ИИ: как в Нигерии и Индии собирают данные для обучения человекоподобных роботов

Невидимые руки для железных кулаков

Алгоритмический конвейер в Бангалоре и Лагосе

Этика? Добавьте в корзину

Синтетическое будущее и реальные жертвы

Что дальше? Роботы научатся, люди - останутся

Подписывайтесь на наш канал!