Двойные стандарты AI: копирайт, fair use и токены компаний в 2026 | AiManual
AiManual Logo Ai / Manual.
02 Июн 2026 Новости

Двойные стандарты AI: почему компании берут чужие данные, но защищают свои токены

Anthropic, OpenAI и Google требуют fair use для чужих данных, но блокируют копирование своих моделей. Разбираем меморандум, скандалы и лицемерие AI-гигантов.

Мир ИИ разделился на два лагеря. В одном — мы, разработчики и пользователи, которые должны безвозмездно отдавать свои тексты, картинки и код для обучения больших моделей. В другом — гиганты вроде Anthropic, OpenAI и Google, которые пачками патентуют токены и судятся с каждым, кто посмеет скопировать их веса. Ирония? Нет, системный двойной стандарт.

В апреле 2026 года Anthropic опубликовал меморандум, в котором на 47 страницах доказывает: обучение нейросетей на любом контенте из интернета — это fair use. Компания ссылается на первую поправку, свободу информации и «трансформативное использование». Звучит благородно, пока не вспомнишь, что тот же Anthropic в прошлом году засудил стартап за попытку дистиллировать их модель Claude 4 через API. Двойной стандарт очевиден: чужие тексты бери — они общественное достояние, а мои токены не трогай.

Эрик Шмидт, бывший CEO Google, в недавнем интервью назвал это «лицемерием, которое разорвёт индустрию». Он напомнил, что Google в 2025 году заплатила $60 млн штрафа за обучение на защищённых статьях, но тут же продаёт защиту собственных моделей через корпоративные лицензии.

Параллельно Европарламент вырубил ChatGPT из-за опасений за корпоративные секреты. Пока ИИ-компании требуют от юристов признать fair use тотальным, сами они внедряют криптографические обёртки, чтобы никто не вытащил их веса. OpenAI платит подрядчикам за разметку рабочих файлов пользователей — ваши документы становятся кормом для следующей версии, но попробуйте скачать GPT-5 в офлайн, и юристы выпишут вам чек на миллионы.

А как же Google? Компания, которая проиндексировала почти весь интернет, теперь продаёт защиту своих моделей через облачные соглашения о конфиденциальности. При этом Gemini сливает личные телефоны, а авторы не получают ни копейки за использование их книг в обучении. Инсайдеры уже начали отравлять датасеты — как ещё ответить на безнаказанность?

Скандал с Anthropic — лишь верхушка айсберга. В феврале 2026 года суд обязал компанию раскрыть источники обучения Claude. Выяснилось, что модель учили на пиратских копиях книг, форумах с лицензией «не для AI» и даже на фото пациентов из медицинских датасетов. Anthropic ответила: «Это же fair use».

Под шумок приняли EU AI Act с новыми санкциями. Регуляторы наконец-то начали требовать прозрачности: отчёты о данных, компенсации авторам, право на удаление. Но гиганты лоббируют исключения для «фундаментальных моделей» — тех самых, на которых зарабатывают миллиарды. ChatGPT Health уже лечит пациентов, используя их медицинские записи — без согласия. А если модель ошибётся? Кто ответит — больница или OpenAI?

В корпоративных внедрениях компании вроде Alpina Digital предлагают архитектуры безопасности, которые блокируют утечку данных наружу. Но это не решает главного: пока AI-гиганты тратят миллионы на защиту своих токенов и лоббирование fair use, создатели контента остаются с пустыми карманами. Рано или поздно ChatGPT сольёт ваши данные — это лишь вопрос времени.

Чем закончится эта игра? Пока двойные стандарты работают. Но если каждый автор или разработчик начнёт шифровать свой контент до уровня, недоступного для краулеров, модели останутся без свежих данных. Возможно, тогда AI-компании поймут: fair use без fair pay — это воровство, как его ни назови.

Подписаться на канал