Иск авторов против ИИ: миллиарды против $3000 | Битва за авторские права | AiManual
AiManual Logo Ai / Manual.
29 Дек 2025 Новости

Авторы против ИИ: новый иск на миллиарды и почему $3000 — это оскорбление

Громкий иск авторов против Anthropic и OpenAI на миллиарды долларов. Почему компенсация в $3000 за использование книг для обучения ИИ — унизительная сумма.

Битва титанов: литературные классики против AI-гигантов

В мире искусственного интеллекта вновь разгорается юридический скандал, который может изменить правила игры для всей индустрии. Группа известных авторов подала коллективный иск против компаний Anthropic и OpenAI, требуя компенсации в размере миллиардов долларов за использование их произведений для обучения языковых моделей. Особое возмущение у истцов вызывает предложенная OpenAI компенсация в размере всего $3000 за использование книг — сумма, которую они называют "оскорбительной".

Ключевой момент: Иск касается не только денежной компенсации, но и фундаментальных вопросов о том, что считается "добросовестным использованием" (fair use) в эпоху искусственного интеллекта.

Что именно произошло?

Иск был подан в федеральный суд Нью-Йорка и включает обвинения в нарушении авторских прав, недобросовестной конкуренции и неосновательном обогащении. Авторы утверждают, что их произведения использовались без разрешения для создания коммерческих продуктов, которые теперь приносят миллиардные доходы.

Основные претензии истцов:

  • Использование защищенных авторским правом произведений для обучения моделей без согласия авторов
  • Создание производных работ на основе оригинальных произведений
  • Получение многомиллиардной прибыли от продуктов, созданных с использованием "украденного" контента
  • Неадекватные попытки урегулирования конфликта (предложение $3000 за книгу)

Почему $3000 — это "оскорбление"?

Особое внимание в иске уделяется предложению OpenAI выплачивать авторам по $3000 за каждую книгу, использованную для обучения их моделей. Авторы называют эту сумму "смехотворной" и "унизительной", особенно на фоне:

Фактор Значение Контекст
Оценка OpenAI $80+ млрд Текущая рыночная оценка компании
Инвестиции Microsoft $13 млрд Общий объем инвестиций
Доход от ChatGPT Plus $1.6+ млрд в год Только от платной подписки
Предлагаемая компенсация $3000 за книгу Независимо от коммерческого успеха книги
💡
Этот иск является частью более широкой тенденции. Ранее аналогичные иски подавались против других AI-компаний, включая Stability AI и Midjourney. Однако текущий случай отличается масштабом требований и участием крупнейших игроков рынка.

Технические аспекты: как книги используются для обучения ИИ

Чтобы понять суть конфликта, важно разобраться в технических деталях процесса обучения языковых моделей. Книги и другие текстовые материалы являются критически важным ресурсом для создания качественных AI-систем.

Процесс обучения языковых моделей:

  1. Сбор данных: Компании собирают огромные объемы текстовых данных из различных источников, включая книги, статьи, веб-страницы
  2. Предобработка: Тексты очищаются, токенизируются и подготавливаются для обучения
  3. Обучение модели: Нейронная сеть анализирует паттерны в текстах, обучаясь предсказывать следующие слова
  4. Дообучение: Модель дополнительно обучается на специфических задачах и данных

Как отмечают эксперты в области AI governance, именно на этапе сбора данных возникают основные юридические риски.

# Упрощенный пример того, как текстовые данные могут использоваться
# для обучения языковых моделей

def prepare_training_data(books_collection):
    """Подготовка данных из книг для обучения AI-модели"""
    training_examples = []
    
    for book in books_collection:
        # Токенизация текста книги
        tokens = tokenize(book.text)
        
        # Создание обучающих примеров
        # (контекст -> следующее слово)
        for i in range(len(tokens) - sequence_length):
            context = tokens[i:i+sequence_length]
            target = tokens[i+sequence_length]
            training_examples.append((context, target))
            
    return training_examples

Позиции сторон: кто прав?

Аргументы авторов:

  • Их интеллектуальная собственность используется без разрешения
  • ИИ-компании получают прибыль от их творческого труда
  • Существующие механизмы лицензирования игнорируются
  • Предлагаемая компенсация не отражает реальную ценность произведений

Аргументы AI-компаний:

  • Использование попадает под "добросовестное использование" (fair use)
  • Обучение на публично доступных данных — стандартная практика
  • Модели не воспроизводят книги дословно, а изучают паттерны языка
  • Создание лицензионных соглашений для миллионов книг технически сложно

Интересно, что аналогичные проблемы с безопасностью данных возникают и в других областях AI. Например, вопросы prompt injection показывают, насколько сложно обеспечить полную безопасность AI-систем.

Возможные последствия для индустрии

Исход этого дела может иметь далеко идущие последствия не только для AI-гигантов, но и для всей экосистемы искусственного интеллекта.

Сценарии развития событий:

1. Победа авторов — революция в лицензировании

Если суд встанет на сторону авторов, это может привести к созданию сложной системы лицензирования для всех AI-компаний. Подобно тому, как музыкальные сервисы платят роялти, AI-разработчикам придется платить за использование контента.

2. Компромиссное решение — отраслевые стандарты

Возможно создание отраслевого пула или коллективного управления правами, аналогичного ASCAP/BMI в музыкальной индустрии. Это позволит упростить процесс лицензирования для всех участников.

3. Победа AI-компаний — статус-кво сохранится

Если суд признает использование добросовестным, текущая практика продолжится. Однако это может привести к ужесточению законодательства в будущем.

Что это значит для разработчиков и пользователей?

Для разработчиков, особенно тех, кто работает с локальными моделями, этот иск создает дополнительные риски:

  • Необходимость тщательного аудита тренировочных данных
  • Риск судебных исков даже для небольших проектов
  • Возможное удорожание разработки AI-систем
  • Сложности с получением качественных данных для обучения

Для бизнеса, внедряющего AI-решения, такие как банковский сектор, это означает дополнительные юридические проверки и оценку рисков.

💡
Параллельно с этим юридическим спором, в индустрии технологий происходят и другие значимые изменения. Например, трансформация процессов найма, описанная в статье "Реквием по IT-2025", показывает, как технологические изменения влияют на различные аспекты бизнеса.

Выводы и прогнозы

Иск авторов против Anthropic и OpenAI — это не просто очередной юридический спор. Это сигнал о фундаментальном конфликте между традиционными представлениями об интеллектуальной собственности и новой реальностью, в которой данные стали основным ресурсом для создания искусственного интеллекта.

Независимо от исхода этого конкретного дела, ясно одно: эпоха "бесплатного" использования данных для обучения AI подходит к концу. Индустрии придется найти баланс между:

  • Потребностью в качественных данных для развития ИИ
  • Правами создателей контента на справедливое вознаграждение
  • Технической реализуемостью систем лицензирования
  • Интересами общества в развитии технологий

Предложение в $3000 за книгу, которое так возмутило авторов, скорее всего, было лишь начальной позицией для переговоров. Реальная стоимость, вероятно, окажется значительно выше, но и она вряд ли приблизится к миллиардным требованиям истцов.

Окончательное решение суда, которое может быть вынесено в течение следующих 12-18 месяцев, станет прецедентом для всей индустрии искусственного интеллекта и определит правила игры на годы вперед.