Big Tech не умеет просить разрешения. Это факт, который маори усвоили на собственной шкуре. В 2023 году выяснилось: ElevenLabs и несколько других компаний тихо скрапили тысячи часов аудиозаписей на te reo Māori из публичных архивов. Никто не спросил старейшин. Никто не заплатил. Просто взяли голос целого народа и превратили в товар. Скандал был громким — маори потребовали удалить данные, но осадок остался. И тогда они решили: хватит.
Суть проста: язык маори — не просто коммуникационный инструмент. Для народа это тапу (священное). Коммерческое использование без этического соглашения приравнивается к культурной краже. Big Tech этого не понимает — или делает вид.
Обойти корпорации, не крича на каждом углу
Вместо того чтобы судиться годами, некоммерческая организация Te Hiku Media пошла другим путём. В мае 2026 года они анонсировали открытую TTS-систему Reo TTS. Сделали сами, на своих данных, без лицензионных отчислений Big Tech. Никаких API от Amazon, Google или ElevenLabs. Никаких «облачных» зависимостей. Всё работает локально — прямо на Raspberry Pi в общинных центрах.
Звучит как активизм? Отчасти. Но за этим стоит глубокая техническая работа. Команда собрала датасет через краудсорсинг: 2000 часов записей старейшин, школьников, радиоинтервью. Каждый файл размечен не только текстом, но и метаданными — кто говорит, с какой интонацией, в каком контексте. Это позволило модели уловить живую речь, а не «дикторский» английский.
Почему Big Text не справился сам
Проблема не только в этике. Языковые модели систематически предвзяты к носителям нестандартных диалектов. ChatGPT оценивает носителя маорийского английского как менее умного — просто потому, что модель обучалась на белых американцах. То же с синтезом: готовые TTS звучат как пародия.
Маори решили: лучше построить движок, который будет звучать как их язык, а не как карикатура. В основе Reo TTS — архитектура, близкая к акустическим моделям из контекстного TTS для локального запуска. Как в MichiAI, но с фокусом на культурную точность. Никаких облачных провайдеров — всё inference на месте.
Показательно, что этот подход перекликается с тем, что происходит в других странах. Индия заставляет Grok фильтровать «непристойный» контент — хотя методы грубее, суть та же: локальные сообщества хотят контролировать, как ИИ говорит на их языке.
Технология суверенитета: как это работает
Reo TTS строится на трёх принципах, которые делают её неуязвимой для Big Tech:
- Данные принадлежат общине. Все записи хранятся в локальных репозиториях под контролем маори. Лицензия запрещает коммерческое использование без согласия совета старейшин.
- Модель открыта, но с условиями. Код опубликован на GitHub под лицензией, которая позволяет использовать только для некоммерческих целей, если проект не одобрен Te Hiku Media.
- Инференс на границе. Система работает на Raspberry Pi 5 (модель 2024 года — хватает за глаза). Никаких запросов в облако — приватность абсолютная.
Звучит радикально? В мире, где лоббисты вроде Дарио Амодеи пытаются запретить локальный ИИ, такой подход — вызов. Но маори не одиноки: кейс Gaming Alexandria показал, как AI-переводы раскалывают сообщества, если не учитывать локальный контекст.
Этический скандал, который разбудил всех
История началась в 2023 году, когда журналисты обнаружили, что ElevenLabs — стартап с $330 млн капитализации — использовал архивы маори без разрешения. Реакция была жёсткой: петиции, открытые письма, требования удалить данные. Компания извинилась, но осадок остался. Именно тогда Te Hiku Media начала работу над Reo TTS — не как протест, а как альтернатива.
Сейчас ElevenLabs уже не та — реклама в ChatGPT и исход из Thinking Machines показывают, что рынок AI меняется. Но маори не ждут милостей.
| Параметр | Big Tech TTS | Reo TTS |
|---|---|---|
| Владение данными | Корпорация | Община |
| Лицензия | Проприетарная | Открытая с ограничениями |
| Локализация | Облако | Локальный Raspberry Pi |
| Культурная точность | Низкая (BBC-английский) | Высокая (речь старейшин) |
Не просто технология — манифест
Reo TTS — это не проект для галочки. Команда Te Hiku Media выпустила манифест, в котором чётко прописано: «Данные маори не могут быть ресурсом для обогащения иностранных корпораций. Если вы хотите использовать наш голос — сначала спросите, и мы решим, давать ли разрешение».
Это перекликается с глобальной дискуссией о суверенитете данных. Регулирование AI должно фокусироваться на применении, а не на моделях — и маори показывают, как это выглядит на практике. Они не запрещают AI, они его присваивают.
Кстати, недавний скандал вокруг Anthropic и open-source только подтверждает: борьба за контроль над ИИ обостряется. Маори выбрали свою сторону — и не прогадали.
Сейчас Reo TTS работает в тестовом режиме в 40 общинных центрах. Планы — к концу 2026 года охватить все школы Новой Зеландии, где преподают te reo Māori. И да, Big Tech больше не будет диктовать, как должен звучать голос маори.
Они показали: технология может быть суверенной. Вопрос не в ресурсах — вопрос в воле. И в том, готовы ли мы наконец спросить разрешения, прежде чем использовать чужой голос.