AI модель для языка маори: культурный суверенитет без Big Tech | AiManual
AiManual Logo Ai / Manual.
31 Май 2026 Новости

Свой голос, свои правила: как маори построили AI, который Big Tech не купит

Маори построили open-source TTS на своих данных, обойдя колониализм Big Tech. Рассказываем, как этика и технология объединились против корпораций.

Big Tech не умеет просить разрешения. Это факт, который маори усвоили на собственной шкуре. В 2023 году выяснилось: ElevenLabs и несколько других компаний тихо скрапили тысячи часов аудиозаписей на te reo Māori из публичных архивов. Никто не спросил старейшин. Никто не заплатил. Просто взяли голос целого народа и превратили в товар. Скандал был громким — маори потребовали удалить данные, но осадок остался. И тогда они решили: хватит.

Суть проста: язык маори — не просто коммуникационный инструмент. Для народа это тапу (священное). Коммерческое использование без этического соглашения приравнивается к культурной краже. Big Tech этого не понимает — или делает вид.

Обойти корпорации, не крича на каждом углу

Вместо того чтобы судиться годами, некоммерческая организация Te Hiku Media пошла другим путём. В мае 2026 года они анонсировали открытую TTS-систему Reo TTS. Сделали сами, на своих данных, без лицензионных отчислений Big Tech. Никаких API от Amazon, Google или ElevenLabs. Никаких «облачных» зависимостей. Всё работает локально — прямо на Raspberry Pi в общинных центрах.

Звучит как активизм? Отчасти. Но за этим стоит глубокая техническая работа. Команда собрала датасет через краудсорсинг: 2000 часов записей старейшин, школьников, радиоинтервью. Каждый файл размечен не только текстом, но и метаданными — кто говорит, с какой интонацией, в каком контексте. Это позволило модели уловить живую речь, а не «дикторский» английский.

⚠️
Важный нюанс: стандартные TTS-модели вроде тех, что продаёт ElevenLabs, обучаются на корпусах BBC и CNN. Они воспроизводят интонации ведущих новостей, а не ритм капа хака или маорийского говорка. Маори это бесит — и они правы.

Почему Big Text не справился сам

Проблема не только в этике. Языковые модели систематически предвзяты к носителям нестандартных диалектов. ChatGPT оценивает носителя маорийского английского как менее умного — просто потому, что модель обучалась на белых американцах. То же с синтезом: готовые TTS звучат как пародия.

Маори решили: лучше построить движок, который будет звучать как их язык, а не как карикатура. В основе Reo TTS — архитектура, близкая к акустическим моделям из контекстного TTS для локального запуска. Как в MichiAI, но с фокусом на культурную точность. Никаких облачных провайдеров — всё inference на месте.

Показательно, что этот подход перекликается с тем, что происходит в других странах. Индия заставляет Grok фильтровать «непристойный» контент — хотя методы грубее, суть та же: локальные сообщества хотят контролировать, как ИИ говорит на их языке.

Технология суверенитета: как это работает

Reo TTS строится на трёх принципах, которые делают её неуязвимой для Big Tech:

  • Данные принадлежат общине. Все записи хранятся в локальных репозиториях под контролем маори. Лицензия запрещает коммерческое использование без согласия совета старейшин.
  • Модель открыта, но с условиями. Код опубликован на GitHub под лицензией, которая позволяет использовать только для некоммерческих целей, если проект не одобрен Te Hiku Media.
  • Инференс на границе. Система работает на Raspberry Pi 5 (модель 2024 года — хватает за глаза). Никаких запросов в облако — приватность абсолютная.

Звучит радикально? В мире, где лоббисты вроде Дарио Амодеи пытаются запретить локальный ИИ, такой подход — вызов. Но маори не одиноки: кейс Gaming Alexandria показал, как AI-переводы раскалывают сообщества, если не учитывать локальный контекст.

Этический скандал, который разбудил всех

История началась в 2023 году, когда журналисты обнаружили, что ElevenLabs — стартап с $330 млн капитализации — использовал архивы маори без разрешения. Реакция была жёсткой: петиции, открытые письма, требования удалить данные. Компания извинилась, но осадок остался. Именно тогда Te Hiku Media начала работу над Reo TTS — не как протест, а как альтернатива.

Сейчас ElevenLabs уже не та — реклама в ChatGPT и исход из Thinking Machines показывают, что рынок AI меняется. Но маори не ждут милостей.

ПараметрBig Tech TTSReo TTS
Владение даннымиКорпорацияОбщина
ЛицензияПроприетарнаяОткрытая с ограничениями
ЛокализацияОблакоЛокальный Raspberry Pi
Культурная точностьНизкая (BBC-английский)Высокая (речь старейшин)

Не просто технология — манифест

Reo TTS — это не проект для галочки. Команда Te Hiku Media выпустила манифест, в котором чётко прописано: «Данные маори не могут быть ресурсом для обогащения иностранных корпораций. Если вы хотите использовать наш голос — сначала спросите, и мы решим, давать ли разрешение».

Это перекликается с глобальной дискуссией о суверенитете данных. Регулирование AI должно фокусироваться на применении, а не на моделях — и маори показывают, как это выглядит на практике. Они не запрещают AI, они его присваивают.

Кстати, недавний скандал вокруг Anthropic и open-source только подтверждает: борьба за контроль над ИИ обостряется. Маори выбрали свою сторону — и не прогадали.

💡
Что характерно: Te Hiku Media активно консультируется с другими коренными народами — австралийскими аборигенами, индейцами США, саамами. Они создают сеть «этического AI», где данные не продаются, а обмениваются по справедливым правилам.

Сейчас Reo TTS работает в тестовом режиме в 40 общинных центрах. Планы — к концу 2026 года охватить все школы Новой Зеландии, где преподают te reo Māori. И да, Big Tech больше не будет диктовать, как должен звучать голос маори.

Они показали: технология может быть суверенной. Вопрос не в ресурсах — вопрос в воле. И в том, готовы ли мы наконец спросить разрешения, прежде чем использовать чужой голос.

Подписаться на канал