Маори создают собственный TTS: суверенитет данных против Big Tech

Звучит знакомо, но не для маори

В мае 2026 года новозеландская некоммерческая организация Te Hiku Media объявила о запуске собственной open-source TTS-системы для te reo Māori. Не купили API у ElevenLabs, не попросили OpenAI натренировать whisper на своём языке. Сделали сами. С нуля. На своих данных. Потому что Big Tech не умеет просить разрешения.

История эта тянется ещё с 2023 года, когда стало известно: несколько корпораций без спроса скрапили аудиозаписи маори из публичных архивов и пустили их на обучение коммерческих моделей. Никто не спрашивал старейшин, никому не платили роялти. Просто взяли голос целого народа и превратили в товар. Реакция была жёсткой: ElevenLabs с её $330 млн капитализации стала символом всего, что не так с колониализмом данных.

Суть претензии: язык маори — не просто набор фонем. Это тапу (священное). Его коммерческое использование без этического соглашения приравнивается к краже культурного наследия. Big Tech этого не понимает.

Когда нейросеть решает, правильно ли ты говоришь

Проблема не только в деньгах. Исследования последних лет показывают: языковые модели систематически предвзяты к носителям нестандартных диалектов. ChatGPT оценивает носителя маорийского английского как менее умного — просто потому, что модель обучалась на корпусе белых американцев. То же самое с синтезом речи: готовые TTS воспроизводят интонации ведущих новостей BBC, а не живой ритм капа хака.

Маори решили: лучше мы построим свой движок, который будет звучать как наш язык, а не как пародия. Проект получил название Reo TTS. В основе — архитектура, близкая к акустическим моделям из контекстного TTS для локального запуска: никаких облаков, всё inference на Raspberry Pi внутри общинных центров.

Свой голос: что внутри

Команда Te Hiku Media пошла нестандартным путём. Вместо того чтобы орать на Big Tech, они собрали датасет через краудсорсинг: 2000 часов записей старейшин, школьников, радиоинтервью. Каждая запись маркирована не только текстом, но и метаданными: кто говорил, с какой интонацией, в каком регионе. Это не просто TTS, а архив живой речи.

Обучение шло на открытой платформе Soprano-Factory (кстати, Soprano-Factory позволяет обучить свою TTS-модель для работы на устройстве всего за пару дней). Модель получилась лёгкой — всего 250 МБ, её можно запустить даже на старых смартфонах. Идеальный вариант для деревень, где нет стабильного интернета.

💡

Важно: все данные хранятся на серверах, контролируемых советом маори. Никакой блокчейн, никаких лицензий на использование военными или рекламными агентствами. Полный суверенитет.

Почему это не бунт, а прагматизм

Некоторые скажут: «Зачем изобретать велосипед, когда есть ElevenLabs с их голосами знаменитостей?». Ответ — в цене вопроса. Если вы разрешаете корпорации обучаться на вашем языке, вы теряете контроль. Через год модель может начать озвучивать пропаганду голосом вашей бабушки. Маори не хотят, чтобы их культура стала Data2Vec для очередного стартапа.

Кстати, технически Reo TTS уже интегрирован с любой LLM через AnyTTS-подход: буфер обмена связывает чат-бота и синтезатор. Так что можно говорить на языке маори с агентом поддержки — и при этом не отдавать данные в облако.

Что дальше? Тренд на indigenous AI

Маори — не единственные. Аналогичные проекты зреют в Канаде (язык кри), в Гане (тви), в российской Арктике (хантыйский). Суть одна: если Большие Технологии не могут уважать суверенитет, коренные народы построят своё. И да, это замедлит развитие единого AGI — но, может, это и к лучшему?

Для разработчиков TTS на редких языках урок прост: не берите данные молча. Спрашивайте. Платите. Дайте контроль. Иначе вас просто вычеркнут из уравнения. Kitten TTS уже умеет работать на Raspberry Pi — так что запустить свой голос на своём железе теперь может каждый. Вопрос лишь в том, готовы ли вы признать право народа на собственный цифровой голос.

Подписаться на канал

Голос без разрешения: почему маори строят свой TTS, а Big Tech остается за бортом

Звучит знакомо, но не для маори

Когда нейросеть решает, правильно ли ты говоришь

Свой голос: что внутри

Почему это не бунт, а прагматизм

Что дальше? Тренд на indigenous AI

Подписывайтесь на наш канал!