Xiaozhi робот Добби: разбор, ремонт и анализ ESP32 голосового ассистента | AiManual
AiManual Logo Ai / Manual.
02 Фев 2026 Инструмент

Xiaozhi (Робот Добби): китайский opensource робот на ESP32, который можно починить и перепрограммировать

Полный разбор китайского голосового робота Xiaozhi на ESP32. Аппаратная часть, прошивка, ремонт микрофона и сравнение с альтернативами на 2026 год.

Китайский робот, который не боится паяльника

Вы когда-нибудь покупали игрушку, которая через месяц превращается в пластиковый хлам? Xiaozhi (в народе - "робот Добби") - полная противоположность. Это opensource голосовой ассистент на ESP32, который можно разобрать до винтика, починить и перепрошить под свои нужды. В 2026 году, когда большинство устройств запечатано намертво, такая открытость выглядит почти революционно.

💡
На февраль 2026 года Xiaozhi остается одним из немногих коммерческих продуктов с полностью открытым железом и софтом. Все схемы, исходный код и документация доступны на GitHub.

1Что внутри этого китайского чуда

Открываешь корпус - и видишь учебник по электронике. Никаких залитых плат, никаких проприетарных чипов. Сердце системы - ESP32-WROOM-32E, знакомый каждому, кто хоть раз держал в руках плату для IoT. Рядом - аудиокодек ES7243, усилитель PAM8403 для динамика и простенький микрофонный модуль. Все компоненты доступны на AliExpress, если что-то сгорит.

КомпонентМодельНазначение
МикроконтроллерESP32-WROOM-32EОбработка голоса, Wi-Fi, управление
АудиокодекES7243Цифро-аналоговое преобразование
УсилительPAM8403Усиление сигнала для динамика
МикрофонМЭМС-микрофонЗапись голоса (самое слабое звено)

Вот только микрофон... Здесь китайские инженеры явно сэкономили. МЭМС-микрофон улавливает все - от голоса до шума холодильника в соседней комнате. Но об этом позже.

Программная начинка: от Alibaba Cloud до вашей прошивки

Из коробки Xiaozhi работает с облаком Alibaba Cloud. Говорите "Привет, Добби" - робот просыпается, отправляет аудио в облако, получает ответ и озвучивает его. Стандартная схема для бюджетных голосовых ассистентов.

Но вся фишка в том, что прошивку можно заменить. Полностью. В репозитории есть исходники для PlatformIO, где вместо облака Alibaba можно подключить что угодно - локальный сервер, другую облачную платформу или вообще сделать автономное устройство с Qwen3-ASR на борту (хотя для ESP32 это пока фантастика).

Обновление на февраль 2026: последняя версия прошивки Xiaozhi добавила поддержку нескольких облачных провайдеров на выбор. Теперь можно переключаться между Alibaba Cloud, Baidu и Tencent прямо из веб-интерфейса.

2Ремонт микрофона: самая частая поломка

Теперь о главном - почему эти роботы часто ломаются. Микрофон. Тот самый МЭМС-микрофон, который стоит копейки и работает соответственно.

Симптомы: робот перестает слышать команды, либо слышит только очень громкую речь. В 80% случаев проблема в микрофоне. В 15% - в аудиокодеке ES7243. В 5% - где-то в пайке.

Как чинить:

  1. Откручиваете четыре винта на задней панели
  2. Аккуратно отсоединяете плату от корпуса (там пара разъемов)
  3. Находите микрофон - маленький квадратный компонент с отверстием
  4. Выпаиваете старый, впаиваете новый (за 50 рублей с AliExpress)

Если не хотите возиться с пайкой - есть лайфхак. Можно подключить внешний USB-микрофон через переходник. ESP32 его увидит, и качество распознавания улучшится в разы.

С чем сравнить Xiaozhi в 2026 году

Рынок голосовых ассистентов на микроконтроллерах за последние два года сильно изменился. Появились проекты вроде Speekium для полной приватности. Но они требуют либо Raspberry Pi, либо более мощное железо.

ПараметрXiaozhi (ESP32)Raspberry Pi + SpeekiumКоммерческие ассистенты
Стоимость1500-2000 руб.5000+ руб.3000-10000 руб.
ОткрытостьПолная (hardware + software)Только softwareНулевая
РемонтопригодностьВысокаяСредняяНулевая
ПроизводительностьБазовые командыСложная логикаЗависит от модели

Xiaozhi выигрывает там, где нужна максимальная простота и ремонтопригодность. Хотите научить ребенка основам электроники? Или сделать дешевого ассистента для умного дома? Или просто поиграть с ESP32 без пайки макеток? Это ваш выбор.

Что можно сделать с этим роботом сегодня

Самый частый вопрос: "А зачем он вообще нужен?" Отвечаю примерами:

  • Детский проект по программированию - вместо абстрактных "Hello World" ребенок видит реальное устройство, которое отвечает на его команды
  • Голосовое управление умным домом - перепрошиваете Xiaozhi, подключаете к Home Assistant, говорите "Включи свет" - свет включается
  • Тестовый стенд для голосовых технологий - проверяете, как ваша TTS-модель вроде Qwen3-TTS звучит через реальный динамик
  • Донор платформы - берете корпус, кнопки, динамик, выбрасываете плату и ставите свою на базе ESP32-S3

Важный нюанс: последние версии прошивки поддерживают multilingual ASR от Alibaba. Теперь робот понимает не только китайский, но и базовый английский. Для русского придется писать свою прослойку.

Кому стоит покупать Xiaozhi в 2026

Давайте без иллюзий. Это не конкурент Alexa или даже Hey Lama. Это образовательная игрушка с потенциалом.

Берите Xiaozhi, если:

  • Хотите понять, как работают голосовые ассистенты "под капотом"
  • Ищете платформу для экспериментов с ESP32 и аудио
  • Нужен дешевый голосовой интерфейс для своего проекта
  • Любите чинить электронику (микрофон точно сломается)
  • Преподаете основы IoT и нужен наглядный материал

Не берите, если:

  • Ожидаете качества как у коммерческих продуктов
  • Не готовы копаться в китайской документации
  • Боитесь паяльника и командной строки
  • Нужен полноценный ассистент с сложной логикой

Что будет с такими устройствами дальше

Тренд на локальную обработку голоса только набирает обороты. После истории с OpenAI, который перекраивает себя под аудио, все крупные игроки бросились делать свои аудиоустройства. Но они будут закрытыми, дорогими и неремонтопригодными.

Xiaozhi показывает альтернативный путь: дешево, открыто, ремонтопригодно. Да, с кучей компромиссов. Но именно такие устройства становятся полигоном для новых технологий. Кто знает, может через год на ESP32-S3 уже будут запускать упрощенные версии Qwen3-ASR?

Мой прогноз: рынок разделится. С одной стороны - дорогие коммерческие устройства с искуственным интеллектом. С другой - opensource платформы вроде Xiaozhi, которые будут становиться все умнее благодаря сообществу. И выбирать сторону нужно уже сейчас.