Китайский робот, который не боится паяльника
Вы когда-нибудь покупали игрушку, которая через месяц превращается в пластиковый хлам? Xiaozhi (в народе - "робот Добби") - полная противоположность. Это opensource голосовой ассистент на ESP32, который можно разобрать до винтика, починить и перепрошить под свои нужды. В 2026 году, когда большинство устройств запечатано намертво, такая открытость выглядит почти революционно.
1Что внутри этого китайского чуда
Открываешь корпус - и видишь учебник по электронике. Никаких залитых плат, никаких проприетарных чипов. Сердце системы - ESP32-WROOM-32E, знакомый каждому, кто хоть раз держал в руках плату для IoT. Рядом - аудиокодек ES7243, усилитель PAM8403 для динамика и простенький микрофонный модуль. Все компоненты доступны на AliExpress, если что-то сгорит.
| Компонент | Модель | Назначение |
|---|---|---|
| Микроконтроллер | ESP32-WROOM-32E | Обработка голоса, Wi-Fi, управление |
| Аудиокодек | ES7243 | Цифро-аналоговое преобразование |
| Усилитель | PAM8403 | Усиление сигнала для динамика |
| Микрофон | МЭМС-микрофон | Запись голоса (самое слабое звено) |
Вот только микрофон... Здесь китайские инженеры явно сэкономили. МЭМС-микрофон улавливает все - от голоса до шума холодильника в соседней комнате. Но об этом позже.
Программная начинка: от Alibaba Cloud до вашей прошивки
Из коробки Xiaozhi работает с облаком Alibaba Cloud. Говорите "Привет, Добби" - робот просыпается, отправляет аудио в облако, получает ответ и озвучивает его. Стандартная схема для бюджетных голосовых ассистентов.
Но вся фишка в том, что прошивку можно заменить. Полностью. В репозитории есть исходники для PlatformIO, где вместо облака Alibaba можно подключить что угодно - локальный сервер, другую облачную платформу или вообще сделать автономное устройство с Qwen3-ASR на борту (хотя для ESP32 это пока фантастика).
Обновление на февраль 2026: последняя версия прошивки Xiaozhi добавила поддержку нескольких облачных провайдеров на выбор. Теперь можно переключаться между Alibaba Cloud, Baidu и Tencent прямо из веб-интерфейса.
2Ремонт микрофона: самая частая поломка
Теперь о главном - почему эти роботы часто ломаются. Микрофон. Тот самый МЭМС-микрофон, который стоит копейки и работает соответственно.
Симптомы: робот перестает слышать команды, либо слышит только очень громкую речь. В 80% случаев проблема в микрофоне. В 15% - в аудиокодеке ES7243. В 5% - где-то в пайке.
Как чинить:
- Откручиваете четыре винта на задней панели
- Аккуратно отсоединяете плату от корпуса (там пара разъемов)
- Находите микрофон - маленький квадратный компонент с отверстием
- Выпаиваете старый, впаиваете новый (за 50 рублей с AliExpress)
Если не хотите возиться с пайкой - есть лайфхак. Можно подключить внешний USB-микрофон через переходник. ESP32 его увидит, и качество распознавания улучшится в разы.
С чем сравнить Xiaozhi в 2026 году
Рынок голосовых ассистентов на микроконтроллерах за последние два года сильно изменился. Появились проекты вроде Speekium для полной приватности. Но они требуют либо Raspberry Pi, либо более мощное железо.
| Параметр | Xiaozhi (ESP32) | Raspberry Pi + Speekium | Коммерческие ассистенты |
|---|---|---|---|
| Стоимость | 1500-2000 руб. | 5000+ руб. | 3000-10000 руб. |
| Открытость | Полная (hardware + software) | Только software | Нулевая |
| Ремонтопригодность | Высокая | Средняя | Нулевая |
| Производительность | Базовые команды | Сложная логика | Зависит от модели |
Xiaozhi выигрывает там, где нужна максимальная простота и ремонтопригодность. Хотите научить ребенка основам электроники? Или сделать дешевого ассистента для умного дома? Или просто поиграть с ESP32 без пайки макеток? Это ваш выбор.
Что можно сделать с этим роботом сегодня
Самый частый вопрос: "А зачем он вообще нужен?" Отвечаю примерами:
- Детский проект по программированию - вместо абстрактных "Hello World" ребенок видит реальное устройство, которое отвечает на его команды
- Голосовое управление умным домом - перепрошиваете Xiaozhi, подключаете к Home Assistant, говорите "Включи свет" - свет включается
- Тестовый стенд для голосовых технологий - проверяете, как ваша TTS-модель вроде Qwen3-TTS звучит через реальный динамик
- Донор платформы - берете корпус, кнопки, динамик, выбрасываете плату и ставите свою на базе ESP32-S3
Важный нюанс: последние версии прошивки поддерживают multilingual ASR от Alibaba. Теперь робот понимает не только китайский, но и базовый английский. Для русского придется писать свою прослойку.
Кому стоит покупать Xiaozhi в 2026
Давайте без иллюзий. Это не конкурент Alexa или даже Hey Lama. Это образовательная игрушка с потенциалом.
Берите Xiaozhi, если:
- Хотите понять, как работают голосовые ассистенты "под капотом"
- Ищете платформу для экспериментов с ESP32 и аудио
- Нужен дешевый голосовой интерфейс для своего проекта
- Любите чинить электронику (микрофон точно сломается)
- Преподаете основы IoT и нужен наглядный материал
Не берите, если:
- Ожидаете качества как у коммерческих продуктов
- Не готовы копаться в китайской документации
- Боитесь паяльника и командной строки
- Нужен полноценный ассистент с сложной логикой
Что будет с такими устройствами дальше
Тренд на локальную обработку голоса только набирает обороты. После истории с OpenAI, который перекраивает себя под аудио, все крупные игроки бросились делать свои аудиоустройства. Но они будут закрытыми, дорогими и неремонтопригодными.
Xiaozhi показывает альтернативный путь: дешево, открыто, ремонтопригодно. Да, с кучей компромиссов. Но именно такие устройства становятся полигоном для новых технологий. Кто знает, может через год на ESP32-S3 уже будут запускать упрощенные версии Qwen3-ASR?
Мой прогноз: рынок разделится. С одной стороны - дорогие коммерческие устройства с искуственным интеллектом. С другой - opensource платформы вроде Xiaozhi, которые будут становиться все умнее благодаря сообществу. И выбирать сторону нужно уже сейчас.