От научной фантастики к командной строке

Представьте: вы надеваете шапочку с электродами, думаете о чашке кофе, а компьютер печатает "хочу кофе". Звучит как сцена из футуристического триллера, но это уже реальность — просто очень сырая и с кучей ограничений.

ZUNA от Zyphra — одна из первых моделей, которые можно скачать и попробовать прямо сейчас. Не в облаке за $1000 в час, а локально, на своем железе. Лицензия Apache 2.0 означает, что можно ковырять код, дорабатывать и даже коммерциализировать. И да, это работает. Ну, как работает...

На февраль 2026 года ZUNA остается одной из немногих полностью открытых моделей для декодирования мыслей из EEG. Большинство аналогичных разработок — либо закрытые коммерческие проекты, либо академические исследования без рабочего кода.

Что умеет эта штука на самом деле

Забудьте про голливудские сцены, где герой мысленно пишет роман. Реальность скромнее:

Преобразует сигналы ЭЭГ в текст во время внутренней речи (когда вы мысленно проговариваете слова)
Работает с данными от стандартных медицинских EEG-систем
380 миллионов параметров — достаточно компактно для локального запуска
Поддерживает контекст до 4096 токенов
Требует предварительной калибровки под конкретного пользователя (да, под каждого нужно обучать отдельно)

Точность? В лучших условиях — около 40-50% на небольших словарях. То есть из 10 слов модель угадает 4-5. Не впечатляет? Но это в разы лучше случайного угадывания. Для сравнения: год назад аналогичные модели показывали 20-30%.

💡

ZUNA не читает мысли в прямом смысле. Она распознает паттерны мозговой активности, связанные с внутренней речью. Если вы просто представляете картинку или эмоцию — модель не сработает. Нужно именно мысленно проговаривать слова.

С чем конкурирует ZUNA

Инструмент	Лицензия	Точность	Особенности
ZUNA (Zyphra)	Apache 2.0	40-50%	Полностью open-source, локальный запуск
Neuralink BCI	Проприетарная	~70% (заявлено)	Инвазивные импланты, не для дома
Meta BCIs	Исследовательская	~45%	Только для внутренних исследований
OpenBCI + GPT	Разные	30-40%	Самодельные решения, сложная настройка

Главное преимущество ZUNA — доступность. Neuralink требует хирургической операции, коммерческие решения стоят десятки тысяч долларов, а тут — скачал и попробовал. Конечно, если есть EEG-оборудование (а оно тоже не из дешевых).

Железо: что нужно для запуска

Самое неприятное в BCI-технологиях — требования к оборудованию. ZUNA не исключение:

EEG-система с минимум 64 каналами (идеально — 128+)
Частота дискретизации от 500 Гц
GPU с 16+ ГБ памяти (RTX 4080/4090 или аналоги)
32 ГБ оперативной памяти
Python 3.10+

Да, это не та штука, которую запустишь на ноутбуке за $500. Но если у вас уже есть мощная рабочая станция для локальных AI-моделей, то половина пути пройдена.

Внимание: EEG-оборудование — это не игрушка. Медицинские системы стоят от $10,000, исследовательские — от $3,000. Плюс нужны электроды, гель и умение правильно все это надеть. Без этого ZUNA — просто красивая теория.

Установка: от слов к делу

1Подготовка окружения

Клонируем репозиторий и ставим зависимости:

git clone https://github.com/zyphra/ZUNA
cd ZUNA
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
pip install -r requirements.txt

Torch нужно ставить отдельно — в requirements.txt часто указывают устаревшие версии. Проверьте совместимость CUDA с вашей видеокартой.

2Загрузка модели

Модель весит около 1.5 ГБ. Качаем с Hugging Face:

from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "zyphra/ZUNA-380M"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name, torch_dtype=torch.float16)

Используем float16 для экономии памяти. Если GPU слабоват — можно попробовать 8-битную квантизацию, но точность упадет.

3Подготовка EEG-данных

Вот здесь начинается самое сложное. ZUNA ожидает данные в определенном формате:

# Пример загрузки и предобработки EEG-сигналов
import numpy as np
from scipy import signal

def preprocess_eeg(raw_data, sampling_rate=500):
    # Фильтрация 1-40 Гц (типичный диапазон для речевой активности)
    b, a = signal.butter(4, [1, 40], btype='band', fs=sampling_rate)
    filtered = signal.filtfilt(b, a, raw_data, axis=1)
    
    # Нормализация для каждого канала
    normalized = (filtered - np.mean(filtered, axis=1, keepdims=True)) \
                 / (np.std(filtered, axis=1, keepdims=True) + 1e-8)
    
    return normalized

Если у вас нет своих данных — используйте публичные датасеты вроде OpenNeuro. Но учтите: для реальной работы нужна калибровка под конкретного человека.

4Инференс: от сигналов к словам

# Преобразование EEG в эмбеддинги и генерация текста
eeg_embeddings = model.encode_eeg(processed_eeg_data)

# Генерация текста с учетом контекста
input_ids = tokenizer.encode("Предыдущий контекст: ", return_tensors="pt")
generated = model.generate(
    inputs_embeds=eeg_embeddings,
    input_ids=input_ids,
    max_length=50,
    temperature=0.7,
    do_sample=True
)

text = tokenizer.decode(generated[0], skip_special_tokens=True)

Temperature 0.7 дает баланс между креативностью и точностью. Для медицинских применений лучше 0.3-0.5.

Кому это вообще нужно?

ZUNA — не для всех. Вот кто получит от нее реальную пользу:

Исследователи в нейронауках — для экспериментов с декодированием речи
Разработчики систем коммуникации для людей с нарушениями речи (БАС, инсульт)
Энтузиасты BCI, у которых уже есть оборудование и желание ковыряться в коде
Студенты нейроинформатики — как учебный проект

Если вы просто хотите поиграть с AI — лучше посмотрите на Qwen3-Coder-Next или Gemma 3. Там хотя бы не нужно покупать EEG-шапочку за $5000.

Подводные камни (их много)

ZUNA — прорывная технология, но с кучей оговорок:

Требует калибровки — минимум 30 минут записи EEG, пока вы мысленно повторяете слова
Чувствительна к артефактам — моргание, движение глаз, мышечная активность все портят
Работает только с внутренней речью — не пытайтесь декодировать абстрактные мысли
Ограниченный словарь — в оригинальной работе использовали 50-100 слов
Нужны чистые EEG-данные — домашние EEG-гарнитуры вроде Muse дают слишком шумный сигнал

Самая большая проблема — воспроизводимость. То, что работает в лаборатории с идеальными условиями, может полностью сломаться в реальной комнате с фоновым шумом и неидеальным контактом электродов.

Что дальше? Будущее, которое уже здесь

ZUNA — первый шаг. На февраль 2026 года уже появляются более продвинутые архитектуры:

Мультимодальные модели, комбинирующие EEG с fNIRS (оптическая нейровизуализация)
Few-shot learning — калибровка за 5-10 минут вместо 30
Адаптивные системы, которые учатся на лету, подстраиваясь под пользователя
Интеграция с языковыми моделями типа Llama 3.3 для улучшения контекста

Через 2-3 года подобные системы могут стать достаточно точными для повседневного использования людьми с ограниченными возможностями. А через 5 — возможно, появится первый коммерческий BCI-интерфейс для массового рынка.

Пока же ZUNA остается инструментом для исследователей и энтузиастов. Сложным, требовательным, но невероятно перспективным. Как первые компьютеры, которые занимали целую комнату и умели только вычислять таблицы.

Совет напоследок: если решитесь экспериментировать — начните с публичных датасетов. Купить EEG-оборудование, не понимая, как с ним работать, все равно что приобрести Ferrari без прав. Дорого, красиво, но бесполезно.

ZUNA: читать мысли через EEG стало проще, чем кажется (Apache 2.0)