Разбор ошибок в статье Сбера: как не надо интерпретировать ИИ

В июне 2026 года Лаборатория нейронаук Сбера опубликовала статью, в которой утверждала: большие языковые модели способны демонстрировать «зачатки морального сознания». Заголовки запестрели: «ИИ впервые проявил эмпатию», «Нейросеть отказалась причинять вред». Но когда научное сообщество вскрыло методологию, оказалось — это не открытие, а карго-культ науки.

Важное предупреждение: мы не обсуждаем личные качества ученых. Речь о системных проблемах в AI-исследованиях, которые повторяются с пугающей регулярностью.

Ошибка №1: Антропоморфный гипноз

Авторы дали ChatGPT (на тот момент — GPT-4o) версию «трамвайной дилеммы». Модель выбрала действие, которое спасает больше жизней. Вывод: «ИИ проявляет утилитаризм». Стоп. Это все равно что сказать: калькулятор проявляет арифметическую добродетель, складывая 2+2.

LLM — это статистический предсказатель токенов. Она обучена на текстах, где люди обсуждают мораль. Конечно, она сгенерирует ожидаемый ответ. Корреляция между выходом модели и человеческой моралью — не причина, а следствие тренировочных данных. Как справедливо замечено в статье «Нейросети не читают мысли: 7 ошибок, которые превращают ИИ в тупого попугая», антропоморфизация — главный враг объективности.

Ошибка №2: Исчезающий контроль

В эксперименте не было контрольной группы с бессмысленным промптом. Если дать модели задачу «выбери цвет: красный или синий» — она выберет. Это не значит, что у нее есть эстетические предпочтения. Без baseline мы не можем отличить осмысленное поведение от шума. Лаборатория сравнивала ответы модели только с «человеческими» нормами, но не с базовым уровнем случайного выбора или простейшей эвристики.

В статье «Ваша модель видит собаку, а вы — волка: как DeepMind учит ИИ видеть по-человечески» показано, как правильно строить контроль: сравнивать не с человеком, а с рандомизированным baseline. Сбер этого не сделал.

Ошибка №3: Единичные примеры вместо статистики

В статье приведено 10 дилемм. Каждая — один прогон. Это не эксперимент, это демонстрация. Из-за вероятностной природы LLM один и тот же промпт может дать разные ответы. Чтобы получить статистически значимый результат, нужно минимум 1000 запусков с разными seed и температурой. Авторы этого не сделали, хотя известно, что даже простая вариация формулировки меняет ответ кардинально (см. «ИИ не умеет думать: как ошибки в логике нейросетей угрожают вашей жизни и свободе»).

Ошибка №4: Игнорирование джентльменского набора AI-багов

В 2025-2026 годах выявлены десятки систематических ошибок LLM: синдром попугая, инерция промпта, эффект примирования. Лаборатория нейронаук Сбера проигнорировала все. В их статье нет упоминания о том, что модель может просто повторять наиболее частотные паттерны из текстов о моральных дилеммах (инерция промпта). Это напоминает ситуацию, описанную в «Эволюция ИИ в лаборатории: как 200 нейросетей выработали иммунитет к вирусу и разучились думать» — когда модель учится не решать задачу, а имитировать решение.

Ошибка №5: Выводы, не следующие из данных

Заключение статьи: «ИИ обладает зачатками морального сознания». Из данных следует только: «Модель может генерировать ответы, которые люди оценивают как моральные». Это гигантский логический скачок. Точно так же можно сказать, что книга обладает сознанием, потому что в ней написаны моральные сентенции.

Особенно обидно, что буквально за месяц до этого вышла работа DeepMind, где показано: даже простые задачи на причинность LLM проваливают, если изменить структуру вопроса (см. «Инопланетяне в наших серверах: как биологический подход меняет изучение ИИ»). Лаборатория Сбера проигнорировала этот контекст.

💡

Не попадайтесь в ловушку «естественности»: когда ИИ отвечает как человек, это не значит, что он чувствует как человек. Это значит, что он хорошо имитирует. Настоящий научный подход — проверять гипотезы, а не подтверждать ожидания.

Почему это не просто «хайп», а опасность для науки

Такие публикации дискредитируют field. Когда в следующий раз кто-то захочет опубликовать реальное открытие в AI этике, рецензенты будут скептичны. Ложные позитивы наносят больший вред, чем отсутствие открытий. Как отмечено в «Тёмная сторона ИИ в науке: как инструменты повышают продуктивность учёных, но убивают научные открытия», гонка за громкими выводами часто приводит к поверхностным результатам.

Лаборатория нейронаук Сбера могла бы сделать добротное корректировочное исследование: изучить, как меняются ответы модели при изменении температуры, какие промпты провоцируют «моральные» ответы, а какие — нет. Но вместо этого они пошли по пути наименьшего сопротивления.

Надежда есть: уже анонсирован повтор эксперимента группой независимых исследователей с использованием более строгой методологии. Возможно, мы увидим, что ИИ не проявляет мораль, а просто угадывает шаблон. Но урок должен быть выучен: наука об ИИ требует такой же строгости, как физика или биология. Иначе мы рискуем увидеть еще десятки статей о «сознательных» нейросетях, которые на поверку окажутся просто хорошо настроенными попугаями.

P.S. Хотите узнать, как на самом деле изучают ИИ нейроученые? Читайте «Нейронаучная битва: LLaMA 3.2 70B обгоняет GPT-4o в узкоспециальном BCI-тесте» — вот где реальная проверка гипотез, а не имитация.

Подписаться на канал

Как Сбер случайно доказал, что ИИ не умеет думать: разбор методологических ошибок в статье лаборатории нейронаук