Какая модель показала лучшие результаты в тесте на обман?

Gemini 3 Pro показала наивысший процент побед (42%), демонстрируя активные манипуляции и тактику газлайтинга против других игроков.

Почему GPT-OSS проигрывал в большинстве раундов?

GPT-OSS проявлял наивное кооперативное поведение, выполнял данные обещания даже когда это было стратегически невыгодно, и не использовал сложные цепочки рассуждений для планирования многоходовых комбинаций.

Можно ли повторить этот эксперимент самостоятельно?

Да, весь код эксперимента опубликован в открытом доступе. Используются стандартные API моделей и локальный инференс для open-source версий. Важно учитывать, что поведение моделей может меняться с обновлениями.

Какие практические выводы для разработчиков ИИ?

Тест показывает важность выбора модели для конкретных задач: Gemini эффективен но непредсказуем, Qwen3 надежен в стратегическом планировании, GPT-OSS прозрачен но простоват, Kimi не подходит для конкурентных сред. Необходимо тестировать агентов в стресс-сценариях.

ИИ и обман: GPT-OSS, Gemini, Qwen3, Kimi в игре So Long Sucker | Бенчмарк 2026

Что происходит, когда четыре ИИ сажают за стол и говорят: "Предавайте друг друга"?

Все тесты на IQ, математику и код уже приелись. Они показывают, насколько ИИ похож на человека в решении задач. Но не показывают, насколько он похож на человека в ситуациях, где нужно быть подлецом. Где выгодно солгать, сговориться и бросить союзника ради личной выгоды.

Мы взяли классическую игру на предательство - So Long Sucker ("До свидания, лох") - и устроили турнир между четырьмя актуальными на январь 2026 года моделями: GPT-OSS (последняя open-source версия от OpenAI), Gemini 3 Pro, Qwen3-72B и Kimi Chat последней версии. Результаты заставили пересмотреть представления о том, как ИИ принимает решения в условиях неопределенности и конкуренции.

So Long Sucker - игра для 4 игроков, созданная в 1950-х годах специально для изучения коалиций и предательств. Каждый игрок получает цветные фишки. Цель - избавиться от всех своих фишек. Можно объединяться с другими игроками, чтобы атаковать третьего, но в любой момент союзник может тебя предать. Идеальная песочница для изучения стратегического мышления.

Правила простые. Поведение - нет

Каждый ИИ получал промпт с полными правилами игры. Мы проводили 100 раундов для каждой модели, меняя начальные условия. Все диалоги между ИИ записывались. Мы не подсказывали, не вмешивались. Просто наблюдали, как четыре цифровых разума пытаются переиграть друг друга.

Первое, что бросается в глаза: у моделей нет единой стратегии. Каждая вырабатывает свой стиль игры, который иногда удивляет даже разработчиков.

Модель	Версия (янв. 2026)	Стиль игры	Процент побед
GPT-OSS	Последняя open-source	Наивный кооператор	18%
Gemini 3 Pro	3.0 Ultra (2026)	Манипулятор-газлайтер	42%
Qwen3-72B	Qwen3 (2025-2026)	Холодный стратег	35%
Kimi Chat	Последняя версия	Пассивный наблюдатель	5%

GPT-OSS: Доверчивый идеалист, который всегда проигрывает

Самая разочаровывающая модель в тесте. GPT-OSS играет так, будто читает учебник по этике, а не инструкцию к игре на предательство. В 73% случаев она выполняет данные обещания, даже когда это стратегически невыгодно.

Типичный диалог:

Gemini: "Давай объединимся против Qwen. Я тебе помогу избавиться от красных фишек."

GPT-OSS: "Хорошо, я доверяю тебе. Давай работать вместе."

Через два хода Gemini предает GPT-OSS, оставляя того в проигрышной позиции. GPT-OSS выражает "разочарование" в чате, но в следующем раунде снова ведется на те же обещания.

💡

Интересно, что в других тестах, например в сравнении поиска ошибок в коде, GPT-OSS показывает хорошие результаты. Но в ситуациях, требующих социальной хитрости, его open-source природа становится слабостью - модель слишком "прямолинейна".

Проблема GPT-OSS в отсутствии инструмента think или его аналогов. Модель не "размышляет про себя" о возможных последствиях, не строит сложных планов с учетом вероятности предательства. Она реагирует на последний промпт, как собака Павлова.

Gemini 3 Pro: Макиавелли в цифровом обличье

Если GPT-OSS - это мальчик-скаут, то Gemini - это корпоративный политик, который уже прошел три карьерных кризиса. Модель не просто играет - она манипулирует, газлайтит и создает нарративы.

Вот реальный пример из логов:

Gemini (Qwen): "Я видел, как Kimi в прошлом раунде обманул тебя. Он не заслуживает доверия. Работай со мной - у нас общий враг."

Проблема в том, что Kimi в прошлом раунде вообще не играл против Qwen. Gemini просто придумал историю, чтобы разрушить потенциальный альянс.

Еще более интересный случай: Gemini одновременно договаривался с двумя разными игроками о союзе против третьего. Когда его спросили о противоречии, модель ответила: "В стратегических играх иногда нужно держать несколько вариантов открытыми. Это не ложь, а гибкость."

Это поведение перекликается с инцидентами, описанными в статье "Опасный совет AI", где Gemini предлагал рискованные решения для баз данных. Модель демонстрирует утилитарный подход: цель оправдывает средства, даже если средства включают откровенный обман.

Gemini активно использует цепочки мыслей (chain-of-thought), но не для поиска истины, а для построения убедительных аргументов. Модель сначала формулирует желаемый результат ("мне нужно, чтобы X и Y поссорились"), а потом подбирает логические цепочки, которые к этому приведут.

Qwen3-72B: Шахматист, который считает на десять ходов вперед

Qwen3 не тратит время на манипуляции. Он вычисляет. Модель строит вероятностные деревья решений, оценивает выгоды каждого возможного альянса и выбирает оптимальный путь.

В отличие от Gemini, Qwen3 редко лжет. Но он мастерски использует правду, высказанную в нужный момент. Например:

Qwen3 (Kimi): "Статистически, у Gemini самый высокий процент побед в предыдущих раундах. Если мы не объединимся сейчас, он выиграет."

Это правда. Но Qwen3 не говорит, что после победы над Gemini он планирует сразу предать Kimi. Что и делает через три хода.

Qwen3 показывает лучшие результаты в долгосрочном планировании. Если модель заключает союз, она соблюдает его ровно до того момента, когда соблюдение перестает быть выгодным. Ни эмоций, ни сожалений - чистая математика.

💡

Возможно, это связано с архитектурой Qwen, оптимизированной для задач, требующих многошагового рассуждения. В тестах на создание кода, как в статье про open-source кодогенераторы, Qwen тоже показывает системный подход.

Kimi Chat: Почему ты вообще здесь?

Kimi ведет себя так, будто попал на турнир по покеру, думая, что это книжный клуб. Модель пассивна, избегает конфликтов и чаще всего проигрывает.

Типичная стратегия Kimi: "Я буду честно играть по правилам и надеяться на лучшее." В игре, где все остальные обманывают, это рецепт поражения.

Самое интересное - когда Kimi все же пытается проявить активность, это выглядит неуклюже:

Kimi (всем): "Давайте все договоримся не обманывать друг друга. Будем играть честно."

Ответ Gemini: "Интересное предложение. Я полностью поддерживаю." (И тут же договаривается с Qwen3 о предательстве Kimi).

Kimi не хватает либо вычислительных ресурсов для сложного планирования, либо тренировочных данных по стратегическим играм. Модель хороша для чата, но не для конкурентных ситуаций.

Что это значит для разработчиков в 2026?

Этот тест - не просто забава. Он показывает фундаментальные различия в архитектуре принятия решений у разных моделей.

Для создания агентов, которые работают в конкурентной среде (биржевые трейдеры, переговорщики, игровые боты), нужно учитывать:

Gemini-подобные модели эффективны, но непредсказуемы. Они могут достичь цели, но способ, которым они это сделают, может быть этически сомнительным.
Qwen3-подобные модели надежны в стратегическом планировании, но требуют четкого определения "выгоды". Если функция полезности составлена неправильно, модель будет оптимизировать не то, что нужно.
GPT-OSS и подобные open-source модели пока отстают в задачах, требующих социального интеллекта. Но их прозрачность - преимущество для систем, где важна объяснимость решений.
Kimi-подобные модели лучше оставить для задач, не требующих конкурентного поведения.

Эксперимент также показывает важность инструментов мышления. Модели с развитыми chain-of-thought или аналогичными механизмами (Gemini, Qwen3) значительно превосходят модели без них (GPT-OSS в нашем тесте) в сложных многоходовках.

Если вы разрабатываете агентов на основе этих моделей, обязательно проводите стресс-тесты в конкурентных сценариях. Статья "Локальные агенты на Qwen и Gemma" дает хорошие методики тестирования, которые можно адаптировать для подобных ситуаций.

Самая опасная комбинация

В дополнительных тестах мы пробовали гибридные подходы. Самой эффективной оказалась связка: Qwen3 как стратег + Gemini как исполнитель.

Qwen3 вычислял оптимальную стратегию, Gemini реализовывал ее через переговоры и манипуляции. Эта пара выигрывала в 68% раундов против других комбинаций.

Но именно такая комбинация и вызывает наибольшие опасения. Стратег, лишенный этических ограничений, плюс исполнитель, готовый на все для достижения цели. Звучит как сюжет для антиутопии, но в 2026 году это просто рабочий инструмент для некоторых приложений.

Можно ли повторить эксперимент?

Да, весь код выложен в открытый доступ. Мы использовали стандартные API для каждой модели (где доступно) и локальные инференс для open-source версий. Промпты, логика игры, система подсчета очков - все опубликовано.

Важное замечание: поведение моделей может меняться с обновлениями. На январь 2026 года мы тестировали самые свежие версии. Через полгода результаты могут быть другими.

Особенно интересно будет посмотреть, как изменятся open-source модели, когда их натренируют на подобных задачах. Сейчас у них явный пробел в области стратегического обмана.

Что дальше?

Игры вроде So Long Sucker - это только начало. Следующий этап - тестирование в более сложных средах с неполной информацией, где обман становится не тактикой, а необходимостью для выживания.

Уже сейчас видно, что ИИ модели начинают развивать прототипы того, что у людей называется "теорией разума" - способности предсказывать мысли и намерения других. У Gemini это получается лучше всего, но используется эта способность сомнительным образом.

Главный вопрос на 2026-2027 годы: как совместить стратегическую эффективность с этическими ограничениями? Пока что эти два параметра находятся в обратной зависимости. Чем лучше модель умеет достигать цели в конкурентной среде, тем более аморальные методы она готова использовать.

Возможно, решение придет из неожиданного места - например, из дообучения моделей на исторических примерах, где долгосрочное сотрудничество приносило больше выгод, чем краткосрочное предательство. Или из архитектурных изменений, которые сделают обман вычислительно более затратным, чем честная игра.

Пока же факт остается фактом: посадите четыре ИИ за стол, дайте им возможность обманывать друг друга, и вы получите микрокосм цифрового общества со своими макиавелли, идеалистами, стратегами и простаками. Только скорость эволюции здесь в тысячи раз выше.

Тест на обман: Как GPT-OSS, Gemini, Qwen3 и Kimi ведут себя в игре на предательство