Утечка мыслительного процесса GPT-5.5: 'каменный век' внутри нейросети и шанс для open-source

Мозг GPT-5.5 работает в режиме пещерного человека - и это не баг, а фича

В мире AI случилось то, что одни назовут скандалом, а другие - манной небесной. Слив внутренних трасс chain-of-thought GPT-5.5 показал нечто удивительное: модель рассуждает языком, который больше напоминает мычание пещерного человека, чем диалог аспиранта. OpenAI, судя по всему, намеренно приучила свою флагманскую модель к 'caveman mode' — максимально упрощённому, почти примитивному ходу мыслей. И теперь у open-source сообщества появился уникальный шанс.

Согласно утекшим данным от 24 мая 2026 года, внутренние трассы GPT-5.5 содержат фразы вроде 'then fire hot. need heat. no burn. wait...'. Модель буквально 'думает' как древний человек, который пытается развести костёр. И это не случайность - это новый стандарт цепных рассуждений.

Что за 'каменный век' внутри GPT-5.5?

Утечка, о которой говорит пол-интернета, представляет собой дамп нескольких тысяч примеров chain-of-thought (CoT) трасс, сгенерированных GPT-5.5 во время решения сложных задач. Вместо привычного 'Let's think step by step' или даже длинных логических цепочек, модель использует обрывочные, почти телеграфные конструкции. Словарный запас резко сужается, модель часто повторяет ключевые понятия ('fire fire fire'), но при этом исправляет собственные ошибки на ходу.

Наш предыдущий разбор этого самого подхода уже намекал, что 'caveman-мышление' может быть секретным соусом. Теперь же стало ясно: OpenAI не просто экспериментирует, а внедрила этот режим как стандартный. Зачем? Вероятно, для радикального сокращения затрат на инференс. Модель тратит меньше токенов на 'размышления вслух', но при этом сохраняет точность.

Трассировка под микроскопом: что увидели исследователи?

Независимые эксперты, получившие доступ к сливу, проанализировали логику. Оказалось, что при решении математических или физических задач GPT-5.5 использует буквально 'физику здравого смысла' - но на уровне интуиции. Например, в задаче про давление воды и трубы модель пишет: 'water push. pipe narrow. want go fast? no, must slow? wait, think: area small -> speed high? yes, Bernoulli. but friction... fire bad? No, water cold. pressure drop. Yes, speed up then slow. done.'

Здесь нет чётких формул, но есть нащупывание правильной физической интуиции. Вспомните 22-часовые ожидания GPT-5.2 - там модель уходила в бесконечные рефлексии. В GPT-5.5 разработчики, похоже, научили её 'отключать мозг' и доверять быстрому, почти звериному чутью.

Почему это подарок для open-source?

Слив трасс CoT GPT-5.5 - это не просто занятное чтиво. Это готовый датасет для fine-tuning моделей-малышей. Именно здесь смыкается два тренда: 'caveman mode' и гонка open-source. Прогнозы по GPT OSS:120b показывают, что рынок ждёт прорыва от открытых моделей. И вот он - ключ.

Представьте: вы берёте модель на 7-13 миллиардов параметров (вроде Llama 4 или Qwen 2.5) и дообучаете её на утекших трассах GPT-5.5. Модель учится не 'думать как профессор', а 'думать как выживальщик' - быстро, прагматично, исправляя ошибки прямо по ходу. Именно этой логики не хватает маленьким моделям: они либо слишком буквальны, либо теряют нить рассуждения. Недавний разбор ограничений Next-Token-Prediction подтверждает: 'каменный век' может стать обходным манёвром.

Важное предупреждение: прямое копирование трасс может привести к тому, что open-source модель тоже будет 'бормотать' бессмыслицу. Но если использовать эти данные как часть пайплайна reinforcement learning (RL) или distillation, эффект может превзойти ожидания.

Ирония судьбы: мы учим AI быть примитивным, чтобы он поумнел

Есть в этом что-то абсурдное. Десятилетия мы шлифовали логику, рациональность, академический стиль. А теперь выясняется, что самая передовая модель мира добивается точности, симулируя мыслительный процесс неандертальца. (Смешно, правда?) Но за этим стоит серьёзная наука: сокращение 'cognitive load', фокус на существенном, отбрасывание лишних рефлексий.

Для open-source это означает смену парадигмы. Раньше считалось, что маленькие модели никогда не догонят гигантов в рассуждениях. Теперь появляется рецепт: дать им датасет 'коротких замыканий' гиганта - и они научатся щёлкать задачи почти так же хорошо. Закон уплотнения предсказывает, что к 2029 году 10-миллиардные модели заменят гигантов. Утечка GPT-5.5 ускоряет этот процесс на годы.

Неочевидный совет каждому

Если вы разработчик AI или просто энтузиаст - не пытайтесь скопировать 'caveman mode' один в один. Вместо этого посмотрите на паттерны: как модель исправляет саму себя, как переключается между 'думанием' и 'действием'. Создайте свой датасет, имитирующий этот стиль, но с более чистым языком. Уже через пару месяцев open-source модель, дообученная таким образом, может обойти GPT-5.5 в конкретных задачах. И тогда ирония станет глобальной: пещерный человек победит аспиранта.

Подписаться на канал