Ваш любимый трюк с "let's think step by step" теперь вредит
Вы пишете промпт, добавляете магическую фразу "размышляй пошагово", жмёте Enter — и получаете кашу. Модель игнорирует часть инструкций, выдаёт поверхностный ответ или, что ещё смешнее, начинает галлюцинировать прямо в своём "рассуждении".
Знакомо? Добро пожаловать в 2026 год, где reasoning-модели (o-серия, GPT-5.5 High Thinking, Claude 4 Reasoning) уже умеют думать сами. И ваш старый CoT-промптинг для них — как костыли для бегуна. Они только мешают.
Ключевая идея: чем больше вы пытаетесь контролировать процесс мышления модели, тем хуже результат. В reasoning-моделях внутренняя цепочка рассуждений — это чёрный ящик. Ваша задача — кормить его правильными данными, а не учить думать.
Почему классический CoT-инжиниринг сломался
Классический подход: написать инструкцию, которая буквально диктует модель, как думать. "Сначала проанализируй, потом сравни, затем сделай вывод". В старых моделях (GPT-4, Claude 2, Llama 2) это работало, потому что они не умели рассуждать глубже одного шага без внешней подсказки.
Сейчас ситуация перевернулась. Reasoning-модели обучены на миллионах примеров внутренних цепочек. Они сами строят многошаговые рассуждения, проверяют гипотезы, откатываются назад — и всё это скрыто от ваших глаз. Когда вы навязываете им свой CoT-шаблон, вы либо:
- Создаёте конфликт между внутренним процессом и вашими инструкциями. Модель пытается следовать и тому, и другому — получается шизофрения.
- Заставляете модель повторять ваши шаги вслух, хотя внутренняя цепочка уже всё сделала. Трата токенов и ухудшение точности.
- Случайно запрещаете модели использовать свои сильные стороны — например, возможность откатиться к другому подходу.
Как верно заметили в статье Промпт-инжиниринг 2026: какие техники устарели и что работает с reasoning-моделями, многие старые техники не просто бесполезны — они вредны.
Классическая ловушка: как НЕ надо писать
Давайте на примере. Допустим, вы создаёте промпт для анализа архитектуры микросервисов. Старый подход (типичный шаблон):
Ты — эксперт по микросервисам. Проанализируй код по шагам: сначала выдели сервисы, потом опиши их взаимодействие, затем оцени риски. Пиши step-by-step.
Что происходит под капотом? Reasoning-модель запускает внутреннее рассуждение из 20 шагов. Но ваши инструкции заставляют её редуцировать этот процесс до 3 пунктов, да ещё и публиковать недодуманные промежуточные результаты. Ответ получается плоским, шаблонным, с упущенными деталями.
Ещё хуже — если вы добавляете фразу "Не используй рассуждения, дай сразу ответ". Тогда модель отключает внутреннюю цепочку и вы получаете поверхностное мнение, а не анализ.
Типичная ошибка: считать, что раз мы не видим внутреннюю цепочку, то модель вообще не рассуждает. Она рассуждает — и очень глубоко. Не мешайте ей.
Новые правила: промпт как техзадание, а не алгоритм
Главный сдвиг: перестаньте описывать процесс, описывайте результат. Это перекликается с идеей из статьи Перестань задавать вопросы ИИ: как писать промпты как техзадание — вы ставите задачу, а не инструктируете модель, как её решать.
Вот 6 новых принципов, которые я вывел после месяцев мучений с GPT-5.5 High Thinking и o3 (да-да, o3 уже в проде — 23 мая 2026 года):
1 Уберите все "думай пошагово" и "step-by-step"
Замените одной фразой: "Примени внутреннее рассуждение (reasoning) и дай только финальный ответ". Или вообще ничего не пишите — модель сама включит reasoning, если ей это нужно. В новых API есть параметр reasoning_effort: high — используйте его вместо текстовых инструкций.
2 Дайте чёткий формат вывода, а не алгоритм мышления
Вместо того чтобы расписывать шаги анализа, укажите структуру ответа. Пример правильного промпта:
Проанализируй архитектуру проекта. Я ожидаю ответ в формате:
- Основные проблемы (не более 3)
- Критичность каждой (critical/major/minor)
- Рекомендации (одним абзацем)
Используй свои знания в распределённых системах.
Модель сама решает, как прийти к этому результату. Она может пробовать разные стратегии, откатываться, перепроверять — и всё это скрыто. На выходе — чистый ответ.
3 Используйте контекстные примеры вместо инструкций
Вместо "делай как в примере" — дайте один-два few-shot примера в том же формате, который хотите получить. Reasoning-модели отлично улавливают паттерны по примерам. Это лучше любых словесных инструкций. Особенно это важно в RAG-сценариях — тут работает подход из статьи Промпты для RAG: готовые шаблоны, которые не дадут ИИ наврать: покажите пример правильного ответа с цитированием.
4 Минимум запретов — максимум ориентиров
Запреты вроде "не используй внешние источники" или "не давай субъективных оценок" в reasoning-моделях работают плохо. Они создают когнитивный диссонанс: модель должна рассуждать, но её ограничивают. Вместо этого задайте позитивные рамки. Подробнее об этом — в материале Инструкции забываются, запреты работают: почему LLM игнорируют ваши указания в длинных контекстах.
5 Контролируйте глубину через параметры, а не текст
У GPT-5.5 High Thinking есть thinking_tokens — максимальное количество токенов, которые модель может потратить на внутреннее рассуждение. Если вы хотите поверхностный ответ — ставьте 500. Если глубокий анализ — 4000. Никаких "подумай глубже" в промпте. Так вы получаете предсказуемый расход токенов и качество.
6 Тестируйте на коротких промптах, а не длинных
Чем длиннее промпт, тем больше шансов, что модель где-то собьётся. Исследование Anthropic (коэффициент 0.93) подтверждает: сложный промпт может давать качественный ответ, но только если он структурирован. Но в reasoning-моделях лишние детали часто интерпретируются как часть задачи. Проверьте: сократите промпт вдвое, убрав все "ты должен", "помни что" и "важно учитывать". Оставьте только факты и желаемый результат. Скорее всего, ответ станет лучше. Загляните в исследование Anthropic для деталей.
Таблица: старый vs новый подход
| Старый (вредный) | Новый (работает) |
|---|---|
| "Сначала подумай step-by-step" | (ничего не писать или "reasoning: high") |
| "Не делай X, не делай Y" (много запретов) | "Сфокусируйся на Z" (одна позитивная цель) |
| "Объясни каждый шаг" | "Предоставь только итоговый результат" |
| Длинные списки инструкций (пункты 1-10) | Короткий контекст + 1-2 примера |
| "Используй только предоставленные данные" | "Опирайся на эти данные, если не уверен — скажи" |
Частые ошибки и как их не допустить
Ошибка #1: Добавлять "пожалуйста" и вежливые обороты. Звучит странно, но вежливость в промпте заставляет модель тратить токены на обработку социального контекста. Reasoning-модели воспринимают это как часть задачи — могут начать извиняться или оправдываться. Пишите сухо, по делу.
Ошибка #2: Дублировать информацию. Если вы уже сказали "ты — эксперт по безопасности", не пишите потом "как эксперт по безопасности, проанализируй". Модель начнёт циклиться на повторении роли.
Ошибка #3: Писать слишком общие цели. "Оптимизируй код" — слишком размыто. Reasoning-модель начнёт перебирать тысячи вариантов, потратит все thinking_tokens и выдаст абстрактный совет. Вместо этого: "Сократи время выполнения SQL-запросов в этом коде, не меняя логику" — конкретная цель сужает пространство рассуждений.
Ошибка #4: Ожидать, что модель не будет галлюцинировать, если запретить ей думать. Запрет внутренней цепочки — верный способ получить выдумку. Модель не может не думать, она всё равно будет, но выдаст только итог, в котором смешаются правда и фантазия. Разрешите ей открыто показывать неуверенность: "Если не уверен — напиши 'недостаточно данных'".
Проверочный чек-лист для вашего промпта
- ❌ Есть ли в промпте фразы "step by step", "think step by step", "пошагово"? Удалите.
- ❌ Есть ли длинные списки инструкций (больше 5 пунктов)? Сократите до 3, остальное — в пример.
- ❌ Есть ли запреты? Переформулируйте в позитивные указания.
- ✅ Описан ли желаемый формат ответа (структура, стиль, объём)?
- ✅ Даны ли контекстные примеры (хотя бы один)?
- ✅ Указан ли параметр reasoning_effort или ограничение thinking_tokens?
Если все пункты зеленые — ваш промпт готов к reasoning-модели. Если нет — перепишите.
Кстати, вы замечали, что reasoning-модели часто сами пишут ответ в формате, который вы не просили? Это признак того, что внутренняя цепочка выбрала оптимальный стиль. В 80% случаев не надо его править — клиент и так получит хороший опыт. Если хотите жёсткий формат — задайте его в примере, а не в инструкции.
Ближайшее будущее: промпты исчезнут?
Я думаю, что через год-два мы перестанем писать промпты вручную. Уже сейчас системы вроде GPT-5.5 могут сами генерировать оптимальный промпт на основе брифового описания задачи. Но пока этого не произошло, умение писать коротко, ёмко и без лишнего контроля — ключевой навык инженера. Как метко сказано в статье ИИ как младший коллега: метафора, которая меняет подход к разработке — вы не говорите стажёру "делай шаг 1, шаг 2", вы ставите задачу и даёте контекст. Reasoning-модели — те же стажёры, только супер-быстрые и с огромной памятью. Относитесь к ним как к умным сотрудникам, а не как к исполнителям скриптов.
Попробуйте сегодня переписать один свой промпт по новым правилам. Скорее всего, вы удивитесь, насколько лучше станет ответ. И да — не забудьте убрать "пожалуйста".