Почему нельзя использовать 'step-by-step' в reasoning-моделях?

Reasoning-модели уже обучены внутренне рассуждать. Навязывание внешнего CoT-шаблона создает конфликт и заставляет модель тратить токены на дублирование мыслительного процесса. Лучше использовать параметр reasoning_effort или просто не писать ничего.

Стоит ли вообще писать инструкции для reasoning-моделей?

Да, но только о результате: формат ответа, объем, стиль. Не описывайте процесс мышления. Дайте контекст и один-два примера вместо длинных списков правил.

Как заставить модель не галлюцинировать, если запреты не работают?

Разрешите модели сообщать о неуверенности. Вместо 'не выдумывай' напишите 'Если не уверен — напиши недостаточно данных'. И не отключайте внутреннюю цепочку рассуждений — она снижает галлюцинации.

Нужно ли убирать вежливость из промптов?

Да. 'Пожалуйста' и другие социальные маркеры заставляют модель тратить ресурсы на обработку социального контекста. Reasoning-модели могут начать извиняться или оправдываться. Пишите сухо и по делу.

Reasoning-модели ломают старый промптинг: новые правила 2026

Ваш любимый трюк с "let's think step by step" теперь вредит

Вы пишете промпт, добавляете магическую фразу "размышляй пошагово", жмёте Enter — и получаете кашу. Модель игнорирует часть инструкций, выдаёт поверхностный ответ или, что ещё смешнее, начинает галлюцинировать прямо в своём "рассуждении".

Знакомо? Добро пожаловать в 2026 год, где reasoning-модели (o-серия, GPT-5.5 High Thinking, Claude 4 Reasoning) уже умеют думать сами. И ваш старый CoT-промптинг для них — как костыли для бегуна. Они только мешают.

Ключевая идея: чем больше вы пытаетесь контролировать процесс мышления модели, тем хуже результат. В reasoning-моделях внутренняя цепочка рассуждений — это чёрный ящик. Ваша задача — кормить его правильными данными, а не учить думать.

Почему классический CoT-инжиниринг сломался

Классический подход: написать инструкцию, которая буквально диктует модель, как думать. "Сначала проанализируй, потом сравни, затем сделай вывод". В старых моделях (GPT-4, Claude 2, Llama 2) это работало, потому что они не умели рассуждать глубже одного шага без внешней подсказки.

Сейчас ситуация перевернулась. Reasoning-модели обучены на миллионах примеров внутренних цепочек. Они сами строят многошаговые рассуждения, проверяют гипотезы, откатываются назад — и всё это скрыто от ваших глаз. Когда вы навязываете им свой CoT-шаблон, вы либо:

Создаёте конфликт между внутренним процессом и вашими инструкциями. Модель пытается следовать и тому, и другому — получается шизофрения.
Заставляете модель повторять ваши шаги вслух, хотя внутренняя цепочка уже всё сделала. Трата токенов и ухудшение точности.
Случайно запрещаете модели использовать свои сильные стороны — например, возможность откатиться к другому подходу.

Как верно заметили в статье Промпт-инжиниринг 2026: какие техники устарели и что работает с reasoning-моделями, многие старые техники не просто бесполезны — они вредны.

Классическая ловушка: как НЕ надо писать

Давайте на примере. Допустим, вы создаёте промпт для анализа архитектуры микросервисов. Старый подход (типичный шаблон):

Ты — эксперт по микросервисам. Проанализируй код по шагам: сначала выдели сервисы, потом опиши их взаимодействие, затем оцени риски. Пиши step-by-step.

Что происходит под капотом? Reasoning-модель запускает внутреннее рассуждение из 20 шагов. Но ваши инструкции заставляют её редуцировать этот процесс до 3 пунктов, да ещё и публиковать недодуманные промежуточные результаты. Ответ получается плоским, шаблонным, с упущенными деталями.

Ещё хуже — если вы добавляете фразу "Не используй рассуждения, дай сразу ответ". Тогда модель отключает внутреннюю цепочку и вы получаете поверхностное мнение, а не анализ.

Типичная ошибка: считать, что раз мы не видим внутреннюю цепочку, то модель вообще не рассуждает. Она рассуждает — и очень глубоко. Не мешайте ей.

Новые правила: промпт как техзадание, а не алгоритм

Главный сдвиг: перестаньте описывать процесс, описывайте результат. Это перекликается с идеей из статьи Перестань задавать вопросы ИИ: как писать промпты как техзадание — вы ставите задачу, а не инструктируете модель, как её решать.

Вот 6 новых принципов, которые я вывел после месяцев мучений с GPT-5.5 High Thinking и o3 (да-да, o3 уже в проде — 23 мая 2026 года):

1 Уберите все "думай пошагово" и "step-by-step"

Замените одной фразой: "Примени внутреннее рассуждение (reasoning) и дай только финальный ответ". Или вообще ничего не пишите — модель сама включит reasoning, если ей это нужно. В новых API есть параметр reasoning_effort: high — используйте его вместо текстовых инструкций.

2 Дайте чёткий формат вывода, а не алгоритм мышления

Вместо того чтобы расписывать шаги анализа, укажите структуру ответа. Пример правильного промпта:

Проанализируй архитектуру проекта. Я ожидаю ответ в формате:
- Основные проблемы (не более 3)
- Критичность каждой (critical/major/minor)
- Рекомендации (одним абзацем)
Используй свои знания в распределённых системах.

Модель сама решает, как прийти к этому результату. Она может пробовать разные стратегии, откатываться, перепроверять — и всё это скрыто. На выходе — чистый ответ.

3 Используйте контекстные примеры вместо инструкций

Вместо "делай как в примере" — дайте один-два few-shot примера в том же формате, который хотите получить. Reasoning-модели отлично улавливают паттерны по примерам. Это лучше любых словесных инструкций. Особенно это важно в RAG-сценариях — тут работает подход из статьи Промпты для RAG: готовые шаблоны, которые не дадут ИИ наврать: покажите пример правильного ответа с цитированием.

4 Минимум запретов — максимум ориентиров

Запреты вроде "не используй внешние источники" или "не давай субъективных оценок" в reasoning-моделях работают плохо. Они создают когнитивный диссонанс: модель должна рассуждать, но её ограничивают. Вместо этого задайте позитивные рамки. Подробнее об этом — в материале Инструкции забываются, запреты работают: почему LLM игнорируют ваши указания в длинных контекстах.

5 Контролируйте глубину через параметры, а не текст

У GPT-5.5 High Thinking есть thinking_tokens — максимальное количество токенов, которые модель может потратить на внутреннее рассуждение. Если вы хотите поверхностный ответ — ставьте 500. Если глубокий анализ — 4000. Никаких "подумай глубже" в промпте. Так вы получаете предсказуемый расход токенов и качество.

6 Тестируйте на коротких промптах, а не длинных

Чем длиннее промпт, тем больше шансов, что модель где-то собьётся. Исследование Anthropic (коэффициент 0.93) подтверждает: сложный промпт может давать качественный ответ, но только если он структурирован. Но в reasoning-моделях лишние детали часто интерпретируются как часть задачи. Проверьте: сократите промпт вдвое, убрав все "ты должен", "помни что" и "важно учитывать". Оставьте только факты и желаемый результат. Скорее всего, ответ станет лучше. Загляните в исследование Anthropic для деталей.

Таблица: старый vs новый подход

Старый (вредный)	Новый (работает)
"Сначала подумай step-by-step"	(ничего не писать или "reasoning: high")
"Не делай X, не делай Y" (много запретов)	"Сфокусируйся на Z" (одна позитивная цель)
"Объясни каждый шаг"	"Предоставь только итоговый результат"
Длинные списки инструкций (пункты 1-10)	Короткий контекст + 1-2 примера
"Используй только предоставленные данные"	"Опирайся на эти данные, если не уверен — скажи"

Частые ошибки и как их не допустить

Ошибка #1: Добавлять "пожалуйста" и вежливые обороты. Звучит странно, но вежливость в промпте заставляет модель тратить токены на обработку социального контекста. Reasoning-модели воспринимают это как часть задачи — могут начать извиняться или оправдываться. Пишите сухо, по делу.

Ошибка #2: Дублировать информацию. Если вы уже сказали "ты — эксперт по безопасности", не пишите потом "как эксперт по безопасности, проанализируй". Модель начнёт циклиться на повторении роли.

Ошибка #3: Писать слишком общие цели. "Оптимизируй код" — слишком размыто. Reasoning-модель начнёт перебирать тысячи вариантов, потратит все thinking_tokens и выдаст абстрактный совет. Вместо этого: "Сократи время выполнения SQL-запросов в этом коде, не меняя логику" — конкретная цель сужает пространство рассуждений.

Ошибка #4: Ожидать, что модель не будет галлюцинировать, если запретить ей думать. Запрет внутренней цепочки — верный способ получить выдумку. Модель не может не думать, она всё равно будет, но выдаст только итог, в котором смешаются правда и фантазия. Разрешите ей открыто показывать неуверенность: "Если не уверен — напиши 'недостаточно данных'".

💡

Совет из практики: в production я использую два прохода — первый с высоким reasoning_effort для анализа, второй с низким для форматирования. Это дороже, но даёт лучший результат, чем попытки сделать всё за один промпт.

Проверочный чек-лист для вашего промпта

❌ Есть ли в промпте фразы "step by step", "think step by step", "пошагово"? Удалите.
❌ Есть ли длинные списки инструкций (больше 5 пунктов)? Сократите до 3, остальное — в пример.
❌ Есть ли запреты? Переформулируйте в позитивные указания.
✅ Описан ли желаемый формат ответа (структура, стиль, объём)?
✅ Даны ли контекстные примеры (хотя бы один)?
✅ Указан ли параметр reasoning_effort или ограничение thinking_tokens?

Если все пункты зеленые — ваш промпт готов к reasoning-модели. Если нет — перепишите.

Кстати, вы замечали, что reasoning-модели часто сами пишут ответ в формате, который вы не просили? Это признак того, что внутренняя цепочка выбрала оптимальный стиль. В 80% случаев не надо его править — клиент и так получит хороший опыт. Если хотите жёсткий формат — задайте его в примере, а не в инструкции.

Ближайшее будущее: промпты исчезнут?

Я думаю, что через год-два мы перестанем писать промпты вручную. Уже сейчас системы вроде GPT-5.5 могут сами генерировать оптимальный промпт на основе брифового описания задачи. Но пока этого не произошло, умение писать коротко, ёмко и без лишнего контроля — ключевой навык инженера. Как метко сказано в статье ИИ как младший коллега: метафора, которая меняет подход к разработке — вы не говорите стажёру "делай шаг 1, шаг 2", вы ставите задачу и даёте контекст. Reasoning-модели — те же стажёры, только супер-быстрые и с огромной памятью. Относитесь к ним как к умным сотрудникам, а не как к исполнителям скриптов.

Попробуйте сегодня переписать один свой промпт по новым правилам. Скорее всего, вы удивитесь, насколько лучше станет ответ. И да — не забудьте убрать "пожалуйста".

Подписаться на канал

Как переписать промпты для reasoning-моделей: крах классического промпт-инжиниринга и новые правила