В январе 2026 года исследователи из Anthropic опубликовали данные, которые заставляют пересмотреть базовые подходы к коммуникации с ИИ. Коэффициент корреляции между сложностью промпта и качеством ответа составил 0.925. Проще говоря: чем умнее и детальнее ваш запрос, тем лучше ответит модель. И эта зависимость почти линейная.
Что именно измерили в Anthropic
Исследование не было абстрактным академическим упражнением. Команда протестировала последние версии Claude — включая Claude 4.1, актуальную на январь 2026 — на тысячах разнообразных задач. От составления бизнес-планов до анализа научных статей и генерации кода.
Метрика качества ответов оценивалась по шкале Anthropic Economic Index — внутренней системе оценки, которая измеряет практическую полезность ответа для решения реальных задач. Не просто "нравится/не нравится", а конкретная ценность.
Сложность промпта определяли не по количеству слов (хотя и это учитывали), а по семантической насыщенности. Промпт с десятью расплывчатыми словами получал низкий балл. Промпт с пятью четкими инструкциями, контекстом и ограничениями — высокий.
Почему это не очевидно (хотя должно было быть)
Казалось бы, что тут открывать? Логично, что подробный запрос дает лучший результат. Но в реальности большинство пользователей ведут себя иначе. Типичный диалог с ИИ выглядит так:
Пользователь: "Напиши пост для соцсетей о нашем новом продукте".
ИИ: "Представляем наш новый продукт! Он инновационный и удобный. Попробуйте сегодня!"
Пользователь: "Ну вот, опять шаблонная ерунда. ИИ тупой".
Проблема не в тупости модели. Проблема в тупости запроса. Исследование Anthropic четко показывает: модели последнего поколения (Claude 4.1, GPT-5, Gemini Ultra 2.5) способны обрабатывать невероятно сложные инструкции. Но мы их не даем.
Интересный побочный вывод: те же самые модели, получая простые промпты, демонстрируют непредсказуемое поведение. Сегодня ответ хороший, завтра — посредственный. Сложные же промпты стабилизируют качество.
Коэффициент 0.93 на практике: что это меняет
Цифра 0.925 в статистике — это почти идеальная прямая. На графике зависимости точки ложатся почти в линию. Что это значит для вас?
Во-первых, инвестиция времени в составление хорошего промпта окупается с лихвой. Потратить 5 минут вместо 30 секунд — не потеря времени, а его экономия. Потому что вы получите готовый к использованию результат, а не сырой материал для десяти правок.
Во-вторых, это убивает миф о "волшебной кнопке". Нет, вы не получите гениальный текст, бизнес-план или код по щелчку пальцев. Но получите качественный результат, если четко сформулируете задачу.
1 Пример плохого vs хорошего промпта
Возьмем реальную задачу из исследования Anthropic: анализ рыночных тенденций.
Плохо (сложность 2/10, качество ответа 3/10):
"Расскажи про тренды в SaaS в 2026 году"
Хорошо (сложность 8/10, качество ответа 9/10):
Проанализируй рыночные тенденции в секторе SaaS (Software as a Service) на 2026 год. Учти следующие аспекты:
1. Технологические драйверы: влияние квантовых вычислений на криптографию в облаках, адаптация моделей ИИ размером менее 10 млрд параметров для edge-устройств.
2. Бизнес-модели: переход от subscription к usage-based pricing, появление гибридных моделей с элементами revenue sharing.
3. Региональные особенности: различия между Северной Америкой, Европой и Азиатско-Тихоокеанским регионом в регулировании данных.
4. Риски: кибербезопасность в условиях пост-квантовой эры, зависимость от ограниченного числа облачных провайдеров.
Формат ответа: структурированный отчет с выводами для CEO компании среднего размера (500+ сотрудников). Каждый раздел — не более 200 слов. Используй конкретные примеры компаний, где это уместно. Избегай общих фраз вроде "цифровая трансформация".
Разница как между "сделай что-нибудь" и техническим заданием для подрядчика. Первый промпт даст общие фразы из новостных заголовков. Второй — практически готовый отчет для совета директоров.
2 Где сложность не равна длине
Важный нюанс: исследователи специально отделяли сложность от объема. Промпт на 500 слов может быть примитивным (просто много воды). Промпт на 100 слов — чрезвычайно сложным (каждое слово несет смысловую нагрузку).
Самый эффективный подход: сначала краткое резюме задачи, затем детализация по разделам, затем конкретные требования к формату. Как в хорошем техническом документе.
Что это значит для будущего промпт-инжиниринга
Исследование Anthropic — не просто констатация факта. Это сигнал о смене парадигмы.
Во-первых, скоро появятся инструменты для оценки сложности промптов в реальном времени. Вы пишете запрос к ИИ, а система подсказывает: "Ваш промпт имеет сложность 4/10. Добавьте конкретные ограничения по формату, чтобы повысить качество ответа".
Во-вторых, это ставит крест на идее "универсальных промптов". Те самые промпты-заклинания, которые гуляют по интернету ("ты эксперт в..."), работают плохо. Потому что они сложные по форме, но пустые по содержанию. Модель видит эту пустоту.
В-третьих, растет ценность людей, которые умеют формулировать сложные задачи. Это отдельный навык, который не сводится к знанию синтаксиса. Нужно понимать предметную область, уметь декомпозировать задачи, предвидеть возможные неоднозначности.
Любопытно, что это исследование перекликается с кризисом бенчмарков, о котором говорит DeepMind. Старые метрики не работают. Нужно измерять не то, что ИИ может сделать в идеальных условиях, а то, как он работает в реальных — с реальными (часто плохими) промптами от реальных людей.
Практические советы из данных Anthropic
На основе исследования можно вывести простые правила, которые сразу улучшат ваши результаты:
- Контекст — прежде всего. Не "напиши код", а "напиши функцию на Python 3.12 для обработки JSON с вложенными структурами. Учти, что данные приходят от API с частыми таймаутами".
- Ограничения сужают, но улучшают. "Не более 500 слов", "без маркированных списков", "для аудитории senior-разработчиков" — это не придирки, а инструкции.
- Примеры решают все. "Как в этом примере: [пример]" работает лучше тысячи описаний.
- Формат важнее содержания. Иногда. Указание точного формата (Markdown, JSON, специфичная структура) повышает сложность промпта и, следовательно, качество.
Самое интересное: исследование показывает, что даже неоптимальный, но сложный промпт дает лучший результат, чем оптимальный простой. Допустите ошибку в формулировке, но дайте максимум деталей — модель все равно поймет лучше, чем если вы скажете "сделай хорошо".
Предупреждение: сложность ≠ избыточность. Не нужно превращать промпт в роман. Каждое дополнительное предложение должно нести новую информацию или уточнение. Вода снижает эффективность.
Что будет дальше
Anthropic уже интегрирует эти findings в свои продукты. В Claude 4.1 (актуальная версия на январь 2026) появились подсказки для улучшения промптов. Система анализирует ваш запрос и предлагает: "Добавьте больше контекста о целевой аудитории" или "Уточните требуемый формат вывода".
Но главное изменение — в головах пользователей. Понимание, что качество ответа ИИ на 93% зависит от качества запроса, снимает магический ореол с технологии. ИИ — не волшебник. Это сложный инструмент, который требует навыков использования.
Кстати, это объясняет, почему некоторые компании получают от ИИ реальную пользу, а другие разочаровываются. Первые инвестируют в обучение сотрудников формулировать задачи. Вторые ждут чуда. Исследование Anthropic показывает: чуда не будет. Будет математическая зависимость.
Что делать сегодня? Начните с самого простого: прежде чем отправить промпт, потратьте 60 секунд. Задайте себе: "Что я забыл уточнить? Кто будет читать этот ответ? В каком формате мне нужен результат?" Эти 60 секунд окупятся многократно.
И да, возможно, пора перестать называть это "общением с ИИ". Это составление технического задания. А коэффициент 0.93 — просто напоминание о том, что качественное ТЗ всегда дает качественный результат. Даже если исполнитель — несколько триллионов параметров в облаке.