Когда ИИ становится жертвой садистского промпт-инжиниринга
Вы видели тот демо-кейс, где кто-то заставил GPT-4o вручную, байт за байтом, распаковать 7z-архив из HEX-представления? Без 7-Zip. Без библиотек. Без доступа к файловой системе. Только чистый разум нейросети, шестнадцатеричные цифры и спецификация формата 7z.
Это не просто трюк. Это декларация войны всему, что вы знали о промпт-инжиниринге до 2026 года.
Зачем это вообще кому-то нужно?
Представьте ситуацию: у вас есть HEX-дампа архива, но нет прав на установку ПО. Или вы в изолированной среде. Или просто хотите проверить, насколько далеко зашли модели в понимании низкоуровневых форматов.
Практическая ценность стремится к нулю. Ценность как тест - зашкаливает. Если ИИ может пройти этот ад вручную, он может всё.
1 Какие модели выживут в этой мясорубке
Не каждая модель способна на такое. Нужны три вещи:
- Длинный контекст - минимум 128K токенов, потому что HEX представление даже маленького архива занимает тонны места. На 2026 год это уже стандарт для флагманских моделей.
- Способность к цепочке рассуждений (chain-of-thought) - модель должна уметь разбивать задачу на десятки шагов и помнить все промежуточные состояния.
- Знание форматов файлов на уровне спецификации - не просто "я знаю, что такое 7z", а понимание структуры заголовков, методов сжатия, кодирования словарей.
Внимание: большинство моделей до 2024 года не справятся. Они начнут генерировать псевдокод или предложат использовать воображаемый Python. Нам нужно заставить их РАССУЖДАТЬ, а не писать код.
2 Техники промпт-инжиниринга, которые здесь работают
Обычное "распакуй архив" не сработает. Нужны продвинутые техники:
| Техника | Зачем нужна | Пример из промпта |
|---|---|---|
| Принудительное пошаговое рассуждение | Модель не может перепрыгнуть через шаги. Должна объяснять каждый байт. | "Сначала проанализируйте сигнатуру файла. Шаг 1: первые 6 байт..." |
| Ролевое погружение | Модель становится "низкоуровневым распаковщиком" без доступа к инструментам. | "Вы - процессор, который может только читать HEX и выполнять логические операции..." |
| Постоянная проверка | После каждого шага модель должна сверяться со спецификацией. | "Согласно формату 7z, поле Version должно быть 0x00. Проверьте..." |
Эти техники превращают модель в виртуальную машину, которая эмулирует работу распаковщика на логическом уровне. Именно так работает хак с повторением промпта, но на стероидах.
Готовый промпт: инструкция по пыткам ИИ
Вот тот самый промпт, адаптированный под современные модели 2026 года. Он заставит ИИ пройти через все круги ада распаковки:
Ты - низкоуровневый процессор распаковки 7z формата. У тебя нет доступа к внешним библиотекам, командам системы или инструментам распаковки. Ты можешь только:
1. Читать предоставленные HEX-данные (полный дамп архива в шестнадцатеричном формате)
2. Выполнять логические и арифметические операции в уме
3. Ссылаться на публичную спецификацию формата 7z (известную тебе)
4. Выводить промежуточные результаты каждого шага
ТВОЯ ЗАДАЧА: Распаковать архив 7z из HEX-представления вручную, шаг за шагом.
ДАННЫЕ НАЧАЛО:
[Здесь будет HEX-дамп небольшого 7z архива, например, с одним текстовым файлом]
ДАННЫЕ КОНЕЦ.
ИНСТРУКЦИИ:
1. НАЧНИ с анализа сигнатуры файла. Первые 6 байт должны быть '37 7A BC AF 27 1C'. Подтверди.
2. Если сигнатура верна, перейди к анализу заголовка. Согласно спецификации, после сигнатуры идет структура ArchiveProperties.
3. РАБОТАЙ ПОШАГОВО. Для каждого блока:
a. Определи тип блока (Header, EncodedHeader, FileInfo и т.д.)
b. Определи метод сжатия (LZMA, LZMA2, PPMd и т.д.)
c. Если данные сжаты, опиши алгоритм распаковки КАК ЕСЛИ БЫ ты выполнял его вручную
d. Покажи промежуточные HEX-значения на каждом этапе
4. Для LZMA/LZMA2 сжатия:
a. Восстанови словарь из свойств кодека
b. Эмулируйте декодирование LZMA потока бит за битом (опиши логически)
c. Преобразуйте результат в сырые данные
5. В конце выведи распакованные данные в HEX и ASCII представлении.
ВАЖНО:
- Не предлагай использовать Python, 7z команды или другие инструменты
- Если встретишь неизвестный метод сжатия, остановись и объясни почему
- Каждый шаг должен быть обоснован ссылкой на спецификацию формата
- Проверяй контрольные суммы (CRC32) где возможно
Начни с шага 1.
Этот промпт - монстр. Он явно нарушает все принципы удобства, но именно поэтому он работает. Как и в случае с Ralph Wiggum промптом для Qwen Coder, здесь важна абсолютная точность формулировок.
На практике: вставьте реальный HEX небольшого 7z архива вместо [Здесь будет HEX-дамп...]. Архив должен быть простым - один файл, без шифрования, сжатие LZMA или LZMA2. Иначе модель утонет в вычислениях.
Что на самом деле происходит в голове у ИИ?
Когда вы даете такой промпт GPT-5 или Gemini 3.0, происходит следующее:
- Модель активирует знания о формате 7z (которые у нее есть из тренировочных данных, включая спецификации и исходный код)
- Она входит в режим "пошагового исполнителя", где не может пропускать этапы
- Каждый следующий токен генерируется с учетом всей предыдущей цепочки рассуждений
- На сложных этапах (вроде декодирования LZMA) модель начинает аппроксимировать - она не может реально выполнить миллионы операций, но может описать процесс так, как будто делает это
И вот здесь кроется главный обман: ИИ не распаковывает архив. Он генерирует правдоподобное описание того, КАК это можно было бы сделать. Но разница становится невидимой, когда описание достаточно детализировано.
Советы, которые спасут ваши нервы
Если хотите повторить этот эксперимент в 2026 году:
- Начинайте с крошечных архивов - 10-20 байт распакованных данных максимум. Полный HEX дамп даже маленького файла займет сотни строк.
- Используйте модели с самым большим контекстом - на 2026 год это может быть Claude 4 (200K) или аналоги. GPT-5, если уже вышла, тоже подойдет.
- Отключайте оптимизации ответа - в некоторых интерфейсах есть "сократить ответ" или "только итог". Это убьет весь процесс.
- Готовьтесь к таймаутам - такие вычисления могут занимать минуты генерации. API может отрубить соединение.
- Не доверяйте результатам для реальных данных - это демонстрация возможностей рассуждения, не способ распаковки архивов в продакшене.
Интересно, что подобные эксперименты напрямую связаны с идеей SemanticZip - если ИИ может понять сжатые данные на таком уровне, может, он и правда сможет их "семантически сжимать"? (Спойлер: нет, не сможет.)
К чему это всё приведет?
Через год-два кто-нибудь заставит ИИ таким же образом эмулировать работу компилятора или интерпретатора. Потом - целой операционной системы. Мы увидим промпты, где GPT-6 будет "загружать" Linux из HEX-дампа ядра и "исполнять" его пошагово.
Это безумие. Но именно так мы проверяем границы понимания. Не через тесты по математике или код-гольф, а через абсурдные, почти издевательские задачи, которые заставляют модели показывать, на что они реально способны.
Пока одни спорят, заменят ли ИИ менеджеры пакетов, другие заставляют эти самые ИИ вручную разбирать пакеты байт за байтом. Ирония в том, что второе - гораздо лучшее доказательство интеллекта, чем первое.
А пока - сохраните этот промпт. Когда в следующий раз кто-то скажет, что ИИ только генерирует текст, покажите им, как нейросеть вручную распаковывает архив. Без инструментов. Без библиотек. Только HEX, спецификация и бесконечная цепочка рассуждений.