PAD+ AI: когнитивная архитектура для LLM — фазы и инженерный подход | AiManual
AiManual Logo Ai / Manual.
05 Июл 2026 Новости

PAD+ AI: когнитивная архитектура для LLM — обзор фаз и инженерный подход

Разбираем PAD+ AI — когнитивную архитектуру для LLM, которая решает проблему пассивности моделей. Фазы восприятия, действия и принятия решений.

Искусственный интеллект наконец-то перестанет быть просто «болтуном»?

Вы задаёте ChatGPT сложный вопрос — и получаете идеально структурированный ответ на пять страниц. Но когда просите сделать реальное действие — написать код, спланировать проект, выполнить многошаговый сценарий — модель тупит, теряет нить или просто отвечает: «Я не могу этого сделать». Знакомо? Это не баг, это архитектура. Мы уже писали о фундаментальном изъяне LLM: они отлично понимают цель, но не имеют встроенного механизма для её достижения. PAD+ AI (Perception-Action-Decision plus) — это когнитивная архитектура, которая пытается закрыть этот пробел.

Суть PAD+ не в том, чтобы заставить LLM «думать» как человек, а в том, чтобы разбить процесс обработки запроса на три чёткие фазы: восприятие (Perception), принятие решений (Decision) и действие (Action). Каждая фаза — отдельный инженерный этап со своими инструментами, памятью и правилами.

Фаза 1: Восприятие — перестаньте кормить модель сырым контекстом

Первое, что делает PAD+ — это не просто кидает пользовательский запрос в LLM. Архитектура на лету строит структурированное представление контекста. Вместо одного огромного окна в 200K токенов (которое, как мы знаем, деградирует к середине) PAD+ использует иерархию: глобальная цель, текущий шаг, факты из внешней памяти, интенты пользователя.

Это напоминает ETL-пайплайн для семантики, о котором мы рассказывали ранее. Только здесь данные — не таблицы, а смыслы. PAD+ применяет мультиагентный парсинг: один лёгкий LLM выделяет сущности, другой оценивает тональность, третий проверяет противоречия. Результат — чистая структура Perception, готовая к анализу.

💡
Ключевой инсайт: на фазе восприятия PAD+ не пытается сразу ответить. Он задаёт уточняющие вопросы сам себе — галлюцинации отсекаются на этапе фильтрации фактов.

Фаза 2: Принятие решений — где рождается проактивность

Вот здесь происходит то, чего не хватает обычным LLM. Decision-фаза — это не генерация текста, а выбор действия из пространства возможностей. PAD+ использует комбинацию: маленькая специализированная модель (например, детерминированный классификатор) + большая LLM для сложных сценариев. Первая срабатывает за миллисекунды на рутинные запросы, вторая подключается, когда контекст неоднозначен.

Архитектура гибридного AI (детерминика + нейросеть) здесь работает безупречно — мы уже обсуждали этот подход в Enterprise-решениях. Но PAD+ идёт дальше: он вводит когнитивную карту — граф решений, который строится динамически. Каждый узел — возможное действие, ребро — вес на основе успешности предыдущих попыток. И да, эта карта использует Agent Skills — упакованные знания, а не сырые промпты.

Самое смешное: никакого «reasoning» в привычном понимании. PAD+ не заставляет LLM рассуждать вслух (как Chain-of-Thought). Вместо этого он использует итеративное принятие решений с обратной связью от внешней среды. Если первый шаг не приблизил к цели — архитектура откатывается и пробует альтернативу. Это напоминает фреймворки вроде KEF, но без миллионных бюджетов на обучение.

Фаза 3: Действие — от слов к делу без потери контекста

Action — самая техническая часть. PAD+ не генерирует текст «для красоты». Он выполняет конкретные инструменты (tool calling, API-вызовы, операции с файлами). И здесь критически важна процедурная память — навыки, которые модель может вызвать без загрузки в контекст. Мы уже разбирали разницу между декларативной и процедурной памятью в LLM. PAD+ явно разделяет их: факты живут в векторной базе, навыки — в отдельном реестре действий с версионированием.

Что это даёт на практике? Например, AI-coding помощник, который не забывает архитектуру проекта через пять шагов. Или Enterprise-система, которая выполняет регламентные операции, не теряя нить compliance. Архитектура проектирования ИИ-кодирования с ростом контекстного окна получает естественное продолжение: окно не нужно растить, если действие выполняется в отдельной изолированной фазе.

Безопасность PAD+ строится на принципе «низких привилегий»: на фазе действия модель получает ровно те API-ключи, которые нужны для текущего шага. Никакого полного доступа к базе знаний или коду.

Инженерный подход: сборка пазла

PAD+ — это не готовый продукт, а набор принципов. На практике вы комбинируете: лёгкий классификатор для Perception (типа DistilBERT или современные 2026-релизы), решающее дерево с MCTS для Decision и очередь инструментов для Action. Память — смесь векторной БД и SQL для процедурных навыков. Вся архитектура заворачивается в обёртку с поддержкой Tool Calling — необязательно гонять облачные API, можно поднять локально.

Звучит сложно? Да. Но альтернатива — всё тот же «болтливый» LLM, который описывает решение, но не делает. PAD+ превращает модель из пассивного советчика в активного агента. И это не магия — это инженерия.

Кстати, если вы когда-нибудь хотели собрать AI-репетитора, который не просто объясняет, а контролирует прогресс ученика — попробуйте наложить PAD+ на Clean Architecture. Результат удивит.

Подписаться на канал