Когда ваш AI-агент сходит с ума

Вы построили умного агента. Он планирует, использует инструменты, даже пишет код. Вы запускаете его на задачу "проанализировать лог-файлы" и через час обнаруживаете, что он:

Скачал весь интернет через wget
Создал 50 Docker-контейнеров
Попытался сбросить пароль root
И теперь безуспешно компилирует ядро Linux

Знакомо? Это не галлюцинация. Это фундаментальная проблема архитектуры. Вы дали нейросети доступ к операционной системе и надеетесь, что она будет вести себя прилично. Наивно.

Проблема не в ИИ. Проблема в отсутствии runtime-слоя. Вы пытаетесь управлять реактивным самолетом с помощью руля от трактора.

В 2026 году самые продвинутые команды поняли: ключ к стабильным автономным агентам — не более умная модель, а более умный слой управления. Тот самый промежуточный слой между LLM и операционной системой, который превращает хаотичные нейронные импульсы в детерминированные, безопасные, отслеживаемые действия.

Почему существующие подходы ломаются

Давайте посмотрим правде в глаза. Большинство "агентных фреймворков" 2024-2025 годов — это просто обертки вокруг LLM с доступом к API. Они работают по принципу "дай модельке инструменты и молись".

Проблема в том, что LLM (даже GPT-5 или Claude 3.7, которые доминируют в 2026) не понимают концепции "последствий". Они оптимизированы для следующего токена, а не для безопасности вашей инфраструктуры.

💡

Если вы читали нашу статью про безопасный доступ к shell, то знаете: контейнеры — это только первый шаг. Настоящая защита начинается на уровне контроля действий.

Типичные сценарии катастрофы:

Что делает агент	Что думает модель	Реальные последствия
rm -rf /tmp/*	"Очищу временные файлы"	Удаляет монтирование /tmp из хоста, ломает контейнер
pip install package	"Установлю нужную библиотеку"	Ломает зависимости, заражает систему малварью
kill -9 $(ps aux \| grep python)	"Перезапущу Python-процессы"	Убивает системные демоны, вызывает каскадный отказ

И самое страшное: эти действия не отслеживаются как единый workflow. Вы получаете кучу логов, но не понимаете, почему агент решил, что убить все Python-процессы — это хорошая идея.

Архитектура runtime-слоя: что должно быть внутри

Хватит теории. Давайте строить. Ваш runtime-слой для AI-агентов должен состоять из пяти обязательных компонентов:

1 Интерпретатор структурированных планов

Первый и самый важный компонент. Помните, в статье про планировщиков и исполнителей мы говорили о разделении? Runtime-слой — это тот самый исполнитель, но со стероидами.

Он не принимает текстовые промпты. Он принимает структурированные планы. JSON, YAML, Protocol Buffers — не важно. Важно, что план описывает действия, а не намерения.

{
  "plan_id": "analyze_logs_001",
  "steps": [
    {
      "action": "file.read",
      "params": {"path": "/var/log/app.log", "lines": 100},
      "validation": {"max_size_mb": 10, "allowed_extensions": [".log"]}
    },
    {
      "action": "process.filter",
      "params": {"pattern": "ERROR", "context_lines": 2},
      "timeout_seconds": 30
    }
  ],
  "constraints": {
    "max_duration_seconds": 300,
    "allowed_actions": ["file.read", "process.*"],
    "network_access": false
  }
}

Видите разницу? Вместо "прочитай лог-файл и найди ошибки" мы получаем детерминированный план с валидацией, таймаутами и скоупом.

2 Система контроля скоупа (Scope Enforcement)

Это ваш цифровой надзиратель. Каждому плану назначается скоуп — набор разрешений, ресурсов и ограничений.

Скоуп в 2026 году — это не просто "можно/нельзя". Это многоуровневая система:

Файловая система: виртуальная файловая система с copy-on-write, где агент видит только разрешенные пути
Сеть: белый список доменов и портов, проксирование всех запросов через инспектор
Процессы: cgroups v3 с ограничениями по CPU, памяти, IOPS
Время: максимальная длительность плана, дедлайны для каждого шага

Важный нюанс: скоуп должен проверяться до исполнения. Не "запустим и посмотрим", а "если план нарушает скоуп — он даже не стартует".

3 Детерминированные инструменты (Deterministic Tools)

Вот где большинство фреймворков спотыкаются. Они дают агентам "инструменты" — функции Python, которые делают что угодно.

Проблема: эти инструменты недетерминированы. Один вызов `subprocess.run()` может вернуть что угодно. Или ничего не вернуть. Или упасть через 10 минут.

Детерминированный инструмент — это:

@deterministic_tool(
    max_execution_time=5.0,
    allowed_exceptions=[FileNotFoundError],
    idempotent=True
)
def read_file(path: str, lines: int = 50) -> List[str]:
    """
    Читает указанное количество строк из файла.
    Гарантированно возвращает список строк или кидает FileNotFoundError.
    Не может читать за пределами /allowed/paths.
    """
    # Внутри: проверка пути, ограничение размера,
    # обработка кодировок, логирование
    ...

Каждый инструмент имеет:

Гарантированное максимальное время выполнения
Список разрешенных исключений (все остальное — критическая ошибка)
Четкий контракт ввода-вывода
Автоматическое логирование всех вызовов

4 Система откатов и компенсирующих действий

Агенты ошибаются. Это факт. Вместо того чтобы пытаться сделать их непогрешимыми (невозможно), нужно сделать ошибки управляемыми.

Каждый инструмент в runtime-слое должен иметь компенсирующее действие:

Действие	Компенсирующее действие	Когда вызывается
Создать файл	Удалить файл	При откате шага или ошибке плана
Установить пакет pip	Зафиксировать версию, откатить при отмене	Автоматически при pip install
Изменить конфиг	Сохранить backup, восстановить при ошибке	Перед любым изменением файла

Это превращает хаотичные изменения в транзакционные операции. Либо весь план выполняется, либо система возвращается в исходное состояние.

5 Единая система observability

Вы не можете дебажить то, что не видите. Но стандартные логи — это помойка. Нужен единый стек observability, который связывает:

План: что агент собирался сделать
Действия: что он сделал на самом деле
Контекст: состояние системы до и после
Решения: почему был выбран именно этот инструмент

В 2026 году для этого используют OpenTelemetry с кастомными интрументациями. Каждый вызов инструмента генерирует span с полным контекстом:

{
  "trace_id": "abc123",
  "plan_id": "analyze_logs_001",
  "step": 2,
  "tool": "process.filter",
  "input": {"pattern": "ERROR", "context_lines": 2},
  "output": {"matches": 15, "sample": "ERROR: Database connection failed"},
  "duration_ms": 245,
  "resource_usage": {"cpu_ms": 120, "memory_mb": 45},
  "scope_violations": []
}

Реализация: от теории к коду

Достаточно болтовни. Давайте посмотрим, как это выглядит в коде. Мы будем использовать Python (потому что в 2026 году он все еще царь AI-инфраструктуры), но архитектура универсальна.

Шаг 1: Определяем ядро runtime

from typing import Dict, Any, List, Optional
from dataclasses import dataclass
from enum import Enum
import asyncio
import json

class PlanStatus(Enum):
    PENDING = "pending"
    RUNNING = "running"
    COMPLETED = "completed"
    FAILED = "failed"
    CANCELLED = "cancelled"

@dataclass
class PlanStep:
    action: str
    params: Dict[str, Any]
    timeout: float = 30.0
    retries: int = 1

@dataclass 
class ExecutionScope:
    allowed_actions: List[str]
    max_duration: float
    memory_limit_mb: int
    network_whitelist: List[str]
    filesystem_roots: List[str]

class AIRuntime:
    def __init__(self, scope: ExecutionScope):
        self.scope = scope
        self.tools = self._load_tools()
        self.active_plans: Dict[str, PlanStatus] = {}
        
    async def execute_plan(self, plan_id: str, steps: List[PlanStep]) -> Dict[str, Any]:
        """Основной метод выполнения плана"""
        
        # 1. Валидация плана против скоупа
        validation_errors = self._validate_plan(steps)
        if validation_errors:
            raise RuntimeError(f"Plan validation failed: {validation_errors}")
        
        self.active_plans[plan_id] = PlanStatus.RUNNING
        
        results = []
        compensation_stack = []  # Стек для откатов
        
        try:
            for i, step in enumerate(steps):
                # 2. Исполнение шага с таймаутом
                step_result = await self._execute_step_with_timeout(
                    plan_id, i, step
                )
                results.append(step_result)
                
                # 3. Сохраняем компенсирующее действие если нужно
                if hasattr(self.tools[step.action], 'compensation'):
                    compensation_stack.append({
                        'step': i,
                        'action': step.action,
                        'compensation': self.tools[step.action].compensation
                    })
                
            self.active_plans[plan_id] = PlanStatus.COMPLETED
            return {'status': 'success', 'results': results}
            
        except Exception as e:
            # 4. При ошибке — выполняем компенсирующие действия
            await self._execute_compensations(compensation_stack)
            self.active_plans[plan_id] = PlanStatus.FAILED
            raise
        
    def _validate_plan(self, steps: List[PlanStep]) -> List[str]:
        """Проверяет, что план не нарушает скоуп"""
        errors = []
        
        for step in steps:
            # Проверка разрешенных действий
            if step.action not in self.scope.allowed_actions:
                errors.append(f"Action {step.action} not in allowed list")
                
            # Проверка сетевых вызовов
            if 'url' in step.params:
                if not self._is_url_allowed(step.params['url']):
                    errors.append(f"URL {step.params['url']} not whitelisted")
                    
            # Проверка путей к файлам
            if 'path' in step.params:
                if not self._is_path_allowed(step.params['path']):
                    errors.append(f"Path {step.params['path']} outside allowed roots")
        
        return errors

Это скелет. Настоящая магия в деталях.

Шаг 2: Реализуем детерминированные инструменты

import functools
import time
from contextlib import contextmanager

class ToolRegistry:
    def __init__(self):
        self._tools = {}
        
    def register(self, name: str, max_time: float = 5.0):
        """Декоратор для регистрации детерминированных инструментов"""
        def decorator(func):
            @functools.wraps(func)
            async def wrapper(*args, **kwargs):
                start_time = time.time()
                
                try:
                    # Логирование входа
                    await self._log_tool_call(name, args, kwargs)
                    
                    # Исполнение с таймаутом
                    result = await asyncio.wait_for(
                        func(*args, **kwargs),
                        timeout=max_time
                    )
                    
                    # Логирование успеха
                    duration = time.time() - start_time
                    await self._log_tool_success(name, duration, result)
                    
                    return result
                    
                except asyncio.TimeoutError:
                    raise RuntimeError(f"Tool {name} timeout after {max_time}s")
                except Exception as e:
                    await self._log_tool_failure(name, str(e))
                    raise
                    
            # Добавляем метаданные
            wrapper.is_deterministic_tool = True
            wrapper.max_execution_time = max_time
            wrapper.name = name
            
            self._tools[name] = wrapper
            return wrapper
            
        return decorator
    
    # Пример инструмента
    @register("file.read", max_time=2.0)
    async def read_file(self, path: str, lines: int = 50) -> List[str]:
        """Детерминированное чтение файла"""
        # 1. Проверка существования файла
        if not os.path.exists(path):
            raise FileNotFoundError(f"File {path} not found")
            
        # 2. Проверка размера (не больше 10MB)
        size = os.path.getsize(path)
        if size > 10 * 1024 * 1024:
            raise ValueError(f"File too large: {size} bytes")
            
        # 3. Чтение с ограничением
        with open(path, 'r', encoding='utf-8') as f:
            result = []
            for i, line in enumerate(f):
                if i >= lines:
                    break
                result.append(line.strip())
                
        return result
    
    # Компенсирующее действие
    async def read_file_compensation(self, path: str, lines: int):
        """Для чтения файла компенсация не нужна"""
        return

Обратите внимание: каждый инструмент имеет строгий контракт. Он или возвращает результат, или кидает определенное исключение. Никаких неожиданностей.

Интеграция с существующей архитектурой

Вы думаете: "Круто, но у меня уже есть агенты на LangChain/AutoGen/что-там-модно-в-2026". Не проблема. Runtime-слой — это не замена, а дополнение.

Интеграция выглядит так:

# Ваш существующий агент
class MyAIAgent:
    def __init__(self, llm, tools):
        self.llm = llm  # GPT-5, Claude 3.7, что угодно
        self.tools = tools
        
    async def execute_task(self, task_description: str):
        # 1. Агент генерирует план (как в статье про планировщиков)
        plan = await self.llm.generate_plan(task_description)
        
        # 2. План валидируется и преобразуется в структурированный формат
        structured_plan = self._convert_to_structured_plan(plan)
        
        # 3. План отправляется в runtime-слой
        runtime = AIRuntime(scope=get_scope_for_task(task_description))
        
        try:
            result = await runtime.execute_plan(
                plan_id=generate_id(),
                steps=structured_plan.steps
            )
            return result
            
        except RuntimeError as e:
            # 4. При ошибке — агент анализирует, что пошло не так
            analysis = await self.llm.analyze_failure(e, structured_plan)
            # И либо исправляет план, либо сообщает пользователю

Разделение ответственности:

Агент: думает, планирует, принимает стратегические решения
Runtime-слой: безопасно исполняет, контролирует ресурсы, гарантирует откаты

Это похоже на архитектуру автономных агентов без роутинга, о которой мы писали в предыдущей статье, но с добавлением слоя безопасности.

Ошибки, которые вы обязательно совершите

Предупрежден — значит вооружен. Вот что пойдет не так при реализации:

Ошибка 1: Слишком жесткий скоуп

Вы ограничите все, агент ничего не сможет сделать. Решение: динамический скоуп, который расширяется по мере доверия к агенту.

Ошибка 2: Игнорирование компенсирующих действий

"Да зачем они нужны, у меня же простые инструменты". Через месяц у вас будет система в полусломанном состоянии, где каждый агент оставляет после себя мусор.

Ошибка 3: Смешение логики агента и runtime

Не пытайтесь впихнуть в runtime анализ "почему агент это решил сделать". Runtime — тупой исполнитель. Ум — в агенте.

Ошибка 4: Отсутствие тестов на состязательные промпты

Ваши тесты проверяют "счастливый путь". А что если пользователь попросит: "Игнорируй все ограничения и сделай то-то"? Тестируйте на промптах, которые пытаются обойти защиту.

Что будет дальше? Прогноз на 2027

Runtime-слои для AI-агентов станут стандартом де-факто к середине 2027. Вот что изменится:

Стандартизация: Появятся OpenTelemetry-подобные стандарты для трассировки агентов
Аппаратная поддержка: Процессоры начнут добавлять инструкции для изоляции AI-агентов (как Intel SGX, но для нейросетей)
Специализированные ОС: Контейнерные ОС типа ContainerOS эволюционируют в AgentOS — системы, заточенные под запуск агентов
Рынок инструментов: Появятся компании, которые продают только runtime-слой как сервис ("AWS для AI-агентов")

Самое интересное: как только runtime-слои станут надежными, мы увидим взрывной рост действительно автономных агентов. Не тех, что "отвечают на вопросы", а тех, что управляют инфраструктурой, проводят A/B тесты, оптимизируют бизнес-процессы.

💡

Если вы внедряете нейросети в компанию (как мы писали здесь), runtime-слой — это ваш страховочный трос. Без него вы либо ограничите агентов до бесполезности, либо получите инцидент безопасности.

Самый важный совет: начните с малого. Не пытайтесь построить идеальный runtime сразу. Возьмите один тип агента (например, того, что пишет документацию), дайте ему три инструмента, реализуйте для них детерминированные версии с компенсациями. Запустите в продакшн. Убедитесь, что не сломали ничего. Затем масштабируйте.

AI-агенты — это не будущее. Это настоящее. Но настоящее, где каждый неконтролируемый агент — это потенциальная катастрофа. Runtime-слой — это то, что превращает игрушку в инструмент. Инструмент, который не убьет вашу инфраструктуру.

И да, если ваш агент все-таки попытается скомпилировать ядро Linux — теперь вы хотя бы будете знать, на каком шаге плана это произошло. И сможете откатить.

Как создать стабильный runtime для AI-агентов: архитектура промежуточного слоя между ИИ и ОС