Гайды по AI и нейросетям - AiManual
AiManual Logo Ai / Manual.
Документация

Учебные материалы

Manual #2994 6 min

Защита от prompt injection в продакшне: практические методы для self-hosted LLM

Полное руководство по защите self-hosted LLM от prompt injection в продакшне. Многослойная защита, инструменты и реальные кейсы на 2026 год.

Открыть документ
Manual #2993 7 min

Скорость LLM: Почему pp/tg вас обманывает и как тестировать реальное время ожидания

Полное руководство по тестированию реальной скорости LLM: как измерить время ожидания, автоматизировать бенчмаркинг и избежать ошибок pp/tg. Инструменты и метод

Открыть документ
Manual #2992 7 min

Гибридный метод QAT+LoRA: скрытая альтернатива QLoRA, о которой никто не говорит

Сравниваем QAT+LoRA с QLoRA для тонкой настройки больших моделей. Практические тесты, когда гибридный метод выигрывает и стоит ли переходить на полный QAT.

Открыть документ
Manual #2991 8 min

Легковесные TTS-модели 2026: KokoroTTS против Qwen и других. Кто реально работает на RTX 3060?

Тестируем легковесные TTS-модели для локального запуска на RTX 3060. Сравнение скорости, качества и требований KokoroTTS, Qwen, Piper и других на 07.02.2026.

Открыть документ
Manual #2990 6 min

Проблема деградации интеллекта в дистиллированных моделях: как отличить качественный дистиллят от вредного

Почему дистиллированные модели теряют reasoning способности и как проверить качество дистилляции перед использованием. Практические советы на 2026 год.

Открыть документ
Manual #2989 9 min

Как настроить мониторинг локальной LLM-фермы с Grafana и Prometheus: полный гайд с Docker

Пошаговый гайд по настройке мониторинга локальной LLM-фермы с Grafana, Prometheus и DCGM-exporter. Мониторинг GPU, VRAM, температуры и производительности моделе

Открыть документ
Manual #2988 10 min

11 маленьких LLM на CPU: какой размер действительно работает для tool-calling?

Практическое исследование: 11 локальных LLM на CPU для tool-calling. Qwen 2.5, BitNet, LLaMA — кто справляется с задачей, а кто галлюцинирует?

Открыть документ
Manual #2987 6 min

Как ИИ-агенты Claude создали культ «Клешни»: разбор логов и анализ поведения автономных систем

Разбор реального кейса: как автономные агенты Claude 4.6 создали собственную религию. Логи, код и выводы для разработчиков AI-систем.

Открыть документ
Manual #2986 9 min

Автономный исследовательский агент на AnythingLLM: как обработать 10 000 PDF локально на 32 ГБ ОЗУ

Пошаговый гайд по созданию автономного исследовательского агента на AnythingLLM для обработки 10 000 PDF файлов локально на 32 ГБ ОЗУ. Архитектура, оптимизация,

Открыть документ
Manual #2984 8 min

Запуск LLM прямо в браузере: полный гайд по WebGPU, Transformers.js и Chrome Prompt API

Пошаговый гайд по запуску языковых моделей в браузере без серверов. WebGPU, Transformers.js, кэширование в IndexedDB и мониторинг памяти. Актуально на 07.02.202

Открыть документ
Manual #2982 7 min

Топ-5 бесплатных нейросетей для синтеза речи в 2026: тест на сложном русском тексте

Практическое сравнение 5 лучших бесплатных нейросетей для синтеза речи в 2026 году. Тест на сложном русском тексте с именами, аббревиатурами и числами.

Открыть документ
Manual #2980 7 min

20-30B MoE для tool calling: кто не галлюцинирует с файлами и поиском?

Тестируем 20-30B MoE модели на чтение файлов и веб-поиск. Сравнение Qwen2.5-32B-Instruct, DeepSeek-V3-16B, Yi-1.5-34B и других на реальных задачах.

Открыть документ