Гайды по AI и нейросетям - AiManual
AiManual Logo Ai / Manual.
Документация

Учебные материалы

Manual #4164 8 min

Strix Halo NPU для запуска LLM в Linux: настройка FastFlowLM и тесты энергоэффективности против GPU

Полное руководство по настройке FastFlowLM для AMD Strix Halo NPU под Linux. Тесты скорости и энергоэффективности LLM против RTX 4090 и Arc Pro B60. Квантование

Открыть документ
Manual #4162 6 min

Как перейти с ChatGPT на Claude: полный гайд по миграции данных и этический выбор

Полное руководство по переносу данных и промптов из ChatGPT в Claude 4.5. Экспорт истории, настройка конфиденциальности и этические причины для смены ИИ-ассисте

Открыть документ
Manual #4161 6 min

Qwen3.5 Thinking Mode: детальное руководство по активации и тестам для моделей 2B-122B

Практический гайд по активации Thinking Mode в Qwen3.5. Тесты reasoning и context recall на моделях от 2B до 122B в Unsloth и LM Studio. Советы по квантованию и

Открыть документ
Manual #4153 8 min

GATv2Conv против GCNConv: почему температура на Raspberry Pi предсказывается точнее с динамическим вниманием

Сравнение GATv2Conv и GCNConv на реальном проекте edge-прогноза погоды для Raspberry Pi. Код, результаты, оптимизация для устройств с 4GB RAM.

Открыть документ
Manual #4152 7 min

Управление слотами в llama.cpp: как принудительно остановить inference в Open WebUI и не убить сервер

Пошаговое руководство по принудительной остановке inference в llama.cpp через управление слотами. Как остановить генерацию в Open WebUI, не убивая весь сервер.

Открыть документ
Manual #4151 6 min

Qwen 3.5 сошел с ума: как обуздать бесконечные вызовы инструментов и заставить слушаться системный промпт

Подробный гайд по решению главных проблем Qwen 3.5: игнорирование системных промптов и бесконечные циклы вызовов инструментов. Рабочие стратегии на 2026 год.

Открыть документ
Manual #4150 9 min

AI-агенты работают как попало? Автоматические бенчмарки на Langfuse поставят их на место

Пошаговая система автоматической оценки качества AI-агентов с метриками, трейсингом и алерт-правилами. Практический гайд на Langfuse для продакшн-команд.

Открыть документ
Manual #4149 8 min

Обзор лучших LLM-моделей для программирования на Macbook M5 Pro: тесты производительности и квантования

Практический гайд по выбору и запуску локальных LLM для программирования на Macbook Pro M5. Сравнение DeepSeek-Coder, Qwen2.5-Coder, GPT-OSS-20B, настройка LM S

Открыть документ
Manual #4147 9 min

Context Engineering для coding-агентов: как управлять памятью Claude Code на длинных задачах (на примере CLAUDE.md и Plan Mode)

Как избежать деградации coding-агентов на длинных задачах. Методики context engineering, CLAUDE.md, Plan Mode. Пошаговый гайд на 2026 год с актуальными данными.

Открыть документ
Manual #4143 6 min

Настройка Qwen 3.5 в llama.cpp: почему bf16 KV cache критически важен для точности

Пошаговое руководство по настройке Qwen 3.5 в llama.cpp с bf16 KV cache. Замеры perplexity, ошибки и оптимизация памяти. Актуально на 2026 год.

Открыть документ
Manual #4140 9 min

Полное руководство по AI Red Teaming: как взломали инфраструктуру Grok от xAI

Глубокий разбор атаки на инфраструктуру Grok. Методология AI Red Teaming, извлечение системного промпта, jailbreaks, CSRF, WAF bypass и пошаговый план защиты LL

Открыть документ
Manual #4137 9 min

Как обучить 3B LLM на специфичном датасете (патристическая теология) на одной RTX 3090 за 22 часа: полный разбор

Пошаговый гайд по fine-tuning 3-миллиардной модели на нишевом датасете патристики. Конкретные параметры, код и оптимизации для RTX 3090. Работает за 22 часа.

Открыть документ