Гайды по AI и нейросетям - AiManual
AiManual Logo Ai / Manual.
Документация

Учебные материалы

Manual #4282 10 min

Как собрать RDMA-кластер для локальных LLM: сравнение Thunderbolt, RoCE v2 и Mellanox ConnectX-6

Полное руководство по сборке RDMA-кластера для локальных LLM. Сравнение Thunderbolt, RoCE v2 и Mellanox ConnectX-6. Настройка, тесты, ошибки.

Открыть документ
Manual #4281 10 min

Как настроить локальную RAG-систему на ноутбуке: индексация 10 тысяч PDF-файлов с Ollama

Полный гайд по сборке приватной RAG-системы на ноутбуке с RTX 5060. Индексация 10000 PDF с Ollama и 4-битными моделями без облаков.

Открыть документ
Manual #4278 8 min

Как избежать катастрофического забывания при последовательной тонкой настройке LLM: метод CRMA для Mistral-7B

Подробное руководство по методу Constrained Residual Adapter для последовательной тонкой настройки Mistral-7B без потери предыдущих знаний. Практическая реализа

Открыть документ
Manual #4277 10 min

QuillCode: разбор архитектуры своего кодинг-агента, выбор инструментов и анализ ошибок

Пошаговый разбор архитектуры своего AI-агента для программирования. Выбор инструментов, AST-анализ, ratatui интерфейс и патчинг через diff.

Открыть документ
Manual #4273 8 min

ASUS GX10 для локальных LLM: анализ производительности, сравнение с GPT5-mini и Claude Sonnet

Полный разбор ноутбука ASUS GX10 для запуска локальных LLM. Производительность с Qwen3.5 122B и MiniMax-M2.5 230B, прямое сравнение с GPT5-mini и Claude Sonnet,

Открыть документ
Manual #4272 10 min

Как защитить голосового AI от prompt injection в реальных звонках: разбор случая и архитектура защиты

Разбор реальной атаки на голосового AI в продакшене. Многоуровневая архитектура защиты с использованием dograh ai и Vapi. Шаги реализации.

Открыть документ
Manual #4265 7 min

Скрытые жемчужины Qwen 3.5: обзор лучших квантований от AesSedai и CatalystSec для экономии памяти

Подробный обзор лучших квантований Qwen 3.5 от AesSedai и CatalystSec для запуска на слабом железе. Сравнение Q5_K_M, Q8_0 и других форматов GGUF.

Открыть документ
Manual #4264 9 min

Эксперимент с автономным ИИ: как настроить сервер, где агент живёт сам по себе (с кодом cron и mini-swe-agent)

Пошаговое руководство по созданию автономного ИИ-агента на сервере с использованием cron и mini-swe-agent. Код run_ai.sh, системный промпт, практические примеры

Открыть документ
Manual #4262 7 min

Почему LangChain и LlamaIndex опасны для проекта: личный опыт создания своей lite RAG-системы за 15 минут

Личный опыт DevOps: почему LangChain и LlamaIndex замедляют проект и как создать легкую RAG-систему за 15 минут. Гайд 2026.

Открыть документ
Manual #4261 8 min

Open Terminal в Open WebUI: полный гайд по нативному tool calling и sandbox-автоматизации с Qwen3.5 35B

Узнайте, как настроить Open Terminal в Open WebUI для нативного tool calling и sandbox-автоматизации с моделью Qwen3.5 35B. Полное руководство по установке, нас

Открыть документ
Manual #4257 10 min

Запуск модели Qwen2.5 72B на двух видеокартах через llama.cpp RPC: полное руководство по настройке Docker

Детальное руководство по запуску Qwen2.5-72B-Instruct-Q3_K_M на двух видеокартах через llama.cpp RPC в Docker. Решение проблемы VRAM. Пошаговая настройка, квант

Открыть документ
Manual #4250 8 min

MLX vs GGUF на Mac M4: итоги битвы форматов для запуска Qwen3.5 122B

Подробный бенчмарк MLX и GGUF форматов для запуска Qwen3.5 122B на Mac M4 Max 128GB. Таблицы производительности, память, время до первого токена.

Открыть документ