Гайды по AI и нейросетям - AiManual
AiManual Logo Ai / Manual.
Документация

Учебные материалы

Manual #4723 7 min

Гибридное квантование Qwen3.5 27B: сравнение Steampunque Q6_K_H и Unsloth K_XL

Подробный разбор гибридного квантования Qwen3.5 27B. Сравнение производительности, точности и памяти между Steampunque Q6_K_H и Unsloth K_XL. Практический гайд

Открыть документ
Manual #4721 9 min

Оптимизация AI-агентов для Raspberry Pi: как заменить тяжёлые фреймворки на детерминированный роутинг и LLM

Пошаговый гайд по замене LangChain на легковесную гибридную архитектуру для AI-агентов на Raspberry Pi. Увеличьте скорость в 5 раз и уменьшите потребление памят

Открыть документ
Manual #4720 7 min

Fine-tuning Qwen2-0.5B для автоматизации задач: полный гайд с LoRA, квантованием GGUF и запуском на CPU

Пошаговый гайд по fine-tuning Qwen2-0.5B с помощью LoRA, квантованию в формат GGUF и запуску на обычном CPU для автоматизации задач. Актуально на март 2026.

Открыть документ
Manual #4716 12 min

8GB VRAM и три модели: как заставить работать Embed, Rerank и классификатор без Out of Memory

Подробный гайд по развертыванию трех моделей на одной видеокарте 8GB. Nomic Embed, BGE Reranker, ModernBERT без OOM ошибок с FastAPI и Docker.

Открыть документ
Manual #4710 9 min

Масштабирование генерации видео с AWS: как Bark.com сократил производство контента с недель до часов

Разбираем архитектуру видео-фабрики Bark.com на AWS. Как Amazon SageMaker и Bedrock сократили производство контента с недель до часов. Технические детали, ошибк

Открыть документ
Manual #4709 9 min

Построение умного A/B тестирования на Amazon Bedrock: архитектура и реализация с MCP

Пошаговый гайд по архитектуре и реализации умного A/B тестирования для LLM на Amazon Bedrock с использованием Model Context Protocol. Динамическое назначение, а

Открыть документ
Manual #4708 8 min

A2A-протокол: как заставить AI-агентов работать вместе, а не сражаться друг с другом

Полное руководство по A2A-протоколу для оркестрации мультиагентных систем. Архитектура, практическое внедрение, код и ошибки на 18.03.2026.

Открыть документ
Manual #4705 6 min

Self-hosted AI для программирования: реальная продуктивность или дорогая игрушка? Сравнение с облачными Codex/Copilot

Глубокий анализ self-hosted AI для кодогенерации: бюджет на железо, сравнение моделей DeepSeek-Coder, CodeQwen с облачными аналогами. Практическая польза или до

Открыть документ
Manual #4704 8 min

Миграция с Amazon Nova 1 на Nova 2 в Bedrock: инструкция по API, контекст 1M токенов и активация Extended Thinking

Полное руководство по миграции с Amazon Nova 1 на Nova 2 в Bedrock на 18.03.2026. Контекст 1 млн токенов, Converse API, Extended Thinking, web grounding, пример

Открыть документ
Manual #4697 9 min

Как внедрить ИИ-помощник на RAG-архитектуре: разбор кейса BIM Inspector с ускорением адаптации сотрудников на 80%

Практический гайд по внедрению RAG-архитектуры для ИИ-помощника. Разбираем кейс BIM Inspector: как сократить адаптацию сотрудников с 4 недель до 5 дней. Пошагов

Открыть документ
Manual #4694 6 min

Атака на RAG-системы: как защитить ChromaDB и LM Studio от 95% отравления базы знаний

95% атак на RAG проходят успешно. Пошаговый план защиты ChromaDB и LM Studio: обнаружение аномалий эмбеддингов, настройка chunking, валидация контента.

Открыть документ
Manual #4693 8 min

Qwen 3.5: dense или MoE? Выбор модели и железа (AMD vs NVIDIA) для локального кодирования

Полное руководство: какую архитектуру Qwen 3.5 выбрать, какое железо купить (NVIDIA RTX 5090 или AMD) и какое квантование взять для локального AI-кодинга в 2026

Открыть документ