Гайды по AI и нейросетям - AiManual
AiManual Logo Ai / Manual.
Документация

Учебные материалы

Manual #4704 8 min

Миграция с Amazon Nova 1 на Nova 2 в Bedrock: инструкция по API, контекст 1M токенов и активация Extended Thinking

Полное руководство по миграции с Amazon Nova 1 на Nova 2 в Bedrock на 18.03.2026. Контекст 1 млн токенов, Converse API, Extended Thinking, web grounding, пример

Открыть документ
Manual #4697 9 min

Как внедрить ИИ-помощник на RAG-архитектуре: разбор кейса BIM Inspector с ускорением адаптации сотрудников на 80%

Практический гайд по внедрению RAG-архитектуры для ИИ-помощника. Разбираем кейс BIM Inspector: как сократить адаптацию сотрудников с 4 недель до 5 дней. Пошагов

Открыть документ
Manual #4694 6 min

Атака на RAG-системы: как защитить ChromaDB и LM Studio от 95% отравления базы знаний

95% атак на RAG проходят успешно. Пошаговый план защиты ChromaDB и LM Studio: обнаружение аномалий эмбеддингов, настройка chunking, валидация контента.

Открыть документ
Manual #4693 8 min

Qwen 3.5: dense или MoE? Выбор модели и железа (AMD vs NVIDIA) для локального кодирования

Полное руководство: какую архитектуру Qwen 3.5 выбрать, какое железо купить (NVIDIA RTX 5090 или AMD) и какое квантование взять для локального AI-кодинга в 2026

Открыть документ
Manual #4688 8 min

Как отказаться от сложного ретривел-пайплайна: используем встроенные знания LLM о Git и терминале

Разоблачаем избыточный код: как использовать встроенные знания LLM о Git и терминале без сложных ретривел-пайплайнов. Практический гайд для DevOps.

Открыть документ
Manual #4687 9 min

Лучшая сборка для локального ИИ на слабом железе: OmniCoder-9B, llama.cpp и 32 ГБ ОЗУ

Полное руководство по запуску OmniCoder-9B с llama.cpp на слабом железе. Квантование Q4_K_M, настройка CUDA, тесты скорости. Ежедневный кодинг без облачных затр

Открыть документ
Manual #4685 7 min

Как собрать бюджетный 6-GPU мультиплексор на K80: 72 GB VRAM за $200 для мгновенного переключения моделей

Пошаговый гайд по сборке бюджетного 6-GPU мультиплексора на NVIDIA K80 с 72 GB VRAM за $200. Кастомный kernel модуль, pure C инференс, переключение моделей за 0

Открыть документ
Manual #4683 7 min

Как удвоить скорость Multi-GPU в llama.cpp: диагностика асимметричных PCI-E lanes и настройка CUDA_VISIBLE_DEVICES

Узнайте, как диагностировать асимметричные PCI-E lanes и настроить CUDA_VISIBLE_DEVICES для удвоения скорости multi-GPU в llama.cpp. Готовые команды и пошаговое

Открыть документ
Manual #4680 9 min

LLM-as-a-judge: как оценивать RAG-системы и находить слабые места

Глубокий разбор методов оценки RAG с помощью LLM-судьи. Пошаговый план, метрики, поиск слабых мест. Актуально на 2026 год.

Открыть документ
Manual #4679 8 min

Self-Hosting LLM в 2026: кончились деньги на OpenAI, пора собирать свой инференс-сервер

Пошаговое руководство по запуску своей LLM в продакшене. Выбор модели, квантование, подбор GPU и облачного инстанса, деплой. Экономия на API и полный контроль.

Открыть документ
Manual #4668 8 min

mlx-tune на MacBook: Бесплатный прототипинг Llama и Qwen вместо облачных GPU

Полный гайд по mlx-tune. Настройка Llama 3.3, Qwen2.5 и Vision-моделей на MacBook с помощью SFT, DPO, LoRA. Экспорт в GGUF, интеграция с Unsloth API. Экономия н

Открыть документ
Manual #4667 11 min

Нейро-символьный ИИ на PyTorch: как нейросеть сама научилась выявлять мошенничество и генерировать правила

Практический гайд по созданию нейро-символьной модели на PyTorch 2.5. Нейросеть сама генерирует IF-THEN правила для обнаружения мошенничества с ROC-AUC 0.933. П

Открыть документ