Гайды по AI и нейросетям - AiManual
AiManual Logo Ai / Manual.
Документация

Учебные материалы

Manual #6122 9 min

Создание LLM с нуля: опыт pretrain и RLHF 7B модели с архитектурой DeepSeek и оптимизацией VRAM

Пошаговый гайд по созданию 7B MoE модели DeepSeek с нуля: pretrain, RLHF (PPO/GRPO), оптимизация VRAM, muon-оптимизатор. Реальный опыт двух GPU.

Открыть документ
Manual #6117 7 min

Почему плохой ответ модели — это не проблема модели: разбор типичных ошибок в inference-системах

Разбираем скрытые причины плохих ответов LLM: проблемы retrieval, контекста и маршрутизации. Диагностика, примеры и пошаговый план для инженеров RAG и fine-tuni

Открыть документ
Manual #6108 1 min

Qwen на M4 Max: как я выключил интернет и заставил Mac стенографировать встречи быстрее облака

Пошаговый гайд по созданию полностью локального AI-секретаря для саммари встреч на Mac с Qwen 3.5/3.6 и оптимизацией под M4 Max. Без утечек данных, без задержек

Открыть документ
Manual #6104 7 min

Как отключить сжатие памяти в Windows 11 для ускорения LLM: решение проблемы с AMD GPU

Сжатие памяти в Windows 11 (Memory Compression) может резать скорость LLM на AMD GPU до 50%. Команда Disable-MMAgent -mc за секунду отключает этот тормоз. Полны

Открыть документ
Manual #6103 9 min

ARMageddon: Как скрестить четыре Raspberry Pi в кластер для нейросетей и не сойти с ума

Пошаговое руководство по созданию кластера из Raspberry Pi 5 для распределенного инференса и федеративного обучения LLM. Реальные тесты, подводные камни, актуал

Открыть документ
Manual #6102 9 min

Как использовать Cursor для быстрого прототипирования корпоративных модулей: режимы Agent, Plan, Debug, Ask

Пошаговое руководство по режимам Cursor для быстрого прототипирования модулей в enterprise-проектах. Настройка .cursor/rules, комбинирование режимов, ошибки и л

Открыть документ
Manual #6101 6 min

ИИ для продажников: промпты, которые реально закрывают сделки в 2026

Гайд: как с помощью ChatGPT и Perplexity готовиться к звонкам за 5 минут. Реальные промпты и методики для sales-отделов. Экономьте время и закрывайте больше сде

Открыть документ
Manual #6098 1 min

Кэширование трекинга YOLO с Redis: готовые сниппеты для экономии GPU

Как сэкономить до 40% GPU при трекинге объектов YOLO? Используем Redis для кэширования треков ByteTrack и DeepSORT. Готовые сниппеты кода и разбор ошибок.

Открыть документ
Manual #6096 5 min

Проблемы с MiMo-V2.5 310B: массовые галлюцинации в квантизированной версии

Разбираем массовые галлюцинации у MiMo-V2.5 310B после квантования. Почему MoE-модели Xiaomi ломаются в GGUF и как не попасть в ловушку.

Открыть документ
Manual #6091 6 min

Как заставить LLM играть в Мафию: многомодельный театр на llama.cpp

Пошаговое руководство по организации ролевой игры Мафия (Werewolf) на нескольких локальных LLM (Gemma4, Qwen3.6) с переключением моделей и отключением chain-of-

Открыть документ
Manual #6089 6 min

Почему SFT может ухудшить следование инструкциям на маленьких моделях: разбор эксперимента с 1B, 2B, 3B

Эксперимент показал: SFT на 1B модели ухудшил IFEval на 5.75 пункта, в то время как 2B и 3B улучшили. Разбираем причины и даем рекомендации для выбора размера м

Открыть документ
Manual #6087 7 min

Вайб-кодинг для ПЛИС: как создать I2S FIFO-реклокер с помощью Gemini Pro без знания Verilog

Пошаговое руководство по созданию I2S FIFO-реклокера на ПЛИС с помощью Gemini 2.5 Pro. Никакого Verilog, только промпты и здравый смысл. Реальный кейс вайб-коди

Открыть документ