Гайды по AI и нейросетям - AiManual
AiManual Logo Ai / Manual.
Документация

Учебные материалы

Manual #508 9 min

GRPO: как DeepSeekMath выкинул критика из RL и получил суперэффективный алгоритм

Глубокий разбор Group Relative Policy Optimization (GRPO) — революционного алгоритма RL-обучения из DeepSeekMath. Как работает, чем лучше PPO, и как экономит 70

Открыть документ
Manual #507 7 min

Как реализовать Virtual Try-On на диффузионных моделях: гибридный пайплайн IDM-VTON и Leffa для e-commerce

Практическое руководство по реализации Virtual Try-On для e-commerce с использованием гибридного пайплайна IDM-VTON и Leffa. Оптимизация инференса, развертывани

Открыть документ
Manual #506 10 min

AI Playbook для ESG-отчетности: шаблоны промптов и кейсы использования Gemini

Практическое руководство по автоматизации ESG-отчетности с помощью Gemini и NotebookLM. Шаблоны промптов, реальные кейсы, инструкции по внедрению.

Открыть документ
Manual #505 13 min

Создание RAG-агента для объяснения настолок: PocketFlow, ObjectBox и BlackSheep на практике

Полное руководство по созданию легковесного RAG-агента для объяснения правил настольных игр на Python. Используем PocketFlow, ObjectBox и BlackSheep без тяжёлых

Открыть документ
Manual #504 6 min

ReAP квантование: разоблачение мифа о «почти без потерь» на реальных тестах

Личный тест ReAP квантования на Llama 3.1 8B. Официальные бенчмарки лгут - метод теряет до 20% точности в практических задачах.

Открыть документ
Manual #501 8 min

Черный ящик сломали: как найти и выключить «несущие» нейроны в Llama 3.2 3B

Пошаговый гайд по анализу внутренних представлений Llama 3.2 3B. Находим критические нейроны, ломаем семантику, сохраняя беглость текста. Методы, код, ловушки.

Открыть документ
Manual #500 13 min

MCP Tool Registry: практическое руководство по автоматизации RAG-систем

Пошаговое руководство по созданию MCP Tool Registry для автоматизации RAG-систем. Архитектура, код, развертывание и оптимизация оркестрации AI-инструментов.

Открыть документ
Manual #498 8 min

AMD 7900 XTX + ROCm: полный бенчмарк llama.cpp vs vLLM на eGPU через Thunderbolt 3

Эксклюзивный тест производительности 8 LLM на AMD 7900 XTX через Thunderbolt 3. Сравнение llama.cpp и vLLM, реальная скорость токенов, ограничения eGPU и настро

Открыть документ
Manual #496 8 min

Сборка llama.cpp не для всех: как заставить его летать на твоём железе

Полный гайд по сборке llama.cpp с MKL, CUDA архитектурой, AVX2 и Vulkan. Флаги CMake для i7, RTX, AMD. Ускорение инференса в 3-5 раз.

Открыть документ
Manual #495 11 min

Как создать AI-радиостанцию на базе Qwen 1.5B и Piper TTS: туториал по VibeCast

Пошаговый гайд по созданию локальной AI-радиостанции с генерацией скриптов, синтезом речи и веб-интерфейсом. Работает полностью офлайн.

Открыть документ
Manual #494 8 min

Как создать Text-to-SQL агента для бизнеса: архитектура, guardrails и достижение 96% точности с Llama 3

Практическое руководство по созданию production-ready Text-to-SQL агента с архитектурой на LangChain, strict schema binding, guardrails и 96% точностью на Llama

Открыть документ
Manual #493 8 min

Техническое расследование: как обнаружить производные модели через анализ весов и кода

Полное руководство по техническому расследованию производных моделей. Анализ косинусной схожести весов, исследование кода моделирования и поиск следов копирован

Открыть документ