Гайды по AI и нейросетям - AiManual
AiManual Logo Ai / Manual.
Документация

Учебные материалы

Manual #1948 9 min

Ephemeral vs Ray: Сравнение подходов к загрузке моделей и утилизации GPU в продакшене

Глубокий разбор двух архитектур для AI-инференса: эфемерные модели против оркестрации Ray. Как поднять утилизацию GPU с 15% до 85% и убить холодные старты.

Открыть документ
Manual #1946 6 min

Тестирование RK3588 NPU vs Raspberry Pi 5: реальная производительность Llama 3.1, Qwen и DeepSeek

Сравнительный тест RK3588 NPU и Raspberry Pi 5 для запуска Llama 3.1, Qwen и DeepSeek. Реальные цифры токенов в секунду, проблемы конвертации и выбор платформы.

Открыть документ
Manual #1943 7 min

Карьера в Data Science в 2026: какие навыки действительно нужны, а какие — пустая трата времени

Практический гайд по карьере в Data Science на 2026 год. Фундаментальные знания против избыточных технологий. Основано на анализе 400 реальных вакансий.

Открыть документ
Manual #1942 9 min

Как создать самовосстанавливающийся ETL-пайплайн на Python с помощью LLM: полное руководство с кодом

Пошаговое руководство по созданию ETL-пайплайна с автоисправлением ошибок через LLM. Код на Python, архитектура Try-Heal-Retry Loop, обработка исключений pandas

Открыть документ
Manual #1940 8 min

IQ vs Q квантования: как не сжечь видеокарту и не убить качество модели

Полное руководство по выбору типа квантования (IQ vs Q) для локальных LLM. Таблицы сравнения, практические рекомендации под разный VRAM, анализ потерь качества.

Открыть документ
Manual #1939 9 min

Как победить контекстный блот и 'зону тупости' в агентах: архитектура subagents от Deep Agents

Глубокий разбор архитектуры subagents от Deep Agents для изоляции контекста и специализации агентов. Практическое руководство по борьбе с контекстным блотом и з

Открыть документ
Manual #1937 8 min

Self-hosted AI-ассистенты для разработки: Tabby, Continue.dev и другие в 2026 году

Полное сравнение self-hosted AI-ассистентов для разработки в 2026: Tabby, Continue.dev, Cody. Как выбрать, настроить и развернуть приватное решение.

Открыть документ
Manual #1936 10 min

Полный гайд для начинающих: как с нуля запустить локальную LLM с памятью чатов и RAG

Пошаговое руководство по установке Ollama, настройке векторной базы данных и созданию полноценного RAG-системы с чат-памятью на домашнем ПК. Все инструменты акт

Открыть документ
Manual #1935 7 min

Создание мультиагентной системы с Llama 4 и Amazon Bedrock: практическое руководство по Strands Agents

Пошаговое создание мультиагентной системы на Amazon Bedrock с Llama 4 и Strands Agents. Архитектура, масштабирование, отказоустойчивость.

Открыть документ
Manual #1932 9 min

Дистилляция навыков аудита безопасности в Qwen3-14B: тонкая настройка на трассах DeepSeek

Практическое руководство по дистилляции навыков аудита безопасности в Qwen3-14B. Тонкая настройка на трассах DeepSeek, снижение затрат на 70%, готовая модель на

Открыть документ
Manual #1931 7 min

Структура против хаоса: почему Entity Cards бьют полный контекст в RAG-системах

F1-метрики, HotpotQA тесты и неожиданный вывод: Entity Cards на 37% эффективнее полного контекста для AI-агентов. Практическое руководство с кодом.

Открыть документ
Manual #1930 10 min

128 ГБ ОЗУ на Strix Halo: какие модели для кодирования реально работают, а какие — маркетинг

Практический гайд по выбору моделей 30B-100B параметров для локального кодирования на Strix Halo с 128 ГБ ОЗУ. Сравнение GGUF, AWQ, тесты производительности, кв

Открыть документ