Гайды по AI и нейросетям - AiManual
AiManual Logo Ai / Manual.
Документация

Учебные материалы

Manual #1065 7 min

Локальный AI-агент на стероидах: как заставить Kilo Code и Devstral-Small-2 работать на трёх 3090

Полный гайд по настройке Kilo Code и Devstral-Small-2 для агентного кодирования на локальном железе: выбор квантования Q8, контекст 120k+, оптимизация VRAM 72GB

Открыть документ
Manual #1062 7 min

Гибридный кластер для LLM: разгрузка prefill на eGPU и декодирование на Strix Halo

Практическое руководство по созданию гибридного кластера для LLM. Разгружаем prefill на eGPU, декодируем на AMD Strix Halo. Архитектура, настройка, ошибки.

Открыть документ
Manual #1058 8 min

Локальный AI против облака: почему эксперты по инфраструктуре делают ставку на свои серверы

Почти 70% инфраструктурных инженеров выбирают локальные AI-серверы. Разбираем реальные цифры, скрытые расходы облачных API и план перехода на свои сервера.

Открыть документ
Manual #1057 8 min

Когда Granite 4.0 H 1B сжирает всю память A100: ломаем PYTORCH_CUDA_ALLOC_CONF

Пошаговое решение OOM ошибок при финтюнинге Granite 4.0 H 1B на Tesla A100 40GB. Настройка PYTORCH_CUDA_ALLOC_CONF, оптимизация Unsloth и работа с памятью CUDA.

Открыть документ
Manual #1056 7 min

Почему AI-поиск с SearXNG перестал работать: диагностика блокировок и альтернативы для OpenWebUI

Пошаговый гайд по диагностике блокировок SearXNG в OpenWebUI. Альтернативы AI-поиску: локальные решения, прокси, другие метапоисковые системы.

Открыть документ
Manual #1055 7 min

Практический гайд: Как настроить Gemma-3-4b-it для вызова процедур с помощью QLoRA

Пошаговое руководство по адаптации Gemma-3-4b-it для вызова API и процедур с помощью QLoRA. Требования к железу, подготовка датасета, обучение на 24 ГБ VRAM.

Открыть документ
Manual #1053 6 min

Где арендовать GPU дешевле DeepInfra: сравнение цен и условий на A100, H100, B200

Сравнение провайдеров аренды GPU: где найти A100, H100, B200 по лучшим ценам. Альтернативы DeepInfра для AI-инференса.

Открыть документ
Manual #1052 6 min

NVIDIA DGX Spark: реальный опыт использования, тонкости настройки и подводные камни для локального AI

Подробный обзор NVIDIA DGX Spark для локального AI: реальный опыт использования, тонкости настройки, проблемы стабильности и сравнение с облачными GPU.

Открыть документ
Manual #1049 9 min

Дистилляция и квантование LLM для локального RAG: пошаговый туториал с кодом

Пошаговый туториал по созданию специализированного RAG-ассистента: дистилляция Teacher-Student, синтетический датасет, квантование в GGUF. Работает на обычном н

Открыть документ
Manual #1048 7 min

Арабский документ в RAG за 5 шагов: как не провалить проект из-за кривых таблиц и диакритики

Практическое руководство по обработке арабских документов для RAG: от OCR до табличных данных. Реальный пайплайн, ошибки, инструменты.

Открыть документ
Manual #1046 9 min

Как выбрать Mac для локальных LLM: сравнение чипов Apple Silicon, оперативной памяти и производительности

Полное руководство по выбору Mac для локальных LLM: сравнение M1-M4, сколько RAM нужно, Mac mini vs Mac Studio, реальные тесты скорости генерации.

Открыть документ
Manual #1045 8 min

SplineTransformer в Scikit-Learn: Конец полиномиальной регрессии и явления Рунге

Полное руководство по SplineTransformer в Scikit-Learn. Как заменить полиномиальную регрессию для нелинейных данных и избежать явления Рунге на практике.

Открыть документ