Гайды по AI и нейросетям - AiManual
AiManual Logo Ai / Manual.
Документация

Учебные материалы

Manual #1077 9 min

Работа найдется: как заставить AI-агента проходить HR-фильтры и писать отклики, которые не пахнут AI-slop

Пошаговый пайплайн: извлечение фактов из вакансий, анализ резюме и генерация уникальных сопроводительных писем. Борьба с галлюцинациями и AI-slop.

Открыть документ
Manual #1076 9 min

GRPO и ревард-хакинг: как модель учится говорить красиво ничего не говоря

Практическое руководство по борьбе с reward hacking в GRPO: почему модели генерируют мусор и как это исправить. KL divergence, стабильные reward функции, паттер

Открыть документ
Manual #1075 7 min

Groq vs. Локальный GPU: как GPT-OSS-20B убивает RTX 4090 в токенах в секунду

Практический тест: Groq выдает 250+ токенов в секунду, RTX 4090 - 45. Когда облако быстрее локального железа и стоит ли покупать GPU?

Открыть документ
Manual #1074 8 min

Function Calling в Open WebUI: какие модели на самом деле работают с llama.cpp

Полное руководство по настройке Native Function Calling в Open WebUI v0.7. Список моделей, которые работают и не работают с llama.cpp, пошаговая настройка Chat

Открыть документ
Manual #1072 8 min

Как создать локальный RAG-пайплайн для аудио на RTX 2060: Whisper + Ollama + ChromaDB

Полный гайд по созданию автономного RAG-пайплайна для обработки аудио на слабой видеокарте. Faster-whisper, Ollama, ChromaDB и Streamlit локально.

Открыть документ
Manual #1071 8 min

Создаем AI-компаньона с памятью, который учится сам и видит сны

Пошаговое руководство по созданию AI-компаньона для рабочего стола с долговременной памятью, автономным обучением и интеграцией Grok API.

Открыть документ
Manual #1070 8 min

Цитируй или умри: как выбрать локальную LLM для советов по здоровью и карьере

Практическое сравнение локальных LLM с цитированием для медицинских и карьерных советов. Qwen3, GPT OSS, DeepSeek - что выбрать для интеграции с Weaviate и вект

Открыть документ
Manual #1067 7 min

Multi-Joint RAG: как Hermit-AI ищет в 100+ ГБ данных без интернета и не врёт

Глубокий разбор Hermit-AI: трёхэтапный конвейер Multi-Joint RAG для точного оффлайн-поиска в 100+ ГБ данных без галлюцинаций. JIT-индексирование, верификация фа

Открыть документ
Manual #1065 7 min

Локальный AI-агент на стероидах: как заставить Kilo Code и Devstral-Small-2 работать на трёх 3090

Полный гайд по настройке Kilo Code и Devstral-Small-2 для агентного кодирования на локальном железе: выбор квантования Q8, контекст 120k+, оптимизация VRAM 72GB

Открыть документ
Manual #1062 7 min

Гибридный кластер для LLM: разгрузка prefill на eGPU и декодирование на Strix Halo

Практическое руководство по созданию гибридного кластера для LLM. Разгружаем prefill на eGPU, декодируем на AMD Strix Halo. Архитектура, настройка, ошибки.

Открыть документ
Manual #1058 8 min

Локальный AI против облака: почему эксперты по инфраструктуре делают ставку на свои серверы

Почти 70% инфраструктурных инженеров выбирают локальные AI-серверы. Разбираем реальные цифры, скрытые расходы облачных API и план перехода на свои сервера.

Открыть документ
Manual #1057 8 min

Когда Granite 4.0 H 1B сжирает всю память A100: ломаем PYTORCH_CUDA_ALLOC_CONF

Пошаговое решение OOM ошибок при финтюнинге Granite 4.0 H 1B на Tesla A100 40GB. Настройка PYTORCH_CUDA_ALLOC_CONF, оптимизация Unsloth и работа с памятью CUDA.

Открыть документ