Гайды по AI и нейросетям - AiManual
AiManual Logo Ai / Manual.
Документация

Учебные материалы

Manual #2261 8 min

AI-диалоги в ролевых играх: почему подписка съедает ваш бюджет, а токены — нет

Практический разбор экономики AI-диалогов. Считаем реальные затраты на длинные контексты в ролевых играх, сравниваем подписки OpenAI, Anthropic и потокеновую оп

Открыть документ
Manual #2259 8 min

Полное руководство по RAG: архитектура, типичные ошибки и open-source реализация

Глубокий разбор RAG: как работает архитектура, 7 критических ошибок при внедрении и пошаговая open-source реализация на актуальных инструментах 2026 года.

Открыть документ
Manual #2257 7 min

Claude Code на максимум: превращаем AI-помощника в личного инженера

Полный гайд по настройке Claude Code. Skills, команды, Model Context Protocol и управление контекстом для максимальной продуктивности в 2026 году.

Открыть документ
Manual #2254 7 min

Почему автономные AI-агенты ломаются в Kubernetes: разбор слоёв сложности и эксперимент

Глубокий разбор проблем автономных AI-агентов в Kubernetes на примере Yandex Cloud. Слои сложности, декларативная модель и практические решения на 2026 год.

Открыть документ
Manual #2252 9 min

Фреймворки для AI-агентов в 2025: Autogen против LangChain, OpenHands и остальных

Подробный разбор фреймворков для AI-агентов на 2025 год: архитектура, boilerplate-код, производительность. Что выбрать для проекта?

Открыть документ
Manual #2251 8 min

Как создать техническое задание, которое не решат ИИ: кейс Anthropic и тесты для разработчиков

Как Anthropic создает тестовые задания, которые не решает Claude 4.5. Практическое руководство для тимлидов и HR по оценке реальных навыков разработчиков.

Открыть документ
Manual #2248 9 min

Как настройка `--threads -1` в llama.cpp ломает производительность GLM-4.7: разбор бага и оптимизация

Подробный разбор бага с параметром --threads -1 в llama.cpp для GLM-4.7. Объясняем, почему автоматическое определение потоков ломает производительность, и даем

Открыть документ
Manual #2247 7 min

Fine-tuning и квантование Qwen2.5-0.5B для классификации обращений: пошаговый гайд для бизнеса

Полный гайд по fine-tuning Qwen2.5-0.5B для классификации обращений, квантованию до 350 MB и деплою на дешёвый VPS. Экономия с $200 до $10 в месяц.

Открыть документ
Manual #2245 10 min

256k контекст на 8 x 5070 Ti: как выбрать и запустить Large Context Model для технических суммаризаций

Практическое руководство по выбору и запуску моделей с контекстом 256k-512k для суммаризации технических документов. Аппаратные требования, сравнение моделей, о

Открыть документ
Manual #2244 10 min

Когда Ollama зависает на полуслове: как настроить таймауты и логирование для генерации сложного кода

Практическое руководство по настройке таймаутов, логированию ошибок и оптимизации Ollama с Continue для генерации сложного кода на локальных LLM. Решаем проблем

Открыть документ
Manual #2243 12 min

Суверенный агент на Neo4j RAG с автономными циклами: полный гайд для Apple Silicon

Пошаговая архитектура автономного агента с Neo4j RAG, ChromaDB и гибридной памятью для Mac M1/M2/M3. Полный стек на 26.01.2026.

Открыть документ
Manual #2242 10 min

VibeCheck: Как я заставил локальный ИИ выгонять меня из дома и искать события

Создаем самодельное приложение на локальном ИИ для борьбы с прокрастинацией. Генерация аниме-картинок, поиск событий, экономия на API. Полный гайд на 2026 год.

Открыть документ