Гайды по AI и нейросетям - AiManual
AiManual Logo Ai / Manual.
Документация

Учебные материалы

Manual #6614 6 min

Как скрытый слот PCIe 2.0 x4 уничтожил производительность 4x RTX 3090 и как это исправить: полный гайд по диагностике multi-GPU rig

Реальный кейс: слот PCIe 2.0 x4 убил производительность 4x RTX 3090. Узнайте, как диагностировать и исправить проблему с multi-GPU rig. Команды, настройки, сове

Открыть документ
Manual #6613 8 min

Связка rtk + context-mode поверх Serena и Semble: аудит прокси-экономии токенов — профит или оверхед?

Детальный аудит связки rtk + context-mode поверх Serena и Semble: замеры экономии токенов, оверхед по латентности, пошаговая настройка и подводные камни. Резуль

Открыть документ
Manual #6609 6 min

Практическое руководство по LLM Engineering: RAG, реранкеры и оценка — полный гайд с примерами кода

Пошаговое руководство по сборке продакшн-пайплайна RAG: гибридный поиск, реранкеры, LLM-as-Judge. Примеры кода, грабли и советы инженера.

Открыть документ
Manual #6606 6 min

Как внедрить MCP в Enterprise: опыт платформы MWS Octapi с low-code интеграциями

Пошаговое руководство по интеграции MCP-протокола с корпоративными системами на примере low-code платформы MWS Octapi. OpenAPI, SOAP, GraphQL и типичные ошибки.

Открыть документ
Manual #6605 6 min

Как появиться в ответах ChatGPT: пошаговый гайд по созданию личного сайта для LLM за один вечер

Пошаговая инструкция, как за один вечер создать сайт, который ChatGPT и Claude будут цитировать. Форк репозитория, llms.txt, деплой, подводные камни.

Открыть документ
Manual #6602 7 min

ZeroClaw: как мы автоматизировали расчёт отпусков с помощью AI-агента в корпоративном мессенджере

Подробный кейс: ZeroClaw + Mattermost для расчёта отпусков. Интеграция, локальные модели, обработка исключений. Сократили время расчёта с 30 минут до 30 секунд.

Открыть документ
Manual #6597 6 min

Стратум: инженерная методология для превращения LLM в детерминированную систему

Галлюцинации и нестабильность LLM побеждаются архитектурно. Стратум — методология, вдохновлённая советской школой проектирования. Пошаговый гайд с примерами и т

Открыть документ
Manual #6592 7 min

DQ-шаблон с ИИ-агентом и MCP: как мы автоматизировали проверку качества данных (и где споткнулись)

Практический гайд по сборке DQ-шаблона с ИИ-агентом и MCP-сервером: архитектура, пошаговый план, типичные ошибки и как их избежать. Для BI и Data Engineering ко

Открыть документ
Manual #6591 7 min

Как настроить K8s для LLM инференса: DRA, GIE и LLM-D на практике

Настройка Kubernetes для высоконагруженного LLM инференса с DRA, GIE и LLM-D. Практические шаги, архитектура, ошибки. Только реальный опыт 2026.

Открыть документ
Manual #6590 8 min

Масштабирование AI-систем: от GPT-wrapper до распределённой архитектуры

Как превратить простой API-вызов в миллион RPS? Разбираем кэширование, rate limiting, роутинг запросов и распределенный вывод. Гайд для DevOps и архитекторов AI

Открыть документ
Manual #6589 9 min

Сравнение 21 инструмента сборки контекста для AI-агентов: от ripgrep до RAG и LSP (бенчмарк и экономия токенов)

Сравнение ripgrep, srag, ToolTrim, Context Lens и других тулов. Бенчмарк скорости, точности и экономии токенов. Анализ LLM-судьи. Какие инструменты реально спас

Открыть документ
Manual #6586 6 min

Как настроить MiMo-2.5 для кодинга: решение проблемы зацикливания

Пошаговое решение проблемы зацикливания MiMo-2.5 (310B) при локальном кодинге. Правильные кванты, параметры context_length, temperature и repeat_penalty для ста

Открыть документ