Гайды по AI и нейросетям - AiManual
AiManual Logo Ai / Manual.
Документация

Учебные материалы

Manual #6248 5 min

RAG failed: 3 причины плохого поиска и способы их исправления

Разбираем три основные причины провала RAG: чанкинг, эмбеддинги и ретривал. Практические советы с кодом и ссылками на актуальные исследования 2026 года.

Открыть документ
Manual #6246 6 min

24 ГБ ОЗУ на M4 и 64k контекст: какие LLM реально работают без тормозов?

Подробный гайд: какие модели LLM запускать на MacBook M4 с 24 ГБ RAM, чтобы получить 64k контекста и оставить место для браузера. Квантование, инструменты, ошиб

Открыть документ
Manual #6240 7 min

Как внедрить llms.txt на сайт: пошаговое руководство для SEO и AI-цитируемости

Пошаговое руководство по внедрению llms.txt: что это, зачем нужно и как настроить для AI-цитируемости. Примеры кода, ошибки и прогнозы на 2026 год.

Открыть документ
Manual #6237 5 min

AI-агент в SDLC: как он закрывает тикеты без участия человека и почему зелёный дашборд перестал быть правдой

Реальный опыт внедрения AI-агентов в разработку: почему метрики закрытых тикетов обманчивы, как избежать технического долга и не попасться на уловки зелёного да

Открыть документ
Manual #6235 7 min

Макросы как микроавтоматизация: чему игровые мыши учат AI-workflow

Разбираем игровые макросы через призму автоматизации: профили мышей, сценарии ввода, CS2, RPG, RTS и AI-подход к настройке workflow.

Открыть документ
Manual #6234 7 min

От вайбкодинга к агентскому флоу: как перестать писать убер-промпты и начать формировать инфраструктуру для работы с ИИ

Практический гайд Senior DevOps о переходе от вайбкодинга к агентскому флоу. Пошаговая настройка инфраструктуры для ИИ-агентов, типичные ошибки и примеры кода.

Открыть документ
Manual #6232 10 min

Vibe-кодинг: как я создал Android-приложение с помощью ИИ от идеи до продакшена

Подробный опыт DevOps: как я за 2 недели создал Android-приложение (Kotlin, Node.js, Docker) с помощью ИИ, без найма разработчиков. Архитектура, авторизация, БД

Открыть документ
Manual #6230 5 min

Как настроить MTP (Multi-Token Prediction) для Gemma 4 31B в LlamaCPP: решение проблемы с отсутствием отдельного drafter GGUF

Пошаговый гайд по настройке Multi-Token Prediction для Gemma 4 31B в LlamaCPP. Узнайте, как обойти проблему с отсутствием отдельного drafter GGUF и ускорить инф

Открыть документ
Manual #6229 7 min

Корпоративный поиск с LLM: как в Яндексе побеждали галлюцинации A/B тестами и ранжированием

Как построить корпоративный поиск на основе LLM без галлюцинаций. Методология ранжирования и A/B экспериментов от инженеров Яндекса.

Открыть документ
Manual #6228 6 min

Три AI-модели вместо BI-правил: как построить аналитику прибыли по каждому SKU для Ozon и Wildberries

SaaS-архитектура с реверс-инжинирингом API, агентами Claude 4 Opus и тремя моделями для P&L каждого товара на маркетплейсах. Практический гайд.

Открыть документ
Manual #6225 8 min

Как развернуть мультистадийную мультимодальную рекомендательную систему на Amazon EKS: полное руководство с Bloom-фильтрами, кэшированием и Triton Inference Server

Пошаговый гайд по развертыванию 14 моделей на Amazon EKS с NVIDIA Triton, Bloom-фильтрами и in-memory кэшированием. Архитектура, автоскейлинг, ошибки и решения.

Открыть документ
Manual #6216 8 min

Исполняемые бизнес-процессы на BPMN, Camunda и Bitrix24: реальный кейс автоматизации с AI-агентами

Пошаговый гайд по интеграции Camunda и Bitrix24 с AI-агентами. Оркестрация бизнес-процессов, передача контекста, обработка ошибок. Работающий кейс enterprise.

Открыть документ