Гайды по AI и нейросетям - AiManual
AiManual Logo Ai / Manual.
Документация

Учебные материалы

Manual #6847 8 min

Как построить eval пайплайн для RAG-агента: кейс Битрикс24

Подробный гайд по построению пайплайна оценки (eval) для RAG-агента на примере Битрикс24. Используем RAGAS, LLM as a judge, метрики Recall@K, MRR, Faithfulness.

Открыть документ
Manual #6844 5 min

Deep Dive into CPU LLM Inference Performance: Why Custom Engines Lag Behind llama.cpp (MoE Case Study)

Разбираем, почему кастомные движки для MoE-моделей на CPU проигрывают llama.cpp в 7.3 раза. Анализ IPC, memory-bound, GGUF quantized и ключевые оптимизации.

Открыть документ
Manual #6843 7 min

Как запускать ИИ локально: полное руководство для начинающих (2026)

Полный гайд для начинающих: как запустить нейросеть на своем ПК. Установка Ollama, выбор модели, квантование, UI. Без облаков и подписок. Работает даже на 8 ГБ

Открыть документ
Manual #6840 7 min

GPU Time-Slicing для LLM агентов на Kubernetes: как разделить один GPU без потери производительности

Как настроить GPU Time-Slicing в Kubernetes для мультиагентных LLM систем. Реальные метрики, конфиги NVIDIA GPU Operator и советы по избежанию OOM.

Открыть документ
Manual #6838 10 min

Ваши 36 000 фото и 20 лет почты: как не умереть от хаоса с локальным AI-агентом

Полное руководство: как с помощью LLaVA, Ollama, Gmail API и Python разобрать 36 000 фото и очистить 20-летний почтовый ящик. Без облаков и потери данных.

Открыть документ
Manual #6836 7 min

Маркетинговая стратегия с ИИ: рабочие промпты и воркфлоу для Claude Projects

Пошаговый гайд: системный промпт, 3 рабочих промпта и воркфлоу для создания маркетинговой стратегии в Claude Projects. Реальный кейс и частые ошибки.

Открыть документ
Manual #6827 6 min

10 критических ошибок RAG в продакшене: как их избежать (разбор от экспертов)

Разбираем 10 типичных ошибок RAG-пайплайнов в продакшене: парсинг PDF, чанкинг, метаданные, эмбеддинги, реранкинг. Как исправить и не потерять точность.

Открыть документ
Manual #6820 8 min

Automated Voice Agent Testing Without a Microphone: Scaling Evaluations with Amazon Nova Sonic

Узнайте, как тестировать голосовых агентов без микрофона, используя Amazon Nova Sonic. Пошаговый гайд по автоматизации eval-сценариев для CI/CD и регрессионного

Открыть документ
Manual #6819 7 min

Голосовой агент за вечер: OpenAI Realtime 2 API + Whisper v4 — как склеить разговор в реальном времени и не выпить лишнего валидола

Пошаговый гайд по созданию голосового агента с субсекундной задержкой: стриминг аудио, перевод в реальном времени, tool calling. Примеры кода, ошибки и нюансы.

Открыть документ
Manual #6818 7 min

Почему RAG не справляется с числовыми агрегациями и как это исправить: маршрутизация вычислений

Эксперимент на 100k строк: RAG проваливает агрегации. Как маршрутизация запросов с SQL-движком спасает точность. Пошаговый гайд для Q&A систем.

Открыть документ
Manual #6816 5 min

Adversarial-атаки на LLM: от GCG до refusal direction — полный гайд по взлому safety-элайнмента

Глубокий технический обзор градиентных атак на LLM. Почему safety-элайнмент — иллюзия? От GCG до refusal direction. Примеры кода и практические нюансы.

Открыть документ
Manual #6813 4 min

Negation Neglect в LLM: почему языковые модели верят ложным утверждениям даже после предупреждений

Глубокий разбор феномена пренебрежения отрицанием в языковых моделях: как это мешает достоверности и что с этим делать на 2026 год.

Открыть документ