Гайды по AI и нейросетям - AiManual
AiManual Logo Ai / Manual.
Документация

Учебные материалы

Manual #6992 6 min

Современный стек RAG 2025: отказ от энкодеров в пользу LLM и переход на SGLang

Разбираем, почему в 2025 году энкодеры в RAG уступили место универсальным LLM, а SGLang стал стандартом инференса. Полный разбор стека, ошибок и будущего.

Открыть документ
Manual #6990 8 min

Gemini 3.1 Flash Lite: CLI для интеграции с Gmail, Drive и Docs — установка и первые примеры

Пошаговый гайд по установке Gemini 3.1 Flash Lite CLI, настройке OAuth для Gmail, Drive и Docs, и первые рабочие примеры автоматизации с критическими нюансами.

Открыть документ
Manual #6988 6 min

Как отключить AI в Google Docs: пошаговая инструкция по удалению Gemini и других навязчивых функций

Пошаговое руководство по отключению Gemini, Smart Compose, Help me write и других AI-функций в Google Docs. Убираем навязчивые подсказки и возвращаем контроль н

Открыть документ
Manual #6985 7 min

How to Reduce AI Sycophancy: Lessons from Oxford's Study on Warm vs. Truthful AI

Практическое руководство по снижению сикофантии AI: методы тонкой настройки на основе исследования Оксфорда. Баланс теплоты и правдивости с кодом и лайфхаками.

Открыть документ
Manual #6983 8 min

Создание кастомного GStreamer плагина для NVIDIA DeepStream на Python: как обойти nvinfer и взять контроль над метаданными

Полный гайд по созданию Python плагина для DeepStream: перехват буферов после nvinfer, извлечение и изменение NvDsMeta, обработка объектов без перекомпиляции C+

Открыть документ
Manual #6982 5 min

Порог оттока — это ценовое решение: как настроить churn threshold с учётом стоимости удержания и потерь

Узнайте, почему стандартный порог 0.5 в churn-моделях стоит миллионов. Как рассчитать оптимальный threshold с учётом стоимости удержания и потерь на IBM Telco.

Открыть документ
Manual #6981 7 min

Продвинутый RAG: диспетчеризация вопросов с профилированием документа, стратегией чанков и аудитом на основе GPT-4.1

Глубокий технический разбор RAG-пайплайна с профилированием документа, динамическим выбором чанков и аудитом через GPT-4.1. Код, нюансы и грабли продакшена.

Открыть документ
Manual #6979 5 min

Как Cloudflare построила AI-ревью кода в масштабе: CI-оркестрация с OpenCode

Реальный кейс Cloudflare: как оркестрировать AI-ревью кода с OpenCode в CI пайплайне. Архитектура, масштабирование, подводные камни. Дата: 21.06.2026

Открыть документ
Manual #6978 8 min

Автоматическое обнаружение сбоев AI-агентов и анализ первопричин с Strands Evals SDK

Пошаговое руководство по использованию Strands Evals SDK для детекции ошибок и root cause analysis в трейсах AI-агентов. Экономьте часы отладки в production.

Открыть документ
Manual #6972 9 min

Полный гайд по внутренностям LLM: от токенизации до продакшена на примере Gemma 4 12B

DevOps-гайд по архитектуре LLM на примере Gemma 4 12B: от токенов до продакшена. Математика, формы тензоров, аппаратные ограничения и квантование.

Открыть документ
Manual #6968 8 min

Оптимизация RAG для PDF: как извлекать текст из изображений без лишних затрат на Vision LLM

Научитесь извлекать текст из изображений PDF с минимальными затратами на Vision API. Каскадная фильтрация: OCR, дешевая типизация и только 10% запросов к VLM.

Открыть документ
Manual #6967 8 min

Автоматическая нарезка докладов в вертикальные видео: пайплайн с Whisper, LLM и ffmpeg

Гайд по автоматической нарезке длинных докладов в вертикальные видео. Используем Whisper для транскрибации, LLM для поиска хайлайтов, ffmpeg для монтажа. Без ру

Открыть документ