Гайды по AI и нейросетям - AiManual
AiManual Logo Ai / Manual.
Документация

Учебные материалы

Manual #2411 8 min

Анализ внутренней работы Gemma 3 Vision: загадка токена позиции 193 и как исследовать архитектуру VLM

Глубокий разбор внутренней работы Gemma 3 Vision. Методика анализа 10K изображений, матрицы косинусной схожести и разгадка тайны токена позиции 193.

Открыть документ
Manual #2405 7 min

Четыре человека, один сервер и восемь Blackwell: как мы совместно купили железо для локальных SOTA-моделей

Реальный кейс коллаборации: 4 человека, 1 сервер Gigabyte с 8 GPU Blackwell B200, запуск SOTA-моделей локально. Договор, распределение ресурсов, технические дет

Открыть документ
Manual #2403 9 min

Локальная LLM + Vertex AI Search: гибридная архитектура для заземлённого поиска без парсинга

Пошаговая инструкция по подключению локальной LLM к Google Vertex AI Search для создания заземлённых поисковых систем на малых GPU (16 ГБ). Гибридная архитектур

Открыть документ
Manual #2400 7 min

Контекстная амнезия в LangChain Deep Agents: как не дать AI-агенту забыть всё через 20 минут работы

Практическое руководство по сжатию контекста AI-агентов и работе с файловой системой в LangChain Deep Agents SDK. Техники для длительных задач.

Открыть документ
Manual #2399 9 min

Когда Claude пишет CUDA-ядра за вас: как обучать маленькие модели создавать оптимизированные диффузоры

Практический гайд по использованию Claude для обучения маленьких моделей писать оптимизированные CUDA-ядра для диффузионных моделей. Экономия времени и ресурсов

Открыть документ
Manual #2395 8 min

Кэширование эмбеддингов: как ускорить индексацию кодовой базы в 7.6 раза

Полное руководство по кэшированию эмбеддингов для RAG-систем. Ускорьте индексацию кодовой базы в 7.6 раз с помощью семантического кэша, batch-запросов и правиль

Открыть документ
Manual #2394 8 min

Kimi K2.5 в vLLM и SGLang: как убить '(no content)' и утечку тегов на H200

Подробное решение проблем с ответами '(no content)' и утечкой XML-тегов при запуске Kimi K2.5 в vLLM и SGLang на H200 GPU. Настройка tool-call-parser и параметр

Открыть документ
Manual #2390 11 min

Когда номенклатура превращается в бардак: как LLM с Structured Output чистят корпоративные справочники

Практическое руководство по нормализации корпоративных справочников номенклатуры с помощью локальных LLM и Structured Output. Обработка Excel, Ollama, бизнес-ав

Открыть документ
Manual #2389 6 min

Сравнение генераторов изображений 2026: тест на странном промпте со стеклянным бегемотом

Сравнение 12 AI-моделей для генерации изображений в 2026 году. Тест на странном промпте "стеклянный бегемот". Результаты, анализ, выбор лучшего инструмента.

Открыть документ
Manual #2388 10 min

Kakugo: как выжать 120 миллиардов параметров в 3 миллиарда для своего языка

Полный пайплайн дистилляции GPT OSS 120B в 3B модель для низкоресурсного языка. Аппаратные требования, код, методика и подводные камни.

Открыть документ
Manual #2386 9 min

Как заменить мышь на жесты рук: создание управления ПК на Python с OpenCV и MediaPipe

Пошаговый гайд по созданию системы управления компьютером жестами рук на Python с OpenCV и MediaPipe. Замена мыши на жесты в реальном времени.

Открыть документ
Manual #2385 6 min

Агентный инжиниринг: от нуля до продакшена за один репозиторий

Полный гайд по агентному инжинирингу с разбором open-source репозитория. Архитектура, инструменты, внедрение в команде на 2026 год.

Открыть документ