Гайды по AI и нейросетям - AiManual
AiManual Logo Ai / Manual.
Документация

Учебные материалы

Manual #6779 9 min

Реальные vs теоретические метрики LLM на on-premise: как мы считали ресурсы для GPT-OSS-120B на RTX Pro 6000 и почему калькуляторы врут в 5 раз

Почему онлайн-калькуляторы для расчета ресурсов LLM врут в 5 раз? Тестируем GPT-OSS-120B на RTX Pro 6000 Blackwell: реальные показатели VRAM, latency, throughpu

Открыть документ
Manual #6774 8 min

Динамическое извлечение данных из документов с помощью Amazon Bedrock: on-demand и batch пайплайны

Гайд по Amazon Bedrock для извлечения данных из документов: on-demand и batch пайплайны, динамический выбор модели, оптимизация промптов. Актуально на июнь 2026

Открыть документ
Manual #6772 7 min

Когда утилизация GPU обманчива: скрытые проблемы подсистемы хранения, замедляющие AI-инференс

Высокая утилизация GPU не гарантирует скорость инференса. Разбираем, как деградация RAID, неоптимальная архитектура хранилища и ошибки мониторинга крадут деньги

Открыть документ
Manual #6771 5 min

Тест моделей LLM: Qwen3-235B остаётся лучшей по цене/качеству спустя год — подробности батча

Провёл собственный батч-тест четырёх LLM: Qwen3-235B, DeepSeek V4 Flash, Gemma 4, MiniMax. Результаты: Qwen3-235B держит лидерство спустя год. Разбор методики,

Открыть документ
Manual #6765 7 min

Как обойти региональные блокировки Claude Code и Antigravity на Linux: настройка VPS, прокси и Node.js

Пошаговое руководство по настройке VPS с Privoxy для обхода региональных блокировок AI-инструментов Claude Code 2.0 и Antigravity на Linux. Нюансы DNS, WebSocke

Открыть документ
Manual #6764 7 min

Структурированный промпт-инжиниринг: как автоматизировать создание промптов через скиллы Claude (pepper-prompt-engineer)

Как перестать писать промпты вручную и начать их генерировать. Разбор скилла pepper-prompt-engineer: структура SKILL.md, пошаговая автоматизация, частые ошибки.

Открыть документ
Manual #6762 9 min

Собираем Telegram-бота с RAG на Cloudflare Workers без векторной БД: пошаговый туториал с кодом

Пошаговый гайд: создаем дешевого RAG-бота на Cloudflare Workers с Jaccard similarity вместо эмбеддингов. Экономим бюджет, храним базу знаний в маркдауне. Готовы

Открыть документ
Manual #6760 8 min

Профилирование PyTorch: от nn.Linear до fused MLP — практическое руководство с разбором трасс

Научитесь профилировать MLP в PyTorch, читать трассы профайлера и применять fusion с torch.compile и Triton. Реальный кейс с ускорением до 3x.

Открыть документ
Manual #6758 7 min

Как создать браузерную игру с помощью Claude Fable 5 одним промптом: симулятор админа AI-канала

Пошаговый гайд по созданию браузерной игры-симулятора администратора AI-канала с помощью Claude Fable 5 за один промпт. Без навыков кода — только идея и Fable.

Открыть документ
Manual #6757 8 min

Как сократить расход токенов в MCP: замеры и оптимизация схем инструментов Claude

Научитесь точно замерять и сокращать расход токенов на схемы MCP для Claude. Пошаговый план, цифры, примеры кода и типовые ошибки. Экономьте до 70% контекста.

Открыть документ
Manual #6750 7 min

DiffusionGemma: как Google превратил Gemma в генератор изображений (и как это повторить)

Гайд по DiffusionGemma 2.0: установка, API, примеры кода, тонкая настройка. Сравнение с Stable Diffusion, советы по оптимизации на 2026 год.

Открыть документ
Manual #6746 11 min

Глубокий парсинг PDF для RAG: как извлекать текст из многостраничных документов без потери качества

Руководство по двухуровневому парсингу PDF для RAG: текстовый слой + layout-анализ. Реальные кейсы ошибок, сравнение инструментов и пошаговый пайплайн на июнь 2

Открыть документ