Гайды по AI и нейросетям - AiManual
AiManual Logo Ai / Manual.
Документация

Учебные материалы

Manual #7105 6 min

Запуск GLM 5.2 GGUF на consumer железе: 492GB модель на Threadripper и RTX 5090

Как запустить гигантскую модель GLM 5.2 (492B параметров) на домашнем ПК с Threadripper и RTX 5090. GGUF, Unsloth квантование, offloading, cmake и реальные бенч

Открыть документ
Manual #7098 9 min

Как валидировать NVIDIA H100 PCIe: сравнение с H100 NVL на сервере YADRO (бенчмарки и команды)

Полный гайд по валидации NVIDIA H100 PCIe: vLLM, NCCL, пропускная способность памяти. Сравнение с H100 NVL на сервере YADRO G4208P G3. Команды и типичные ошибки

Открыть документ
Manual #7097 8 min

Loop Engineering: как автоматизировать промптинг AI-агентов с помощью пяти базовых блоков

Разбираем методологию loop engineering от Anthropic и Addy Osmani. Пять примитивов для построения самоподдерживающихся AI-пайплайнов. Сравнение Claude Code и Co

Открыть документ
Manual #7096 6 min

Q4 против Q8 для Gemma 4 31B на 4090: тупой бенчмарк, который всё расставил по местам

Сравнение Q4-dynamic и Q8_0 для Gemma 4 31B на RTX 4090: VRAM, tok/s, точность tool-calling. Результаты тестов и практический выбор квантизации.

Открыть документ
Manual #7095 9 min

Сравнение AI-агентов на сложной задаче: реальный бенчмарк Depixelizing Pixel Art

Тестируем Claude Codex, Cursor, DeepAgents CLI и других AI-агентов на задаче восстановления пиксельной графики. Честный бенчмарк с кодом, промптами и результата

Открыть документ
Manual #7094 8 min

Запуск GLM-5.2 с MTP speculative decoding на 4× DGX Spark: сборка vLLM и Triton ядра

Пошаговый гайд по сборке vLLM с поддержкой MTP speculative decoding для GLM-5.2 на кластере из 4 DGX Spark. Настройка AWQ весов, Triton ядер и распределённого и

Открыть документ
Manual #7088 8 min

grep, граф или LSP: что дешевле и точнее для контекста кодового агента? Результаты 936 прогонов на Apache Superset

Результаты 936 прогонов на Apache Superset: grep, граф или LSP — какой метод сбора контекста дешевле и точнее для кодового агента? Неожиданные выводы.

Открыть документ
Manual #7087 8 min

Сравнение LLM для продающих ботов на русском: тест 10 моделей и лучшие по цене/качеству (DeepSeek V4 Flash)

Сравнение 10 моделей LLM для продающих ботов на русском языке. Цена/качество, реальные цифры, скандал с MiniMax M2.7. DeepSeek V4 Flash — лучший выбор по соотно

Открыть документ
Manual #7086 7 min

Как изолировать ИИ-агент в Docker Sandbox: пошаговое руководство по безопасности

Пошаговое руководство по безопасной изоляции AI-агента в Docker-песочнице: защита OAuth-токенов, файловой системы, настройка seccomp, user namespaces и gVisor.

Открыть документ
Manual #7080 7 min

Anchor Detection для RAG: параллельный поиск + один LLM вызов – архитектура и код

Гайд по production-ready RAG с anchor detection: как собрать параллельные ретриверы, агрегировать результаты и выполнить один LLM-реранкинг без потери качества

Открыть документ
Manual #7076 8 min

Как отучить LLM придумывать цифры: метод борьбы с галлюцинациями в анализе данных с помощью Claude Desktop и MCP-сервера

Пошаговый гайд по устранению выдуманных цифр при анализе таблиц: настройка Claude Desktop и MCP-сервера для точных данных.

Открыть документ
Manual #7074 7 min

Spring Data JDBC Skill для AI-агентов: как получить качество Opus за копейки

Гайд: как с помощью Spring Data JDBC и дешевых LLM добиться точности Opus при работе с базами данных. Экономьте токены, не жертвуя надежностью.

Открыть документ