Гайды по AI и нейросетям - AiManual
AiManual Logo Ai / Manual.
Документация

Учебные материалы

Manual #6728 8 min

Как масштабировать обучение роботов с подкреплением: NVIDIA Isaac Lab на Amazon SageMaker AI (пошаговое руководство)

Пошаговое руководство по запуску распределенного обучения роботов с подкреплением на NVIDIA Isaac Lab и Amazon SageMaker AI. Ускорьте Physical AI с GPU-кластера

Открыть документ
Manual #6722 1 min

Деплой LLM on-premise: железо, квантование, автоскейлинг и стоимость — полный гайд для enterprise

Гайд по развертыванию LLM на своих серверах: выбор GPU, квантование, автоскейлинг, TCO и лучшие практики enterprise. Актуально на 09.06.2026.

Открыть документ
Manual #6720 6 min

Claude Code: лучшие практики из репозитория с 56k звезд — что реально работает

Разбираем лучшие практики Claude Code из репозитория с 56k звезд: agentic search, plan mode, управление контекстом. Что реально экономит деньги и время разработ

Открыть документ
Manual #6718 8 min

Сборка Hermes Agent на Jetson Orin NX: пошаговая инструкция и бенчмарки

Полная инструкция по развертыванию Hermes Agent на Jetson Orin NX: от установки зависимостей до бенчмарков производительности. Реальные цифры, ошибки и решения.

Открыть документ
Manual #6716 8 min

Как построить эффективный харнесс для кодящего AI-агента: реальный опыт на продакшене

Как обвязать кодящего AI-агента правилами, памятью и инструментами, чтобы он не галлюцинировал и приносил пользу. Реальный опыт на продакшене за 3 месяца с Clau

Открыть документ
Manual #6715 7 min

Эксперименты с поведением LLM: как изменить личность модели через промпты и векторы на примере Qwen3.5-0.8B

Практический разбор изменения поведения модели Qwen3.5-0.8B: от промпт-инжекции до векторных манипуляций. Раскрываем механизмы первого токена и уязвимости safet

Открыть документ
Manual #6714 6 min

Собираем ПК за копейки для 120B dense LLM: 10+ токенов/с, Q5, 64K контекст

Гайд по сборке бюджетного ПК для запуска 120B dense LLM с квантованием Q5/Q6 и 64K контекстом. Расчёт VRAM, выбор GPU, настройка софта для 10+ токенов/с.

Открыть документ
Manual #6713 6 min

Как уместить нейросеть для голосовой активации в 200 КБ: кейс Яндекса для наушников

Разбор того, как Яндекс запихнул споттер Алисы в 208 КБ SRAM наушников Дропс. Квантование, прунинг, NPU — полный гайд по edge AI оптимизации.

Открыть документ
Manual #6710 7 min

Удвоение скорости инференса LLM на AMD MI50: техника параллельных вычислений без дополнительной модели

Инструкция по ускорению LLM в 2 раза на AMD MI50 (19.4→38.1 tk/s) с помощью multi-stream parallel forward. Без speculative decoding, только правильная работа с

Открыть документ
Manual #6707 6 min

Как сэкономить VRAM в llama.cpp: отключаем pipeline parallelism с помощью флага компиляции

Pipeline parallelism по умолчанию жрет VRAM впустую и не дает прироста скорости. Узнайте, как одним флагом компиляции отключить его и выиграть до 1-2 ГБ памяти

Открыть документ
Manual #6702 9 min

Как построить AI-команду для vibe-coding: пайплайн агентов от задачи до прода

Пошаговое руководство по созданию агентного пайплайна разработки на Go, MongoDB и Kubernetes. MCP, саб-агенты, деплой. Избегаем хаоса и техдолга.

Открыть документ
Manual #6700 9 min

Как ускорить генерацию токенов на Gemma 4 с MTP и QAT: настройка и результаты

Полный гайд по ускорению генерации токенов на Gemma 4 27B/31B с помощью MTP и QAT. Реальные цифры скорости на RTX 3060 и RTX 4090. Пошаговая настройка в llama.c

Открыть документ