Гайды по AI и нейросетям - AiManual
AiManual Logo Ai / Manual.
Документация

Учебные материалы

Manual #4471 8 min

Сжимаем Llama 8B до 2.5 ГБ: Экстремальный гайд для Jetson Orin Nano

Практический гайд по запуску 8-миллиардной модели Llama на Jetson Orin Nano с всего 2.5 ГБ памяти. Квантование, оптимизация, ошибки и реальные показатели.

Открыть документ
Manual #4468 6 min

Тепловое троттлинг на MacBook M5 Max: сравнение 14” и 16” для непрерывного вывода 72B моделей

Реальные тесты теплового троттлинга на MacBook M5 Max 14” и 16” при непрерывном выводе Qwen 2.5 72B. Сравнение температуры, скорости генерации и практические ре

Открыть документ
Manual #4466 10 min

Архитектура AI-фабрики: как собрать команду из 9 агентов на open-source моделях с одной видеокартой — конфиги, модели, бенчмарки

Практический гайд: собираем команду из 9 AI-агентов на open-source моделях с одной RTX 4090. Конкретные модели для каждой роли, настройки VRAM, бенчмарки HumanE

Открыть документ
Manual #4464 8 min

SLAY-ASR: практическое руководство по добавлению аудиомодальности в LLM с минимальными затратами (рецепт на полгода)

Пошаговое руководство по кодированию аудио в латентные представления для LLM. Альтернатива Whisper, кросс-аттеншн, практические советы на 2026 год.

Открыть документ
Manual #4463 6 min

Ловушка Langfuse: как SDK по умолчанию перехватывает чужие трейсы и накручивает счёт — инструкция по отключению

Подробное руководство по отключению скрытого перехвата всех трейсов в Langfuse SDK. Узнайте, как избежать неожиданных расходов и настроить фильтрацию.

Открыть документ
Manual #4462 7 min

Правда о скорости MLX на Mac: почему бенчмарки в UI врут и как измерить реальную производительность

Разоблачаем мифы о производительности MLX. Как измерить реальные tokens/s на Apple Silicon. Сравнение prefill и generation time на M1 Max и M5.

Открыть документ
Manual #4459 10 min

Автоматизируем аналитику без дашбордов: как построить MCP-сервер для вашего AI-агента

Практический гайд по созданию MCP-сервера для доступа AI-агента к данным аналитики. Автоматизируйте запросы к Mixpanel/GA4 без дашбордов. Работает с Claude, Cur

Открыть документ
Manual #4458 7 min

Как настроить агентное кодирование на слабой видеокарте: практический гайд по Qwen3.5-9B

Полная инструкция по запуску Qwen3.5-9B для автономного кодирования на RTX 3060 12GB. Квантование через Unsloth, настройка tool calls и оптимизация памяти.

Открыть документ
Manual #4456 7 min

Как дообучить NVIDIA Nemotron Speech ASR на Amazon EC2: полный гайд по адаптации под домен

Пошаговое руководство по тонкой настройке NVIDIA Nemotron Speech ASR на Amazon EC2 p4d с DeepSpeed. Адаптация модели под доменные данные.

Открыть документ
Manual #4453 7 min

Практическое руководство по multi-label классификации изображений для встраиваемых устройств

Пошаговое руководство по созданию multi-label классификатора изображений для встраиваемых устройств. Сбор датасета, разметка, выбор модели, оптимизация и деплой

Открыть документ
Manual #4451 11 min

Собираем локальный голосовой ввод на Python: Whisper + Ollama для Windows, macOS и Linux

Полный гайд по сборке системы голосового ввода без интернета. Используем Whisper для транскрипции и Ollama для обработки текста на Windows, macOS и Linux. Готов

Открыть документ
Manual #4450 9 min

Квантование и Matryoshka Embeddings: как сократить расходы на векторные базы данных на 80%

Практическое руководство по квантованию и Matryoshka Representation Learning для уменьшения размера эмбеддингов. Расчёт экономии памяти и стоимости. Примеры код

Открыть документ