Гайды по AI и нейросетям - AiManual
AiManual Logo Ai / Manual.
Документация

Учебные материалы

Manual #4257 10 min

Запуск модели Qwen2.5 72B на двух видеокартах через llama.cpp RPC: полное руководство по настройке Docker

Детальное руководство по запуску Qwen2.5-72B-Instruct-Q3_K_M на двух видеокартах через llama.cpp RPC в Docker. Решение проблемы VRAM. Пошаговая настройка, квант

Открыть документ
Manual #4250 8 min

MLX vs GGUF на Mac M4: итоги битвы форматов для запуска Qwen3.5 122B

Подробный бенчмарк MLX и GGUF форматов для запуска Qwen3.5 122B на Mac M4 Max 128GB. Таблицы производительности, память, время до первого токена.

Открыть документ
Manual #4247 7 min

Как реверс-инженирить водяной знак SynthID от Google: полный разбор метода без нейросетей

Пошаговое руководство по реверс-инжинирингу водяного знака SynthID от Google с использованием FFT-анализа. Код на Python, объяснение метода и нюансы.

Открыть документ
Manual #4244 8 min

Как исправить бесконечное мышление Qwen 3.5 9B на Mac: пошаговое руководство с Hugind

Полное руководство по фиксу бесконечной генерации Qwen 3.5 9B на Apple Silicon. Настройка YAML, metal_unified preset, работа с GGUF.

Открыть документ
Manual #4243 9 min

Как остановить галлюцинации Whisper в тишине: блоклист из 135 фраз и решение проблемы

Whisper генерирует текст в тишине? Решение: блоклист из 135 фраз, работа с no_speech_prob и исправление декодера. Практический гайд на 2026 год.

Открыть документ
Manual #4241 11 min

Как эффективно квантовать MoE-модели: разбор новой методики Unsloth для Qwen 3.5 с KLD-метриками

Пошаговое руководство по квантованию MoE-моделей Qwen 3.5 с использованием новой методики Unsloth и калибровки KL-дивергенцией. Оптимизация размера и качества.

Открыть документ
Manual #4238 8 min

Автоматизация аналитики: готовый Python-скрипт на 75 строк для замены аналитика с помощью Claude API и pandas

Готовый скрипт на Python для автоматического анализа финансовых отчетов с помощью Claude API и pandas. Экономит часы работы аналитика.

Открыть документ
Manual #4237 8 min

Dr. Zero: как заставить AI-агентов учиться самостоятельно, без датасетов и людей

Полное руководство по фреймворку Dr. Zero от Hugging Face. Узнайте, как два AI-агента (Solver и Proposer) учат друг друга без человеческих данных. Установка, на

Открыть документ
Manual #4235 8 min

Какая модель лучше для NER на русском: практическое сравнение RuModernBERT и multilingual-e5-base на реальных данных

Практический эксперимент по извлечению именованных сущностей на русском языке. Сравниваем две современные модели на реальных данных, смотрим на метрики F1-score

Открыть документ
Manual #4234 7 min

Исправление ошибки: Qwen 3.5 выводит бессмыслицу после 2-3 ответов в Llama.cpp (глубокий разбор и решения)

Глубокий разбор ошибки Qwen 3.5 в Llama.cpp, когда модель выводит бессмыслицу после 2-3 ответов. Пошаговые решения, настройки квантования и параметров на 05.03.

Открыть документ
Manual #4233 9 min

Тестирование Qwen3.5 на NVIDIA V100 с NVLink: скорость inference, настройка и оптимизация

Полный гайд по запуску Qwen3.5 на NVIDIA V100 с NVLink. Актуальные цифры скорости (до 80 t/s), пошаговая настройка multi-GPU, квантование и тонкая оптимизация i

Открыть документ
Manual #4232 6 min

Как добиться 85% на SimpleQA с Llama-3.2 3B и Keiro API: локальный запуск за $0.005 за запрос

Практический гайд по достижению 85% точности на SimpleQA с локальной Llama-3.2 3B и Keiro API. Стоимость запроса всего $0.005. Пошаговая инструкция.

Открыть документ