Гайды по AI и нейросетям - AiManual
AiManual Logo Ai / Manual.
Документация

Учебные материалы

Manual #5928 9 min

Анатомия файнтюна: что скрывается за громкими названиями LLM на HuggingFace (разбор Qwen3.5-21B-Claude-4.6-Opus-Heretic-U)

Детальный разбор техник Depth Upscaling, Abliteration, Heretic и мерджа моделей на примере популярного файнтюна. Как не вестись на маркетинговые названия на Hug

Открыть документ
Manual #5925 6 min

Python deque для реального времени: как использовать скользящие окна с помощью collections.deque

Почему list убивает производительность потоковых пайплайнов и как collections.deque решает эту проблему. Полный туториал с кодом для AI-мониторинга и метрик.

Открыть документ
Manual #5924 8 min

Как развернуть Vision-Language модель на AWS Inferentia2 и не разориться: пошаговый гайд для real-time детекции животных

Пошаговый гайд по деплою BLIP модели на Inferentia2 для real-time детекции поведения животных. Сравнение цен с GPU, компиляция Neuron, оптимизация inference.

Открыть документ
Manual #5922 8 min

RTX 5080 16GB: Qwen3.6 27B MTP или 35B-A3B MoE MTP — что выбрать для локального кодинга?

Сравнение двух моделей Qwen3.6 с MTP для RTX 5080 16GB: плотная 27B против MoE 35B-A3B. Реальные бенчмарки, настройки offload CPU, выбор квантования и советы дл

Открыть документ
Manual #5921 8 min

Год с Claude Code: как собрать рабочую конфигурацию для вайбкодинга — от CLAUDE.md до skills и routing

Как собрать рабочую конфигурацию Claude Code для долгих проектов: от плоского CLAUDE.md до роутинга агентов. Ошибки, примеры, шаги.

Открыть документ
Manual #5920 7 min

Как собрать локальный RAG на n8n: опыт Flowwow с self-hosted LLM

Пошаговое руководство по сборке корпоративного RAG на n8n с self-hosted LLM. Экономия в 5,5 раз. Кейс Flowwow: архитектура, ошибки, результаты.

Открыть документ
Manual #5919 5 min

Не бойся, отключай: как вырезать цензуру из LLM и не сломать мозги модели

Подробное руководство по снятию цензуры с LLM: merging, fine-tuning, DPO, ORPO. Инструменты, бенчмарки, сохранение качества. Актуально на май 2026.

Открыть документ
Manual #5912 6 min

ФСТЭК прижал ИИ: разбор методики к приказу №117 — что делать госорганам и КИИ

Разбираем пункт 3.18, скрытые риски и практические шаги для госорганов и объектов КИИ. Как подготовиться к проверкам в 2026 году.

Открыть документ
Manual #5909 7 min

Как получить 2.5x ускорение инференса Qwen 3.6 27B с помощью MTP: полное руководство для локальных кодинг-агентов

Пошаговое руководство по настройке Multi-Token Prediction для Qwen 3.6 27B. Конвертация в GGUF, запуск в llama.cpp, оптимизация для VRAM 48 ГБ и исправление cha

Открыть документ
Manual #5906 7 min

Как заменить диктора open-source TTS-моделью: тестируем OmniVoice на русском для бизнес-сценариев

Практическое тестирование OmniVoice на русском языке: числа, даты, ФИО, паузы. Пошаговый гайд, нюансы и сравнение с аналогами. Узнайте, стоит ли заменять диктор

Открыть документ
Manual #5898 7 min

Как подсчитать экономию от запуска локальных LLM: реальный кейс с 200 млн токенов за 5 дней

Реальный расчет: сколько вы сэкономите, запустив Qwen 3.5 397B локально вместо API. Пошаговый гайд с цифрами, ошибками и формулой effective cost.

Открыть документ
Manual #5896 9 min

Самовосстанавливающийся RAG: как исправить галлюцинации LLM в реальном времени без внешних API

Пошаговый гайд по созданию самовосстанавливающегося RAG-пайплайна на чистом Python. Детектим fake citations, числовые противоречия и сущности — чиним ответ за <

Открыть документ