Гайды по AI и нейросетям - AiManual
AiManual Logo Ai / Manual.
Документация

Учебные материалы

Manual #2353 8 min

Как создать локальный диктофон для Windows с потреблением <50MB RAM на Whisper и Native AOT

Пошаговое руководство по созданию офлайн-диктофона для Windows с использованием квантованного Whisper и Native AOT для экономии памяти и приватности.

Открыть документ
Manual #2351 7 min

Две RTX PRO 6000 и терабайт памяти: выдержит ли эта станция 20 одновременных пользователей?

Реальные тесты производительности, сравнение fp8 vs int4, анализ масштабируемости и ограничений KV-cache на серверной рабочей станции с 1.15TB RAM.

Открыть документ
Manual #2347 7 min

Конец эпохи GPU: как термодинамические вычисления уничтожат энергозатраты ИИ

Физические чипы Normal Computing. Генерация изображений без матриц умножения. Прототипы на фазовых переходах. Почему это работает и когда убьет NVIDIA.

Открыть документ
Manual #2346 8 min

Qwen3-32B INT4: как получить 12-кратный прирост емкости с потерей точности 1.8%

Практический гайд по квантованию Qwen3-32B до INT4: 12-кратный прирост емкости модели с потерей точности менее 2% на бенчмарках MMLU-Pro. Подробный разбор метод

Открыть документ
Manual #2343 8 min

Kimi-K2.5 на vLLM: почему TTFT убивает производительность и как это исправить

Полный разбор проблем с Time To First Token в Kimi-K2.5 на vLLM. Настройка для 128k контекста, бенчмарк производительности и оптимизация токенизатора. Практичес

Открыть документ
Manual #2342 9 min

Как обучить Gemma-3 270M для обфускации данных: инструкция по финтюну с Unsloth и датасетом на 1700 примеров

Полное руководство по обучению Gemma-3 270M для анонимизации данных на португальском языке с Unsloth. Датасет 1700 примеров, код, ошибки.

Открыть документ
Manual #2334 8 min

Контекст гниёт, а вы платите: как RLM и DSPy убивают коллапс контекста

Полное руководство по Recursive Language Models (RLM) и DSPy для борьбы с контекстным коллапсом. Практические решения, код, сравнение методов.

Открыть документ
Manual #2328 8 min

Как исправить проблему с выбором embedding-модели в LM Studio: RAG не переключается с Nomic

Подробный гайд по решению проблемы, когда LM Studio не переключает embedding-модель для RAG с nomic-embed-text-v1. Шаги по очистке кэша, правке конфигов и настр

Открыть документ
Manual #2325 7 min

Как безопасно дать AI-агенту доступ к shell: сравнение Docker, gVisor и Firecracker для песочниц

Полное руководство по изоляции AI-агентов в shell. Сравнение Docker, gVisor и Firecracker для песочниц на 2026 год. Как избежать утечек API-ключей.

Открыть документ
Manual #2322 10 min

Слоистая архитектура для AI-приложений: как сделать код читаемым, надежным и расширяемым

Практическое руководство по созданию читаемых, надежных и расширяемых AI-приложений с использованием слоистой архитектуры, вертикальных срезов и современных пат

Открыть документ
Manual #2321 9 min

Как построить экспертного RAG-ассистента на CPU VPS: оптимизация 10k книг, выбор архитектуры и модели эмбеддингов

Пошаговый гайд по созданию экспертного RAG-ассистента на CPU VPS с 16GB RAM. Выбор моделей эмбеддингов, настройка Qdrant с mmap, реранкинг BGE и оптимизация под

Открыть документ
Manual #2319 9 min

Контекст или галлюцинации: 3 работающих способа заставить LLM не врать в ваших проектах

Claude Projects, Cursor с RAG, MCP-серверы — практические техники для уменьшения галлюцинаций LLM в реальных проектах. Руководство от Senior DevOps.

Открыть документ