Гайды по AI и нейросетям - AiManual
AiManual Logo Ai / Manual.
Документация

Учебные материалы

Manual #4935 7 min

TurboQuant от Google: тестирование метода экстремального квантования для локальных LLM

Практический гайд по тестированию метода TurboQuant от Google для сжатия LLM до 1-2 бит на вес. Установка, калибровка, сравнение с AWQ и GPTQ на актуальных моде

Открыть документ
Manual #4934 9 min

Новый Figma MCP-сервер: как настроить AI-агента для автоматической сборки дизайна по вашей системе

Полное руководство по настройке Figma MCP-сервера в режиме read/write для автоматической сборки UI по вашей дизайн-системе с помощью AI-агентов. Актуально на ма

Открыть документ
Manual #4932 7 min

Интеграция TurboQuant в MLX Studio: инструкция по квантованию моделей для Apple Silicon

Полное руководство по интеграции TurboQuant в MLX Studio для квантования LLM под Apple Silicon. Шаги, ошибки, настройки на 2026 год.

Открыть документ
Manual #4929 6 min

Тупой бенчмарк для LLM: как 76% моделей галлюцинируют на простейшем вопросе 'current date'

Эксперимент: 76% языковых моделей дают неверный ответ на вопрос 'current date'. Почему LLM галлюцинируют на простом и как это тестировать. Методика тупого бенчм

Открыть документ
Manual #4925 9 min

Per-row MSE quantization: практическое руководство по сжатию LLM до 15MB с минимальной потерей качества

Пошаговый гайд по per-row MSE quantization для сжатия больших языковых моделей. Код на PyTorch, сравнение BPB, оптимизация под edge-устройства.

Открыть документ
Manual #4924 8 min

Локальный Qwen 3.5 на 16 ГБ GPU против облачного Kimi K2.5: тест скорости и точности

Детальное сравнение локального запуска Qwen 3.5 с квантованием unsloth q2_k_xl на 16 ГБ GPU и облачного Kimi K2.5. Метрики скорости 120 t/s, настройка LM Studio

Открыть документ
Manual #4920 5 min

Компрометация LiteLLM 1.82.7 и 1.82.8: инструкция по проверке и срочному обновлению

Подробная инструкция по проверке и срочному обновлению LiteLLM после компрометации версий 1.82.7 и 1.82.8. Актуально на 24 марта 2026 года.

Открыть документ
Manual #4917 8 min

Agentic RAG Challenge 2026: разбор победного решения и метрик оценки (точность, скорость, токены)

Как победили в Agentic RAG Challenge 2026: разбор решения, метрики точности, скорости, токенов. Юридические документы DIFC, векторный поиск, практика для разраб

Открыть документ
Manual #4915 6 min

Автоматизация мультиагентных систем: пайплайны, триггеры и bounce-back для AI-воркеров

Пошаговое руководство по автоматизации мультиагентных систем с помощью пайплайнов, триггеров и bounce-back механизмов. Актуально на 2026 год.

Открыть документ
Manual #4914 8 min

Как защитить систему от AI: практическое руководство по sandboxing для локальных LLM

Практическое руководство по изоляции AI-агентов с Docker и виртуальными машинами. Защита от supply chain атак и вредоносного кода.

Открыть документ
Manual #4913 8 min

Ваш LLM сервер жрет память как не в себя? Виновник - фрагментация кучи glibc. Исправляем за 5 минут настройкой MALLOC_*

OOM-killed ваш сервер LLM? Это не утечка, а фрагментация кучи glibc. Глубокий разбор и пошаговое решение через настройку MALLOC_MMAP_THRESHOLD_ и MALLOC_TRIM_TH

Открыть документ
Manual #4902 8 min

Профессиональные практики AI-кодинга: как добиваться качественного кода (TDD, контекст, стек, риск-менеджмент)

Как использовать ИИ для написания качественного кода. Практические методы TDD, управления контекстом, выбора стека и риск-менеджмента. Обновлено на 2026.

Открыть документ