Гайды по AI и нейросетям - AiManual
AiManual Logo Ai / Manual.
Документация

Учебные материалы

Manual #5155 6 min

Разоблачение Turboquant: как rotation матрицы портят спарсити при квантовании LLM

Глубокий анализ Turboquant: как rotation матрицы улучшают реконструкцию аутлайеров, но портят спарсити активаций. Измерения на Qwen и llama.cpp.

Открыть документ
Manual #5153 8 min

Как запустить 9B модель на 6GB VRAM: бесплатный гайд по использованию Google Colab и Cloudflare Tunnel

Пошаговый гайд по запуску 9B-параметровой LLM на Google Colab T4 с 6GB VRAM и созданию публичного API через Cloudflare Tunnel. Актуально на март 2026.

Открыть документ
Manual #5151 7 min

6 паттернов промпт-инжиниринга для разработчиков: от рефакторинга до аудита безопасности

Готовые шаблоны промптов для рефакторинга, тестирования, миграции кода и аудита безопасности. Практическое руководство для разработчиков.

Открыть документ
Manual #5150 9 min

Как обучить мощную модель для эмбеддингов на одной видеокарте 3060 Ti: руководство по Unsloth и BRIGHT

Пошаговое руководство по обучению модели для эмбеддингов на видеокарте 3060 Ti с использованием Unsloth. Достигните #2 в benchmark BRIGHT на домашнем железе.

Открыть документ
Manual #5149 10 min

Твой Coding Agent глупеет на C#? Qwen 3.5 против Llama 3.3 и баг, который убивает 65K контекст

Глубокий разбор бага tiered eviction в llama.cpp для гибридных моделей. Почему pure-attention 70B лучше для агентного C# кодирования и как избежать потери конте

Открыть документ
Manual #5148 6 min

Как исправить инвалидацию KV-кэша в llama.cpp при использовании Claude Code: инструкция по настройке

Пошаговая инструкция по настройке Claude Code для предотвращения инвалидации KV-кэша в llama.cpp. Решение проблемы перерасчета токенов и повышение производитель

Открыть документ
Manual #5144 9 min

Архитектура Ring: как масштабировать мультиязычную RAG-поддержку на Bedrock Knowledge Bases с экономией 21%

Пошаговый гайд по Ring-архитектуре для глобального RAG-чата на AWS Bedrock Knowledge Bases. Фильтрация по метаданным, пайплайны Step Functions и реальный кейс э

Открыть документ
Manual #5141 6 min

Практическое руководство: как построить семантический поиск по художественным произведениям с помощью RAG

Пошаговый гайд по созданию семантического поиска по 90k историй с учетом сюжета и контекста. Выбор эмбеддинг-моделей, стратегии чанкинга и реранкеров на 2026 го

Открыть документ
Manual #5140 7 min

От шаблонных рекомендаций к умному собеседнику: создаем кино-агента на Amazon Bedrock AgentCore

Пошаговый гайд по созданию гибридного агентного ассистента для персонализированных рекомендаций фильмов на Amazon Bedrock. Используем AgentCore, Nova Sonic 2.0

Открыть документ
Manual #5138 9 min

Сравнение локальных моделей для text-to-SQL: неожиданные лидеры и как запустить бенчмарк самому

Практическое сравнение локальных моделей для генерации SQL. Запусти свой бенчмарк, узнай, какая модель лучше на твоих данных. Результаты на 30.03.2026.

Открыть документ
Manual #5125 8 min

Почему opensource-модели фейкут вызовы инструментов и как это исправить: гайд по настройке OpenRouter и MCP

Почему локальные модели имитируют вызовы инструментов и как настроить реальный веб-поиск через OpenRouter и MCP-серверы. Подробный гайд на 2026 год.

Открыть документ
Manual #5122 7 min

PowerInfer для слабых CPU: принцип работы sparse activation и обзор альтернатив для старых ноутбуков

Гайд по запуску больших моделей на старом железе. Принцип работы PowerInfer, сравнение llama.cpp и MLX, выбор квантования для Intel 8th gen.

Открыть документ