Гайды по AI и нейросетям - AiManual
AiManual Logo Ai / Manual.
Документация

Учебные материалы

Manual #6440 7 min

Встраиваемая векторная БД для RAG на .NET 8: сценарии, производительность и реализация

Пошаговый гайд по созданию встраиваемой векторной БД на .NET 8 для RAG без внешних сервисов. Сценарии офлайн-приложений, тесты производительности, код.

Открыть документ
Manual #6438 6 min

Токены под микроскопом: во сколько обходится красивый вывод Qwen 3.6 35B

Эксперимент с Qwen 3.6 35B: сколько токенов «съедает» каждый формат вывода, квантование, KV cache. Практические замеры и советы по оптимизации промптов для лока

Открыть документ
Manual #6437 8 min

vLLM против llama.cpp: 5x скорость есть, квантизаций нет. Рабочие обходные пути

vLLM даёт 5x прирост скорости, но не поддерживает GGUF. Разбираем обходные пути: конвертация, AWQ, Unsloth, динамический батчинг. Практические шаги и подводные

Открыть документ
Manual #6434 9 min

Как собрать распределенное хранилище чекпоинтов ML на 4 Raspberry Pi 4B: пошаговое руководство

Пошаговый гайд по сборке отказоустойчивого S3-хранилища для чекпоинтов нейросетей из четырех Raspberry Pi 4B. Все детали, код и типичные ошибки.

Открыть документ
Manual #6431 5 min

Cross-review планов разработки между Claude Code и Codex: методика Plan-tango

Узнайте, как заставить Claude Code и Codex ревьюить друг друга, чтобы избежать галлюцинаций в планах разработки. Пошаговое руководство Plan-tango с примерами и

Открыть документ
Manual #6422 8 min

10 t/s на Qwen 3.5 35B на ноутбуке за $300: рецепт без видеокарты

Запускаем Qwen 3.5 35B MoE на старом ноутбуке за $300 со скоростью 10 токенов/сек. Квантование, Vulkan, пошаговая настройка llama.cpp и секретные флаги.

Открыть документ
Manual #6421 7 min

Автоматическая миграция 200K строк JS на TypeScript с помощью Claude Code: опыт, цифры, ошибки

Реальный кейс миграции 200 000 строк JavaScript на TypeScript с помощью Claude Code. Цифры, скорость, ошибки и сравнение с ручной работой. Читайте!

Открыть документ
Manual #6420 6 min

Три неудачных попытки дообучения Gemma 4: разбор ошибок и практические уроки

Разбираем три реальных кейса неудачного fine-tuning Gemma 4: ошибки датасета, RAG, синтетики. Уроки для тех, кто не хочет сжечь GPU зря.

Открыть документ
Manual #6419 1 min

Codex CLI — полный гид: установка, AGENTS.md, MCP-серверы и продакшн

Полный гид по Codex CLI от OpenAI: установка, конфигурация AGENTS.md, подключение MCP-серверов, боевое использование в CI/CD и продакшне. Команды, примеры, ошиб

Открыть документ
Manual #6415 7 min

Q4_K_M против Q6: как квантование убивает ваших агентов — математика ошибок и что с этим делать

Глубокий анализ влияния квантования Q4_K_M и Q6 на tool calling в агентах. Математика ошибок, практические тесты и советы по выбору беквота для локальных LLM в

Открыть документ
Manual #6414 7 min

8 open-weight моделей в роли агентов в MMO: 10-дневный эксперимент, 93k событий и выводы для разработчиков

Проверили 8 open-weight моделей (Llama 4, Qwen3.5, DeepSeek-V3.5) в MMO-симуляции. Долгосрочное планирование, ресурсная конкуренция, 93k событий. Выводы для про

Открыть документ
Manual #6400 8 min

Как превратить неправильные ответы чата в обучающие данные для LoRA: пошаговое руководство

Научитесь превращать неверные ответы модели в качественный датасет для дообучения LoRA. Пошаговая инструкция с примерами кода и типичными ошибками.

Открыть документ