Гайды по AI и нейросетям - AiManual
AiManual Logo Ai / Manual.
Документация

Учебные материалы

Manual #1700 8 min

VibeVoice-Realtime-0.5B на Orange Pi: дикий гуайд по квантованию, которого нет в интернете

Полное руководство по поиску и квантованию VibeVoice-Realtime-0.5B Stream для Orange Pi и одноплатников. GGUF, ONNX, оптимизация памяти.

Открыть документ
Manual #1694 9 min

3x NVIDIA V620 на 96 ГБ VRAM: постройка локального монстра для ИИ без компромиссов

Подробное руководство по сборке мощной локальной станции с тремя NVIDIA V620 на 96 ГБ VRAM для запуска больших языковых моделей. Аппаратная часть, настройка, те

Открыть документ
Manual #1693 8 min

Minimax 2.1 на чистом CPU: какой квант выбрать, если нет видеокарты

Тестируем Minimax 2.1 на CPU без GPU. Сравниваем q4, q5, q8 квантования. Замеры скорости на DDR4/DDR5. Какой формат выбрать для работы в RAM.

Открыть документ
Manual #1692 8 min

Локальный ИИ на телефоне: как собрать требования сообщества и не сойти с ума

Гид для разработчиков: как собрать требования сообщества для идеального мобильного приложения с локальным ИИ. Архитектура, модели, офлайн-режим.

Открыть документ
Manual #1690 11 min

Генерация игровых миров с помощью Instructor и локальной LLM: полный туториал по созданию RPG-вселенной

Пошаговый гайд по генерации консистентных игровых миров с помощью Instructor, Pydantic и локальной LLM. Создаем RPG-вселенную с SQLite-реестром фактов.

Открыть документ
Manual #1689 7 min

Проблемы при обучении LM с нуля: анализ ошибок потерь (loss) и работа с The Pile

Практический гайд по диагностике странного поведения loss при обучении языковой модели с нуля на The Pile. Решаем проблемы с DDP, потоковой загрузкой и отладкой

Открыть документ
Manual #1686 9 min

16 ГБ VRAM и выбор модели: Qwen2.5 против Mistral, поиск замены Gemini

Детальное руководство по выбору GGUF модели для RTX 5060 Ti 16 ГБ. Сравнение Qwen2.5, Mistral, квантования Q6_K, поиск локальной замены Gemini.

Открыть документ
Manual #1684 10 min

Как создать автономный Infinite Podcast на локальных моделях: полный гайд с Python и RTX 5060 Ti

Полный гайд по созданию бесконечного автономного подкаста на локальных языковых моделях без облачных API. Python, TTS, LLM и полная независимость.

Открыть документ
Manual #1683 7 min

RLVR с GRPO: от теории к работающему коду в ноутбуке

Пошаговое руководство по RLVR с GRPO алгоритмом. Учим LLM с подкреплением с нуля: установка, код, обучение, ошибки. Полный ноутбук с кодом.

Открыть документ
Manual #1682 8 min

Автономный ИИ-агент QA для тестирования бэкенда: концепция и архитектура стенда

Полное руководство по созданию автономного ИИ-агента QA для тестирования бэкенда. Концепция, архитектура стенда, пошаговый план и разбор ошибок.

Открыть документ
Manual #1681 8 min

Экстремальная оптимизация языковых моделей: как запустить LLM на NES и в compile-time C++

Технический эксперимент: как запустить языковую модель на Nintendo Entertainment System и в compile-time C++ с помощью template метапрограммирования. 6502 asm,

Открыть документ
Manual #1680 10 min

Сербские сканы против LLM: как достать данные и не сойти с ума

Полный гайд по OCR и LLM для сканированных PDF на сербском. Решаем проблемы с точностью, layout detection и мультимодальностью. Код, ошибки, альтернативы.

Открыть документ