Гайды по AI и нейросетям - AiManual
AiManual Logo Ai / Manual.
Документация

Учебные материалы

Manual #3554 10 min

Как с нуля написать и обучить Трансформер на чистом Python и Numpy: полный гайд с кодом

Пошаговое создание Transformer с нуля на чистом Python и Numpy. Реализация автограда, внимания, обучения. Полный код без PyTorch/TensorFlow.

Открыть документ
Manual #3552 9 min

Как собрать кластер из разных видеокарт для запуска больших LLM: практический гайд на примере Qwen3-Coder-30B

Пошаговый гайд по сборке кластера из разнородных видеокарт для запуска 30B-моделей. Настройка llama.cpp RPC, квантование Q4_K_S, конфигурация для RTX 5080, 3060

Открыть документ
Manual #3551 8 min

Почему вы платите больше за худшие результаты: парадокс настроек усилия в GPT-5 и Gemini Flash 3

Исследование Deep Research Bench показывает: дорогие настройки GPT-5 и Gemini Flash 3 снижают точность веб-поиска. Как сэкономить до 2x без потери качества.

Открыть документ
Manual #3550 9 min

Локальные модели 20-100B для кодинга: как не промахнуться с выбором и не сжечь видеокарту

Практический гайд по выбору локальной LLM для кодинга: сравниваем Qwen3-32B-Coder, GLM-4.7-Flash, DeepSeek-Coder, считаем VRAM, тестируем на реальных задачах. О

Открыть документ
Manual #3547 10 min

FunctionGemma 270M: как заставить крошку вызывать инструменты в диалоге с 97% точностью

Практический гайд по fine-tuning FunctionGemma 270M для multi-turn tool calling. От 10% до 97% accuracy с knowledge distillation. Датасеты, код, результаты.

Открыть документ
Manual #3546 8 min

Claude Code в AWS GovCloud: Как заставить AI работать с военными секретами и не сесть в тюрьму

Полное руководство по запуску Claude Sonnet 4.5 и Claude Code в AWS GovCloud для регулируемых рабочих нагрузок. FedRAMP High, ITAR compliance, IL 4/5 и защита д

Открыть документ
Manual #3545 6 min

Qwen 3 Max-Thinking против Qwen 3.5: MineBench показал, насколько «безумно» улучшилось пространственное мышление

Тестирование пространственного мышления: Qwen 3 Max-Thinking показывает прорыв против Qwen 3.5 на бенчмарке MineBench. Данные на 16.02.2026.

Открыть документ
Manual #3544 6 min

Открытый код на троне: какую модель выбрать в 2026 году по рейтингу OpenRouter

Анализ топ open-source моделей на OpenRouter в 2026 году. Сравнение Arcee Trinity, Qwen 2.5 MoE, Mixtral 12x22B v2. Как выбрать модель для вашей задачи.

Открыть документ
Manual #3541 7 min

Как ИИ увеличивает поток ошибок: антипаттерны разработки и контроль качества при работе с нейросетями

Почему нейросети генерируют баги, как избежать антипаттернов и внедрить контроль качества при работе с ИИ-помощниками. Практический гайд от Senior DevOps.

Открыть документ
Manual #3540 7 min

Оптимизация DeepSeek-V3.2 на llama.cpp: как исправить n_ctx_seq < n_ctx_train и настроить оффлоад слоев

Полное руководство по исправлению ошибки n_ctx_seq < n_ctx_train и тонкой настройке оффлоада слоев GPU/CPU для DeepSeek-V3.2 в llama.cpp. Актуальные команды и п

Открыть документ
Manual #3539 7 min

Разбор провала RAG в продакшене: проблема "Разделённой истины" и галлюцинации LLM на устаревших резюме

Пост-мортем реального инцидента с RAG-системой. Технический разбор проблемы согласованности векторного хранилища и базы данных, ведущей к галлюцинациям LLM.

Открыть документ
Manual #3537 8 min

Интернет пропал, а помощь пришла: как Qwen3:14B на Arch Linux сам себя починил

Реальный кейс: локальная модель Qwen3:14B через Ollama помогла восстановить интернет на Arch Linux без доступа в сеть. Подробный разбор, настройка и выводы.

Открыть документ