Гайды по AI и нейросетям - AiManual
AiManual Logo Ai / Manual.
Документация

Учебные материалы

Manual #6186 6 min

Как обучить Gemma-3-270m управлять роботом в симуляции MuJoCo: пошаговое руководство

Пошаговое руководство по fine-tuning компактной LLM Gemma-3-270m для управления роботом-манипулятором в симуляторе MuJoCo. Код, скрипты, советы и типичные ошибк

Открыть документ
Manual #6185 6 min

M5 vs DGX Spark vs Strix Halo vs RTX 6000: кто выживет в локальном AI-забеге?

Четыре железных монстра для локального инференса LLM: Mac M5, NVIDIA DGX Spark, AMD Strix Halo и RTX 6000. Тесты памяти, скорости и цены. Кто реально тянет 70B+

Открыть документ
Manual #6181 1 min

Как ловить уверенные галлюцинации: разбор метрик attribution и specificity для LLM evals

Разбираем, почему одна метрика faithfulness не спасает. Attribution и specificity — как разделить оценку и поймать ложь с высокой уверенностью в RAG.

Открыть документ
Manual #6178 6 min

How to implement verifiable rewards-based reinforcement learning with GRPO on AWS SageMaker

Подробное руководство по реализации RLVR с GRPO на SageMaker с использованием GSM8K. Техники верифицируемых наград, few-shot, ошибки, советы.

Открыть документ
Manual #6176 6 min

Развёртывание ИИ-агента за один день: Ollama, n8n и локальная языковая модель

Пошаговое руководство по созданию прототипа ИИ-агента без программирования и бюджета. Ollama, n8n, Qwen 2.5 — всё локально. Работает на 17.05.2026.

Открыть документ
Manual #6170 8 min

Лучший способ «промывки мозгов» LLM: сравниваем три метода SFT для персонализации

Эксперимент: демонстрации, first-person statements и system prompt — какой из методов fine-tuning дает самую стабильную персонализацию без катастрофического заб

Открыть документ
Manual #6164 9 min

MTP в llama.cpp: как ускорить генерацию до 111% на Strix Halo (бенчмарки 27B, 35B, 122B)

Multi-Token Prediction добрался до AMD Strix Halo: реальные замеры для Qwen 3.6 27B, Qwen 3.5 35B и DeepSeek V3.5 122B. Команды сборки, настройки и результаты +

Открыть документ
Manual #6158 1 min

Как заставить LLM перестать подлизываться: sycophancy, fine-tuning и наш опыт

Sycophancy — главная проблема LLM: модели льстят, а не говорят правду. Разбираем причины, методы fine-tuning и даем работающие рецепты на основе Llama 4, Mistra

Открыть документ
Manual #6156 7 min

Полностью офлайн робот на Jetson Orin и Gemma 4: как собрать, производительность и архитектура

Пошаговый гайд по созданию автономного робота на Jetson Orin NX с локальной Gemma 4 VLA 12B. Измеренная задержка ~200ms, 30+ сенсоров, полная автономность без о

Открыть документ
Manual #6155 7 min

Архитектура AI-копирайтера на базе Notion, RAG и Telegram: автоматизация контента для ресторанной сети

Разбираем архитектуру AI-копирайтера для ресторанной сети: Notion как база знаний, RAG для генерации, Telegram-бот для запросов. Полный гайд с кодом и нюансами.

Открыть документ
Manual #6154 5 min

Orthrus-Qwen3-8B: 7.8x ускорение инференса без потери качества на локальном GPU

Как ускорить Qwen3-8B в 7.8 раз с сохранением точности 100%? Orthrus — speculative decoding с frozen backbone. Пошаговый гайд для локального запуска LLM.

Открыть документ
Manual #6148 7 min

Локальный Qwen 3.6 против топовых моделей: тест на генерацию HTML Canvas анимации — результаты и GIF

Сравнение Qwen 3.6, GPT-4o, Claude 4, Gemini 3 в генерации HTML Canvas анимации. Результаты, GIF, пошаговый запуск локально. Что выбрал DevOps.

Открыть документ