Учебные материалы
Как обучить Gemma-3-270m управлять роботом в симуляции MuJoCo: пошаговое руководство
Пошаговое руководство по fine-tuning компактной LLM Gemma-3-270m для управления роботом-манипулятором в симуляторе MuJoCo. Код, скрипты, советы и типичные ошибк
M5 vs DGX Spark vs Strix Halo vs RTX 6000: кто выживет в локальном AI-забеге?
Четыре железных монстра для локального инференса LLM: Mac M5, NVIDIA DGX Spark, AMD Strix Halo и RTX 6000. Тесты памяти, скорости и цены. Кто реально тянет 70B+
Как ловить уверенные галлюцинации: разбор метрик attribution и specificity для LLM evals
Разбираем, почему одна метрика faithfulness не спасает. Attribution и specificity — как разделить оценку и поймать ложь с высокой уверенностью в RAG.
How to implement verifiable rewards-based reinforcement learning with GRPO on AWS SageMaker
Подробное руководство по реализации RLVR с GRPO на SageMaker с использованием GSM8K. Техники верифицируемых наград, few-shot, ошибки, советы.
Развёртывание ИИ-агента за один день: Ollama, n8n и локальная языковая модель
Пошаговое руководство по созданию прототипа ИИ-агента без программирования и бюджета. Ollama, n8n, Qwen 2.5 — всё локально. Работает на 17.05.2026.
Лучший способ «промывки мозгов» LLM: сравниваем три метода SFT для персонализации
Эксперимент: демонстрации, first-person statements и system prompt — какой из методов fine-tuning дает самую стабильную персонализацию без катастрофического заб
MTP в llama.cpp: как ускорить генерацию до 111% на Strix Halo (бенчмарки 27B, 35B, 122B)
Multi-Token Prediction добрался до AMD Strix Halo: реальные замеры для Qwen 3.6 27B, Qwen 3.5 35B и DeepSeek V3.5 122B. Команды сборки, настройки и результаты +
Как заставить LLM перестать подлизываться: sycophancy, fine-tuning и наш опыт
Sycophancy — главная проблема LLM: модели льстят, а не говорят правду. Разбираем причины, методы fine-tuning и даем работающие рецепты на основе Llama 4, Mistra
Полностью офлайн робот на Jetson Orin и Gemma 4: как собрать, производительность и архитектура
Пошаговый гайд по созданию автономного робота на Jetson Orin NX с локальной Gemma 4 VLA 12B. Измеренная задержка ~200ms, 30+ сенсоров, полная автономность без о
Архитектура AI-копирайтера на базе Notion, RAG и Telegram: автоматизация контента для ресторанной сети
Разбираем архитектуру AI-копирайтера для ресторанной сети: Notion как база знаний, RAG для генерации, Telegram-бот для запросов. Полный гайд с кодом и нюансами.
Orthrus-Qwen3-8B: 7.8x ускорение инференса без потери качества на локальном GPU
Как ускорить Qwen3-8B в 7.8 раз с сохранением точности 100%? Orthrus — speculative decoding с frozen backbone. Пошаговый гайд для локального запуска LLM.
Локальный Qwen 3.6 против топовых моделей: тест на генерацию HTML Canvas анимации — результаты и GIF
Сравнение Qwen 3.6, GPT-4o, Claude 4, Gemini 3 в генерации HTML Canvas анимации. Результаты, GIF, пошаговый запуск локально. Что выбрал DevOps.