Учебные материалы
Создание LLM с нуля: опыт pretrain и RLHF 7B модели с архитектурой DeepSeek и оптимизацией VRAM
Пошаговый гайд по созданию 7B MoE модели DeepSeek с нуля: pretrain, RLHF (PPO/GRPO), оптимизация VRAM, muon-оптимизатор. Реальный опыт двух GPU.
Почему плохой ответ модели — это не проблема модели: разбор типичных ошибок в inference-системах
Разбираем скрытые причины плохих ответов LLM: проблемы retrieval, контекста и маршрутизации. Диагностика, примеры и пошаговый план для инженеров RAG и fine-tuni
Qwen на M4 Max: как я выключил интернет и заставил Mac стенографировать встречи быстрее облака
Пошаговый гайд по созданию полностью локального AI-секретаря для саммари встреч на Mac с Qwen 3.5/3.6 и оптимизацией под M4 Max. Без утечек данных, без задержек
Как отключить сжатие памяти в Windows 11 для ускорения LLM: решение проблемы с AMD GPU
Сжатие памяти в Windows 11 (Memory Compression) может резать скорость LLM на AMD GPU до 50%. Команда Disable-MMAgent -mc за секунду отключает этот тормоз. Полны
ARMageddon: Как скрестить четыре Raspberry Pi в кластер для нейросетей и не сойти с ума
Пошаговое руководство по созданию кластера из Raspberry Pi 5 для распределенного инференса и федеративного обучения LLM. Реальные тесты, подводные камни, актуал
Как использовать Cursor для быстрого прототипирования корпоративных модулей: режимы Agent, Plan, Debug, Ask
Пошаговое руководство по режимам Cursor для быстрого прототипирования модулей в enterprise-проектах. Настройка .cursor/rules, комбинирование режимов, ошибки и л
ИИ для продажников: промпты, которые реально закрывают сделки в 2026
Гайд: как с помощью ChatGPT и Perplexity готовиться к звонкам за 5 минут. Реальные промпты и методики для sales-отделов. Экономьте время и закрывайте больше сде
Кэширование трекинга YOLO с Redis: готовые сниппеты для экономии GPU
Как сэкономить до 40% GPU при трекинге объектов YOLO? Используем Redis для кэширования треков ByteTrack и DeepSORT. Готовые сниппеты кода и разбор ошибок.
Проблемы с MiMo-V2.5 310B: массовые галлюцинации в квантизированной версии
Разбираем массовые галлюцинации у MiMo-V2.5 310B после квантования. Почему MoE-модели Xiaomi ломаются в GGUF и как не попасть в ловушку.
Как заставить LLM играть в Мафию: многомодельный театр на llama.cpp
Пошаговое руководство по организации ролевой игры Мафия (Werewolf) на нескольких локальных LLM (Gemma4, Qwen3.6) с переключением моделей и отключением chain-of-
Почему SFT может ухудшить следование инструкциям на маленьких моделях: разбор эксперимента с 1B, 2B, 3B
Эксперимент показал: SFT на 1B модели ухудшил IFEval на 5.75 пункта, в то время как 2B и 3B улучшили. Разбираем причины и даем рекомендации для выбора размера м
Вайб-кодинг для ПЛИС: как создать I2S FIFO-реклокер с помощью Gemini Pro без знания Verilog
Пошаговое руководство по созданию I2S FIFO-реклокера на ПЛИС с помощью Gemini 2.5 Pro. Никакого Verilog, только промпты и здравый смысл. Реальный кейс вайб-коди