Учебные материалы
Как обучить 3B LLM на специфичном датасете (патристическая теология) на одной RTX 3090 за 22 часа: полный разбор
Пошаговый гайд по fine-tuning 3-миллиардной модели на нишевом датасете патристики. Конкретные параметры, код и оптимизации для RTX 3090. Работает за 22 часа.
Как настроить Qwen3.5 27B для рекордной скорости: vLLM, MTP и компиляция под железо
Подробный гайд по ускорению Qwen3.5 27B на двух RTX 3090: tensor parallelism в vLLM, Multi-Token Prediction и компиляция. Достигаем 100+ t/s генерации.
Значительный прирост скорости Vulkan в llama.cpp после обновления прошивки AMD: тесты на Strix Halo и Qwen 3.5 35B
Обновление прошивки AMD и ROCm 7.12 дало +40% скорости Vulkan в llama.cpp для Qwen 3.5 35B на Strix Halo. Детальный разбор и инструкция.
Мышь, которая видит: автоматизация GUI на локальных мультимодальных моделях
Пошаговый гайд по созданию пайплайна для автоматизации графического интерфейса с помощью PyAutoGUI и локальных мультимодальных моделей. Сравнение Ollama и llama
Как запустить AI-агента на старом Android-телефоне: разбор 18 ошибок и финальная конфигурация
Практический гайд по запуску AI-агента на Android-телефоне 2016 года. Разбор 18 фатальных ошибок, настройка Termux, Gemini Flash 2.0 API и готовый рабочий код д
Беспилотник на VLM и ROS2: пошаговый гайд от установки до запуска на реальном железе
Полный гайд по созданию автономного беспилотника на Vision-Language моделях и ROS2. Установка, настройка промптов, работа с реальным железом.
Кэширование для Agentic RAG: архитектура для экономии 30% на запросах и снижения задержек
Глубокая архитектура кэширования для Agentic RAG систем. Практическое руководство по снижению стоимости и латентности на 30% в 2026 году.
Qwen-3.5-27B в кодинге: разбор кейса и почему dense-архитектура впечатляет
Опыт разработки Python-программы с Qwen-3.5-27B. Почему dense-архитектура в 2026 году бьет MoE в кодинге. Фичи, подходы, ошибки.
Почему coding agent 'глупеет' на длинном контексте: диагностика и решение проблемы с KV cache quantization
Глубокий разбор, почему Qwen3-Coder и GLM 4.7 тупеют при длинных задачах. Диагностика проблемы с квантованием KV-cache и пошаговое решение в llama.cpp и ExLlama
Forensic-анализ 211K звёзд OpenClaw на GitHub: методология выявления накрутки и работа с API
Разбираем скандал с 211K звёзд OpenClaw. Практическая методология forensic-анализа с GitHub API, GraphQL batch enrichment и 10 OAuth токенами. Узнайте, как обна
Создание сайта на Jekyll с помощью Claude Code Opus: пошаговый гайд без написания кода
Создайте профессиональный сайт на Jekyll за час, не написав ни строчки. Полный гайд через промпты Claude Code Opus от установки Ruby до деплоя на GitHub Pages.
Автоматизация анализа договорных рисков на LLM: пайплайн, который заставит юристов плакать от счастья
Пошаговая инструкция по настройке автоматизированного пайплайна на LLM для анализа договоров. От формализации рисков до интеграции в юридический отдел.