Учебные материалы
Strix Halo NPU для запуска LLM в Linux: настройка FastFlowLM и тесты энергоэффективности против GPU
Полное руководство по настройке FastFlowLM для AMD Strix Halo NPU под Linux. Тесты скорости и энергоэффективности LLM против RTX 4090 и Arc Pro B60. Квантование
Как перейти с ChatGPT на Claude: полный гайд по миграции данных и этический выбор
Полное руководство по переносу данных и промптов из ChatGPT в Claude 4.5. Экспорт истории, настройка конфиденциальности и этические причины для смены ИИ-ассисте
Qwen3.5 Thinking Mode: детальное руководство по активации и тестам для моделей 2B-122B
Практический гайд по активации Thinking Mode в Qwen3.5. Тесты reasoning и context recall на моделях от 2B до 122B в Unsloth и LM Studio. Советы по квантованию и
GATv2Conv против GCNConv: почему температура на Raspberry Pi предсказывается точнее с динамическим вниманием
Сравнение GATv2Conv и GCNConv на реальном проекте edge-прогноза погоды для Raspberry Pi. Код, результаты, оптимизация для устройств с 4GB RAM.
Управление слотами в llama.cpp: как принудительно остановить inference в Open WebUI и не убить сервер
Пошаговое руководство по принудительной остановке inference в llama.cpp через управление слотами. Как остановить генерацию в Open WebUI, не убивая весь сервер.
Qwen 3.5 сошел с ума: как обуздать бесконечные вызовы инструментов и заставить слушаться системный промпт
Подробный гайд по решению главных проблем Qwen 3.5: игнорирование системных промптов и бесконечные циклы вызовов инструментов. Рабочие стратегии на 2026 год.
AI-агенты работают как попало? Автоматические бенчмарки на Langfuse поставят их на место
Пошаговая система автоматической оценки качества AI-агентов с метриками, трейсингом и алерт-правилами. Практический гайд на Langfuse для продакшн-команд.
Обзор лучших LLM-моделей для программирования на Macbook M5 Pro: тесты производительности и квантования
Практический гайд по выбору и запуску локальных LLM для программирования на Macbook Pro M5. Сравнение DeepSeek-Coder, Qwen2.5-Coder, GPT-OSS-20B, настройка LM S
Context Engineering для coding-агентов: как управлять памятью Claude Code на длинных задачах (на примере CLAUDE.md и Plan Mode)
Как избежать деградации coding-агентов на длинных задачах. Методики context engineering, CLAUDE.md, Plan Mode. Пошаговый гайд на 2026 год с актуальными данными.
Настройка Qwen 3.5 в llama.cpp: почему bf16 KV cache критически важен для точности
Пошаговое руководство по настройке Qwen 3.5 в llama.cpp с bf16 KV cache. Замеры perplexity, ошибки и оптимизация памяти. Актуально на 2026 год.
Полное руководство по AI Red Teaming: как взломали инфраструктуру Grok от xAI
Глубокий разбор атаки на инфраструктуру Grok. Методология AI Red Teaming, извлечение системного промпта, jailbreaks, CSRF, WAF bypass и пошаговый план защиты LL
Как обучить 3B LLM на специфичном датасете (патристическая теология) на одной RTX 3090 за 22 часа: полный разбор
Пошаговый гайд по fine-tuning 3-миллиардной модели на нишевом датасете патристики. Конкретные параметры, код и оптимизации для RTX 3090. Работает за 22 часа.