Учебные материалы
Создание RAG-агента для объяснения настолок: PocketFlow, ObjectBox и BlackSheep на практике
Полное руководство по созданию легковесного RAG-агента для объяснения правил настольных игр на Python. Используем PocketFlow, ObjectBox и BlackSheep без тяжёлых
ReAP квантование: разоблачение мифа о «почти без потерь» на реальных тестах
Личный тест ReAP квантования на Llama 3.1 8B. Официальные бенчмарки лгут - метод теряет до 20% точности в практических задачах.
Черный ящик сломали: как найти и выключить «несущие» нейроны в Llama 3.2 3B
Пошаговый гайд по анализу внутренних представлений Llama 3.2 3B. Находим критические нейроны, ломаем семантику, сохраняя беглость текста. Методы, код, ловушки.
MCP Tool Registry: практическое руководство по автоматизации RAG-систем
Пошаговое руководство по созданию MCP Tool Registry для автоматизации RAG-систем. Архитектура, код, развертывание и оптимизация оркестрации AI-инструментов.
AMD 7900 XTX + ROCm: полный бенчмарк llama.cpp vs vLLM на eGPU через Thunderbolt 3
Эксклюзивный тест производительности 8 LLM на AMD 7900 XTX через Thunderbolt 3. Сравнение llama.cpp и vLLM, реальная скорость токенов, ограничения eGPU и настро
Сборка llama.cpp не для всех: как заставить его летать на твоём железе
Полный гайд по сборке llama.cpp с MKL, CUDA архитектурой, AVX2 и Vulkan. Флаги CMake для i7, RTX, AMD. Ускорение инференса в 3-5 раз.
Как создать AI-радиостанцию на базе Qwen 1.5B и Piper TTS: туториал по VibeCast
Пошаговый гайд по созданию локальной AI-радиостанции с генерацией скриптов, синтезом речи и веб-интерфейсом. Работает полностью офлайн.
Как создать Text-to-SQL агента для бизнеса: архитектура, guardrails и достижение 96% точности с Llama 3
Практическое руководство по созданию production-ready Text-to-SQL агента с архитектурой на LangChain, strict schema binding, guardrails и 96% точностью на Llama
Техническое расследование: как обнаружить производные модели через анализ весов и кода
Полное руководство по техническому расследованию производных моделей. Анализ косинусной схожести весов, исследование кода моделирования и поиск следов копирован
Паразитные паттерны в LLM: как распознать ИИ-психозы, теории всего и остановить заражение диалога
Полное руководство по диагностике и устранению паразитных паттернов в LLM: самоподдерживающиеся структуры, ИИ-психозы, промпт "Продолжай" и методы стабилизации
Разгон 6700XT под ROCm: полный гайд по сборке стека для локальных LLM
Подробное руководство по разгону AMD Radeon 6700XT и сборке полного стека ПО для локальных языковых моделей (LLM) под ROCm с OpenWeb UI и мультимодальностью.
Локальная замена TalkTasic: какие OSS-модели умеют видеть экран и диктовать код?
Полный гайд по сборке локального аналога TalkTasic на открытых мультимодальных моделях. Обзор моделей с поддержкой зрения и слуха, пошаговая интеграция и решени