Инструменты
Подборка AI-инструментов. Только то, что работает.
Qwen-Image-Layered: ИИ, который режет картинки как Photoshop, но без ваших нервов
Практический тест модели Qwen-Image-Layered для семантического разделения изображений на слои. Сравнение с альтернативами, примеры работы и кому подойдет в 2026
Qwen3.5 в llama.cpp: как запустить плотные и MoE-модели на своём ПК
Полное руководство по запуску Qwen3.5 в llama.cpp b7973 на своём компьютере. Настройка плотных и MoE-моделей, сравнение производительности, оптимизация.
MCP Orchestrator: как запустить параллельных AI-агентов через Copilot CLI и Claude Code
Руководство по установке и использованию MCP Orchestrator для запуска параллельных AI-агентов через Copilot CLI и Claude Code на 09.02.2026
Ministral-3-3B: модель, которая научила маленькие LLM вызывать инструменты на 6 ГБ VRAM
Обзор Ministral-3-3B — 3-миллиардной модели для вызова инструментов, которая работает на 6 ГБ VRAM. Сравнение, примеры использования, кому подойдет.
Voxly: как собрать open-source диктофон с AI-очисткой на Tauri и Rust
Пошаговый обзор сборки Voxly - open-source диктофона с очисткой речи через AI на стеке Tauri, Rust и SolidJS. Локальная транскрипция без облаков.
Trainable System Router и Dual Method Memory System: SATA-тулкит для open-source LLM
Обзор продвинутого тулкита с нейронным роутингом и кросс-сессионной памятью для open-source LLM. Возможности, сравнение, примеры использования.
Qwen3.5 в llama.cpp: когда последний пазл наконец встал на место
Полный гайд по запуску Qwen3.5 в llama.cpp на 2026 год: компиляция с поддержкой новых моделей, квантование в GGUF, сравнение производительности.
Madlab OSS Finetuning v0.5.0: когда кнопки заменяют сотни строк кода
Обзор Madlab OSS Finetuning v0.5.0 — бесплатного графического инструмента для fine-tuning моделей. Установка, сравнение с аналогами, примеры использования.
Voxtral Mini 4B в браузере: как запихнуть супер-ASR в WebGPU и Rust
Полный гайд по портированию ASR-модели Mistral Voxtral Mini 4B в браузер через Rust, burn и WebGPU. Локальная транскрипция без облаков.
Переводчик в кармане: запускаем TranslateGemma на iPhone и забываем про интернет
Как установить и использовать TranslateGemma в KernelAI для офлайн-переводов на 55+ языках прямо на iPhone. Обзор, настройка и сравнение с альтернативами.
PATCH: сжатие длинного контекста в 4.6 раза — революция или очередной хак?
Обзор PATCH — метода сжатия длинного контекста LLM в латентные токены с ускорением обработки в 4.6 раза. Технический разбор на февраль 2026.
Собери свою LM на коленках: rust-bpe, PyTorch Lightning и Trackio
Полный стек для предобучения маленькой языковой модели с нуля в 2026: rust-bpe токенизатор, PyTorch Lightning для обучения, Trackio для мониторинга.