Инструменты
Подборка AI-инструментов. Только то, что работает.
Ministral-3-3B: модель, которая научила маленькие LLM вызывать инструменты на 6 ГБ VRAM
Обзор Ministral-3-3B — 3-миллиардной модели для вызова инструментов, которая работает на 6 ГБ VRAM. Сравнение, примеры использования, кому подойдет.
Voxly: как собрать open-source диктофон с AI-очисткой на Tauri и Rust
Пошаговый обзор сборки Voxly - open-source диктофона с очисткой речи через AI на стеке Tauri, Rust и SolidJS. Локальная транскрипция без облаков.
Trainable System Router и Dual Method Memory System: SATA-тулкит для open-source LLM
Обзор продвинутого тулкита с нейронным роутингом и кросс-сессионной памятью для open-source LLM. Возможности, сравнение, примеры использования.
Qwen3.5 в llama.cpp: когда последний пазл наконец встал на место
Полный гайд по запуску Qwen3.5 в llama.cpp на 2026 год: компиляция с поддержкой новых моделей, квантование в GGUF, сравнение производительности.
Madlab OSS Finetuning v0.5.0: когда кнопки заменяют сотни строк кода
Обзор Madlab OSS Finetuning v0.5.0 — бесплатного графического инструмента для fine-tuning моделей. Установка, сравнение с аналогами, примеры использования.
Voxtral Mini 4B в браузере: как запихнуть супер-ASR в WebGPU и Rust
Полный гайд по портированию ASR-модели Mistral Voxtral Mini 4B в браузер через Rust, burn и WebGPU. Локальная транскрипция без облаков.
Переводчик в кармане: запускаем TranslateGemma на iPhone и забываем про интернет
Как установить и использовать TranslateGemma в KernelAI для офлайн-переводов на 55+ языках прямо на iPhone. Обзор, настройка и сравнение с альтернативами.
PATCH: сжатие длинного контекста в 4.6 раза — революция или очередной хак?
Обзор PATCH — метода сжатия длинного контекста LLM в латентные токены с ускорением обработки в 4.6 раза. Технический разбор на февраль 2026.
Собери свою LM на коленках: rust-bpe, PyTorch Lightning и Trackio
Полный стек для предобучения маленькой языковой модели с нуля в 2026: rust-bpe токенизатор, PyTorch Lightning для обучения, Trackio для мониторинга.
WhatModelsCanIRun.com: калькулятор совместимости моделей с вашей видеокартой
Обзор WhatModelsCanIRun.com - инструмент для расчета совместимости AI-моделей с видеокартами. Узнайте, какие LLM запустить на вашем GPU в 2026 году.
Coder-link: один конфиг на всех AI-ассистентов вместо хаоса в dotfiles
Обзор coder-link — CLI для синхронизации конфигов Cursor, Warp, Claude Code и других AI-инструментов программирования
AI Terminal: когда ИИ становится операционной системой
Обзор AI Terminal - Electron-приложения, где ИИ управляет код-редактором, браузером и создает интерактивных аватаров. Альтернативы и примеры использования на 20