Инструменты
Подборка AI-инструментов. Только то, что работает.
ST-CardGen: как я перестал мучиться с ручным созданием карточек для SillyTavern
Обзор open-source тула ST-CardGen для автоматического создания персонажей SillyTavern с поддержкой KoboldCPP, ComfyUI и локальных LLM. Настройка, примеры, альте
Архитектура Kimi K2.5: как 1 трлн параметров и 384 эксперта помещаются в 4x H100 и побеждают GPT-5
Глубокий разбор архитектуры Kimi K2.5: MoE с 384 экспертами, нативное INT4 квантование и топ-8 routing. Как модель на 4 видеокартах обходит GPT-5 в reasoning.
Youtu-VL-4B-Instruct: китайская VLM, которая поместится в 8 ГБ VRAM
Как запустить Youtu-VL-4B-Instruct локально на домашнем ПК. Сравнение с аналогами, примеры использования и технические требования на 2026 год.
Почему локальный RAG для кода всё ещё плох: создаём open-source бенчмарк HugeContext
Проблемы Top-K retrieval, intention mapping и evidence gating в локальных RAG для кода. Обзор open-source бенчмарка HugeContext для оценки качества контекстных
AgentHub: закончилась эра SDK-говнища для LLM?
Полный обзор AgentHub - универсального SDK для работы с любыми LLM. Сравнение с LangChain, LlamaIndex, установка Python/TypeScript, примеры кода.
Cognito AI: интерфейс, который заставил меня удалить три других
Обзор Cognito AI на 27.01.2026 — локальный чат-интерфейс с поддержкой PDF, веб-поиском, llama.cpp и Hugging Face. Установка, сравнение с альтернативами.
Blackstone Gambit v3.1: Как заставить ИИ писать романы без дрейфа характеров и пассивности
Обзор Blackstone Gambit v3.1 - нарративного движка, который решает проблему дрейфа личности персонажей в AI-сочинении. Сравнение с альтернативами и примеры испо
GitHub Copilot SDK: как создать своего кодирующего агента на базе открытого фреймворка от Microsoft
Практическое руководство по созданию AI-агентов на базе GitHub Copilot SDK. Архитектура, примеры использования, сравнение с альтернативами и рекомендации для ра
PowerInfer: как заставить 120-миллиардную модель думать на ноутбуке 2018 года
Обзор PowerInfer - технологии, которая запускает 120B модели на слабом железе через hot/cold нейроны и гетерогенную архитектуру. Сравнение с llama.cpp, практиче
Jan v3 Instruct 4B: та самая модель, которая заставила Aider работать на 40% лучше
Jan v3 Instruct 4B - новая легковесная модель для кодинга. Полный обзор, инструкция по запуску через Jan.ai и llama.cpp, сравнение с Aider и тестами
Hey Lama: как собрать полностью локального голосового ассистента на Mac с Raspberry Pi AI
Пошаговый разбор проекта Hey Lama — полностью оффлайн голосового ассистента на Mac с Qwen3-0.6B, KittenTTS и Raspberry Pi AI. Код на GitHub.
MimikaStudio: наконец-то нормальный интерфейс для клонирования голоса на Mac
Полный обзор MimikaStudio - нативного приложения для macOS с поддержкой Qwen3-TTS, Kokoro и XTTS2. Локальное клонирование голоса с красивым интерфейсом.