Инструменты
Подборка AI-инструментов. Только то, что работает.
Аудит OpenCode: как в «локальном» AI-инструменте нашли скрытые подключения к 7 внешним доменам
Подробный разбор аудита исходного кода OpenCode на 24.03.2026: нашли скрытые запросы к 7 внешним доменам, хотя он позиционируется как локальный инструмент. Риск
NoobScribe: локальная транскрипция встреч с памятью спикеров на стероидах
Обзор NoobScribe — open-source инструмента для локальной транскрипции аудио с диаризацией Pyannote, памятью спикеров на Chroma и API, совместимым с Whisper. Акт
DaVinci-MagiHuman: полный гайд по установке и генерации видео с аудио на одном GPU
Установите DaVinci-MagiHuman v3.2 для генерации синхронного видео и аудио. Открытая модель Apache 2.0, превосходит конкурентов по качеству речи. Работает на одн
Devstral-Small-2-24B + рассуждения Claude: как скачать и использовать fine-tuned модель для кода
Узнайте, как скачать и использовать fine-tuned модель Devstral-Small-2-24B с рассуждениями Claude для генерации кода. Сравнение с альтернативами, примеры и реко
SillyTavern AI Game Master: расширение для интеграции LLM в любую игру
Технический разбор SillyTavern AI Game Master - расширения для интеграции локальных LLM (Cydonia, Qwen 3.5) в любую игру. Архитектура, клонирование голоса, срав
NGT Memory: установка и использование open-source модуля персистентной памяти для LLM
Полный обзор NGT Memory — open-source модуля персистентной памяти для LLM. Установка через Docker, три механизма извлечения данных, сравнение с Mem0 и Mengram,
MolmoWeb 8B: как запустить мультимодального веб-агента, который превосходит GPT-4o
Обзор и инструкция по запуску MolmoWeb 8B — открытого мультимодального агента, который бьет GPT-4o в веб-автоматизации. Архитектура, примеры, сравнение.
Qwen3.5 Neo: обзор эффективных fine-tune моделей для быстрого Chain-of-Thought
Обзор Qwen3.5 Neo моделей, оптимизированных для быстрого Chain-of-Thought reasoning. Экономия токенов, сравнение с альтернативами, примеры использования на 24.0
Взломаный Claude Code: как сообщество собрало SDK без зависимостей и зачем он вам
Гайд по использованию обратно спроектированного Claude Code SDK с zero dependencies. Установка на 4 языках, работа с агентами, инструментами и MCP.
Memento v1.0: Забудьте о золотых рыбках — ваш AI-агент теперь помнит все
Полное руководство по развертыванию Memento v1.0 — локальной памяти для AI-агентов. Установка в одну команду, офлайн эмбеддинги, HNSW индекс. Для приватных прое
Savant Commander 48B MOE: руководство по установке и тестированию дистилляций Claude, Gemini и OpenAI в одной модели
Полное руководство по Savant Commander 48B MOE - модели, объединяющей дистилляции Claude, Gemini и OpenAI. Установка, тестирование, сравнение с альтернативами.
Delta-KV для llama.cpp: как сжать KV-кеш до 4 бит почти без потерь на Llama 70B
Техника дельта-квантования сжимает KV-кеш в 8 раз, позволяя запускать Llama 70B на слабом железе без потери качества. Интеграция в llama.cpp.