Инструменты
Подборка AI-инструментов. Только то, что работает.
TurboMemory: как настроить локальную долговременную память для AI-агентов с 4-битными эмбеддингами
Обзор TurboMemory — инструмента для долговременной памяти AI-агентов с эффективным сжатием эмбеддингов. Установка, сравнение, примеры использования.
LocalVideoBlur: размывай что угодно в 4K-видео простым текстом (и без облаков)
Обзор LocalVideoBlur — open-source инструмента для быстрой анонимизации 4K и 360° видео локально с помощью текстовых запросов. Работает на Grounding DINO и Byte
OpenClaude: как запустить утёкший CLI-агент Anthropic с любой моделью (GPT-4o, Llama, DeepSeek)
Запустите OpenClaude — утёкший CLI-агент Anthropic с GPT-4o, Llama, DeepSeek. Инструкция по установке, обзор возможностей и сравнение с аналогами.
TRL v1.0: как Hugging Face запихнула 75 методов тонкой настройки в одну библиотеку и не сошла с ума
Полный разбор TRL v1.0 от Hugging Face: 75+ методов пост-обучения LLM, включая DPO, GRPO и асинхронное RL. Примеры кода, сравнение и кому подойдет.
Готовый агент на Qwen3.5-9B: как развернуть fine-tuned модель для OpenClaw и AgentScope
Полный гайд по установке готового агента на Qwen3.5-9B для OpenClaw и AgentScope. Дистилляция с Opus, GGUF квантование, шаги настройки.
Bonsai 1-bit + TurboQuant: тестирование гибридного квантования для запуска LLM на смартфонах
Тестирование комбинации Bonsai 1-bit и TurboQuant для запуска больших языковых моделей на смартфонах. Сравнение с альтернативами и примеры использования.
Holo3: SOTA-модель для автономной работы с компьютером. Обзор и инструкция по запуску
Holo3 бьет рекорд на OSWorld (78.85%): обзор, сравнение с GPT-5.4, инструкция по запуску через Inference API. Открытые веса Apache2.
Qwen 3.5 9B GGUF: практическое руководство по локальному извлечению данных из документов
Полный гайд по настройке Qwen 3.5 9B GGUF для извлечения структурированных данных из финансовых и юридических документов на своём компьютере. Код, промпты, срав
Как rotate activations в llama.cpp улучшает квантование: разбор метода и практическая настройка
Полный разбор метода rotate activations в llama.cpp. Как вращение активаций повышает качество квантованных моделей. Практическая настройка и сравнение с альтерн
Darwin-35B-A3B-Opus: как работает техника Model MRI для слияния моделей и её установка
Обзор Darwin-35B-A3B-Opus и техники Model MRI для слияния нейросетей. Установка, сравнение с альтернативами, примеры использования.
TurboQuant TQ3_1S: как 3.5 бита спасают 16-гигабайтные видеокарты от Qwen3.5
Новый формат TQ3_1S в форке llama.cpp с CUDA. Запускаем Qwen3.5-27B на 16 ГБ VRAM. Сравнение потерь качества и гайд по установке на 01.04.2026.
Falcon-OCR и Falcon-Perception: локальное зрение, которое работает без интернета
Полный гайд по установке Falcon-OCR и Falcon-Perception, их запуску и интеграции с llama.cpp. Локальное компьютерное зрение без облаков и API.