Инструменты для работы с AI

T

TurboMemory: как настроить локальную долговременную память для AI-агентов с 4-битными эмбеддингами

Обзор TurboMemory — инструмента для долговременной памяти AI-агентов с эффективным сжатием эмбеддингов. Установка, сравнение, примеры использования.

Обзор

L

LocalVideoBlur: размывай что угодно в 4K-видео простым текстом (и без облаков)

Обзор LocalVideoBlur — open-source инструмента для быстрой анонимизации 4K и 360° видео локально с помощью текстовых запросов. Работает на Grounding DINO и Byte

Обзор

O

OpenClaude: как запустить утёкший CLI-агент Anthropic с любой моделью (GPT-4o, Llama, DeepSeek)

Запустите OpenClaude — утёкший CLI-агент Anthropic с GPT-4o, Llama, DeepSeek. Инструкция по установке, обзор возможностей и сравнение с аналогами.

Обзор

T

TRL v1.0: как Hugging Face запихнула 75 методов тонкой настройки в одну библиотеку и не сошла с ума

Полный разбор TRL v1.0 от Hugging Face: 75+ методов пост-обучения LLM, включая DPO, GRPO и асинхронное RL. Примеры кода, сравнение и кому подойдет.

Обзор

Г

Готовый агент на Qwen3.5-9B: как развернуть fine-tuned модель для OpenClaw и AgentScope

Полный гайд по установке готового агента на Qwen3.5-9B для OpenClaw и AgentScope. Дистилляция с Opus, GGUF квантование, шаги настройки.

Обзор

B

Bonsai 1-bit + TurboQuant: тестирование гибридного квантования для запуска LLM на смартфонах

Тестирование комбинации Bonsai 1-bit и TurboQuant для запуска больших языковых моделей на смартфонах. Сравнение с альтернативами и примеры использования.

Обзор

H

Holo3: SOTA-модель для автономной работы с компьютером. Обзор и инструкция по запуску

Holo3 бьет рекорд на OSWorld (78.85%): обзор, сравнение с GPT-5.4, инструкция по запуску через Inference API. Открытые веса Apache2.

Обзор

Q

Qwen 3.5 9B GGUF: практическое руководство по локальному извлечению данных из документов

Полный гайд по настройке Qwen 3.5 9B GGUF для извлечения структурированных данных из финансовых и юридических документов на своём компьютере. Код, промпты, срав

Обзор

К

Как rotate activations в llama.cpp улучшает квантование: разбор метода и практическая настройка

Полный разбор метода rotate activations в llama.cpp. Как вращение активаций повышает качество квантованных моделей. Практическая настройка и сравнение с альтерн

Обзор

D

Darwin-35B-A3B-Opus: как работает техника Model MRI для слияния моделей и её установка

Обзор Darwin-35B-A3B-Opus и техники Model MRI для слияния нейросетей. Установка, сравнение с альтернативами, примеры использования.

Обзор

T

TurboQuant TQ3_1S: как 3.5 бита спасают 16-гигабайтные видеокарты от Qwen3.5

Новый формат TQ3_1S в форке llama.cpp с CUDA. Запускаем Qwen3.5-27B на 16 ГБ VRAM. Сравнение потерь качества и гайд по установке на 01.04.2026.

Обзор

F

Falcon-OCR и Falcon-Perception: локальное зрение, которое работает без интернета

Полный гайд по установке Falcon-OCR и Falcon-Perception, их запуску и интеграции с llama.cpp. Локальное компьютерное зрение без облаков и API.

Обзор