Инструменты для работы с AI - AiManual
AiManual Logo Ai / Manual.

Инструменты

Подборка AI-инструментов. Только то, что работает.

F

Flash Attention для старых AMD MI50 (gfx906): как обойти ограничения и запустить генерацию видео без OOM

Полное руководство по запуску генерации видео на AMD MI50 (gfx906) с обходом ограничений памяти. Memory-efficient attention, SDPA PyTorch и оптимизации под ROCm

Обзор
T

TypeWhisper 1.0: Когда приватная диктовка обрела модульность

Полный обзор TypeWhisper 1.0: модульное приложение для диктовки с поддержкой WhisperKit, Parakeet, Qwen3 и LLM-постобработкой. Работает локально на macOS.

Обзор
C

Chatterbox Turbo на VLLM: как добиться 37.6x ускорения генерации речи на RTX 4090

Портирование TTS-модели Chatterbox Turbo на vLLM дает ускорение в 37.6 раз на RTX 4090. Бенчмарки, настройка и примеры для реального синтеза речи.

Обзор
M

MCP memory server на Rust: когда граф знаний встречает нейроны в хранилище

Гибридный поиск на Rust, граф знаний и нейропластичность памяти для AI агентов. Сравнение с Python, тесты производительности и примеры использования.

Обзор
M

MuninnDB: как настроить Dream Engine для консолидации памяти LLM с изоляцией данных Ollama

Полное руководство по настройке MuninnDB Dream Engine для консолидации памяти LLM с изоляцией данных через Ollama vault. Актуально на 2026 год.

Обзор
T

TideSurf: как сжать DOM в 30 раз для веб-агентов и ускорить TTFT в 12 раз на Qwen 3.5 9B (туториал по npm-пакету)

TideSurf сокращает токены DOM на 30x и ускоряет время до первого токена в 12 раз для веб-агентов на Qwen 3.5 9B. Гайд по установке и использованию npm @tidesurf

Обзор
К

Как запустить LLM на портативной консоли: SpruceChat для Miyoo и Trimui

Пошаговая инструкция по установке SpruceChat и запуску локального ИИ на портативных консолях Miyoo A30 и Trimui Smart Pro в 2026 году.

Обзор
C

Cohere Transcribe в браузере: Нужен ли вам 2B-монстр, если у вас есть WebGPU и смелость?

Обзор демо Cohere Transcribe, работающего локально в браузере через WebGPU. Сравнение с альтернативами, примеры использования и рекомендации.

Обзор
V

Vera: локальный поиск кода для AI агентов — установка, настройка и сравнение с аналогами

Обзор Vera — инструмента для локального поиска кода на Rust. Сравнение с аналогами, установка, настройка и примеры использования для AI агентов.

Обзор
П

Плагины OpenAI Codex 2026: От игрушки к серьезному оружию. Установка за 1 клик и интеграция с GitHub и Gmail

Новые плагины и MCP серверы для OpenAI Codex в 2026. Как установить и использовать для работы с GitHub и Gmail. Сравнение с Claude Code и другими альтернативами

Обзор
L

LCME: память для LLM, которая работает быстрее, чем вы успеваете моргнуть

Обзор LCME - memory engine для локальных LLM с скоростью до 430x быстрее Mem0. Установка, сравнение с альтернативами, примеры использования.

Обзор
U

Unsloth Studio Beta: инференс быстрее на 30%, тул-коллинг и бинарники llama.cpp из коробки

Обзор Unsloth Studio Beta: ускорение инференса LLM на 30%, тул-коллинг, предустановленные бинарники llama.cpp. Установка, сравнение, примеры использования. Акту

Обзор