Инструменты
Подборка AI-инструментов. Только то, что работает.
Flash Attention для старых AMD MI50 (gfx906): как обойти ограничения и запустить генерацию видео без OOM
Полное руководство по запуску генерации видео на AMD MI50 (gfx906) с обходом ограничений памяти. Memory-efficient attention, SDPA PyTorch и оптимизации под ROCm
TypeWhisper 1.0: Когда приватная диктовка обрела модульность
Полный обзор TypeWhisper 1.0: модульное приложение для диктовки с поддержкой WhisperKit, Parakeet, Qwen3 и LLM-постобработкой. Работает локально на macOS.
Chatterbox Turbo на VLLM: как добиться 37.6x ускорения генерации речи на RTX 4090
Портирование TTS-модели Chatterbox Turbo на vLLM дает ускорение в 37.6 раз на RTX 4090. Бенчмарки, настройка и примеры для реального синтеза речи.
MCP memory server на Rust: когда граф знаний встречает нейроны в хранилище
Гибридный поиск на Rust, граф знаний и нейропластичность памяти для AI агентов. Сравнение с Python, тесты производительности и примеры использования.
MuninnDB: как настроить Dream Engine для консолидации памяти LLM с изоляцией данных Ollama
Полное руководство по настройке MuninnDB Dream Engine для консолидации памяти LLM с изоляцией данных через Ollama vault. Актуально на 2026 год.
TideSurf: как сжать DOM в 30 раз для веб-агентов и ускорить TTFT в 12 раз на Qwen 3.5 9B (туториал по npm-пакету)
TideSurf сокращает токены DOM на 30x и ускоряет время до первого токена в 12 раз для веб-агентов на Qwen 3.5 9B. Гайд по установке и использованию npm @tidesurf
Как запустить LLM на портативной консоли: SpruceChat для Miyoo и Trimui
Пошаговая инструкция по установке SpruceChat и запуску локального ИИ на портативных консолях Miyoo A30 и Trimui Smart Pro в 2026 году.
Cohere Transcribe в браузере: Нужен ли вам 2B-монстр, если у вас есть WebGPU и смелость?
Обзор демо Cohere Transcribe, работающего локально в браузере через WebGPU. Сравнение с альтернативами, примеры использования и рекомендации.
Vera: локальный поиск кода для AI агентов — установка, настройка и сравнение с аналогами
Обзор Vera — инструмента для локального поиска кода на Rust. Сравнение с аналогами, установка, настройка и примеры использования для AI агентов.
Плагины OpenAI Codex 2026: От игрушки к серьезному оружию. Установка за 1 клик и интеграция с GitHub и Gmail
Новые плагины и MCP серверы для OpenAI Codex в 2026. Как установить и использовать для работы с GitHub и Gmail. Сравнение с Claude Code и другими альтернативами
LCME: память для LLM, которая работает быстрее, чем вы успеваете моргнуть
Обзор LCME - memory engine для локальных LLM с скоростью до 430x быстрее Mem0. Установка, сравнение с альтернативами, примеры использования.
Unsloth Studio Beta: инференс быстрее на 30%, тул-коллинг и бинарники llama.cpp из коробки
Обзор Unsloth Studio Beta: ускорение инференса LLM на 30%, тул-коллинг, предустановленные бинарники llama.cpp. Установка, сравнение, примеры использования. Акту