Инструменты для работы с AI - AiManual
AiManual Logo Ai / Manual.

Инструменты

Подборка AI-инструментов. Только то, что работает.

Q

Qwen3.5 397B на FP4: запускаем гиганта на Blackwell и RTX PRO 6000 без компромиссов

Полное руководство по запуску Qwen3.5 397B с квантованием FP4 на NVIDIA Blackwell и RTX PRO 6000. Аппаратные требования, настройка SGLANG, спекулятивный декодин

Обзор
Z

Zero-Shot Transferable Adapter: хак, который меняет правила fine-tuning'а

Новая методика переноса знаний между моделями без fine-tuning: экономия ресурсов, soft targets и практическое применение в 2026 году.

Обзор
D

Decompose: ускорьте RAG в 70 раз, отфильтровав документы regex-ом перед отправкой в LLM

Библиотека Decompose ускоряет RAG-системы в 70 раз, фильтруя документы regex-ом перед отправкой в LLM. Установка, примеры, сравнение с альтернативами.

Обзор
P

Podscript: когда хочется расшифровать подкаст, а не жизнь

Обзор Podscript — CLI-утилиты для автоматической транскрибации с таймкодами и диаризацией через ElevenLabs API. Установка, сравнение, примеры.

Обзор
M

Mengram: бесплатный open-source Mem0 с тремя типами памяти. Ставим за 5 минут

Полный гайд по установке Mengram - бесплатной open-source альтернативы Mem0 с семантической, эпизодической и процедурной памятью. FastAPI, PostgreSQL, pgvector,

Обзор
К

Как собрать локальный семантический поиск по файлам на Rust: туториал по созданию приватного аналога Windows Recall

Пошаговый туториал по созданию локального семантического поиска по файлам на Rust и Tauri. Приватная альтернатива Windows Recall без облака.

Обзор
T

Tiny Aya: 70 языков в кармане. Запускаем 3.35B модель на ноутбуке без H100

Полный обзор семейства Tiny Aya от Cohere: 3.35B параметров, 70 языков, локальный запуск. Сравнение с Gemma 3, Granite 4.0, инструкция по установке.

Обзор
З

Запуск Qwen3.5-397B на 128GB GPU: детальный разбор smol-IQ2_XS квантования в llama.cpp

Практическое руководство по запуску Qwen3.5-397B на 128GB GPU с smol-IQ2_XS квантованием в llama.cpp. Детали, команды, сравнение с альтернативами.

Обзор
В

Ваш смартфон теперь AI-сервер: ставим приватного ассистента с Qwen3 и Stable Diffusion

Запускаем локальный Qwen3, Stable Diffusion и Whisper на Android/iOS. Полная приватность, работа без интернета, сравнение CPU/GPU. Инструкция на февраль 2026.

Обзор
Б

Бесконечные циклы Qwen3 Coder Next в OpenCode: плагин для Read-инструмента, который всё чинит

Готовый плагин для OpenCode, который останавливает бесконечные циклы Qwen3 Coder Next в квантованных версиях. Установка, примеры, сравнение.

Обзор
N

NadirClaw: как интеллектуальный роутер LLM режет облачные счета на 60%

Практическое руководство по настройке NadirClaw - умного роутера LLM для экономии облачной квоты на 60%. Установка, конфигурация, сравнение с альтернативами.

Обзор
B

BAZINGA: Когда один ИИ — ненадежный свидетель, а семь — консилиум

Гайд по установке BAZINGA — инструмента для защиты от ошибок ИИ через консенсус нескольких LLM. φ-coherence scoring, интеграция с Ollama, блокировка деструктивн

Обзор