Инструменты для работы с AI - AiManual
AiManual Logo Ai / Manual.

Инструменты

Подборка AI-инструментов. Только то, что работает.

C

Cognitive OS: локальная IDE для мультиагентных workflow с графом знаний

Архитектура локальной IDE для управления AI-агентами с персистентным состоянием, графом знаний и JIT-инъекцией контекста. Обзор на 26.01.2026.

Обзор
L

Llama 3.2 3B на iPhone: как заставить телефон самому заказывать пиццу без интернета

Полный стек для локального тулкиттинга на iPhone: Llama 3.2 3B, React Native и RunAnywhere SDK. Запускаем функции без облаков.

Обзор
R

RTX PRO 4000 Blackwell в SFF-корпусе: как запихнуть 48 ГБ VRAM в коробку из-под обуви и не сжечь квартиру

Практический гайд по установке RTX PRO 4000 Blackwell в SFF-ПК, настройка llama-server с CUDA и Vulkan, оптимизация VRAM под большие LLM модели.

Обзор
F

FP8 на RTX 3090: самодельный Torch-экстеншен для экономии VRAM

Как заставить RTX 3090 работать с FP8 без аппаратной поддержки. Самодельный Torch-экстеншен, экономия VRAM и ускорение инференса LLM на старом железе.

Обзор
C

CompactAI: Автоматический fine-tuning LLM за 5 минут или пустая трата времени?

Как работает CompactAI для автоматического fine-tuning моделей, сравнение с альтернативами и стоит ли использовать в 2026 году.

Обзор
P

PassLLM: когда нейросеть угадывает ваш пароль с первой попытки

Обзор PassLLM - самого точного AI-угадывателя паролей. Как установить локально, примеры работы, сравнение с альтернативами и этические границы использования в 2

Обзор
К

Как сделать автоматические субтитры для видео локально в браузере: Parakeet и SileroVAD

Автоматические субтитры для видео в браузере: Parakeet и SileroVAD

Обзор
R

R3-Engine: 1.58-битный LLM-движок на Rust, который ломает мозг и AVX-512

Технический разбор R3-Engine: как работает 1.58-битное квантование BitNet b1.58 на Rust с AVX-512, проблема активации SiLU и сравнение с llama.cpp.

Обзор
V

Vallignus: как создать супервизор для локальных AI-агентов (CrewAI/AutoGen) и остановить бесконечные циклы

Инструмент Vallignus решает проблему бесконечных циклов локальных AI-агентов. Настройка мониторинга, ограничение времени выполнения, безопасное завершение проце

Обзор
C

ClaraVerse vs n8n/Zapier: как создать локальную AI-автоматизацию с 50+ интеграциями

Сравнение ClaraVerse с n8n и Zapier. Создаем локальные AI-воркфлоу с 50+ интеграциями. CLI, API из workflow, приватность данных.

Обзор
Л

Локальный AI-агент для автотестирования чат-ботов: собираем стенд на GPT-OSS 20B и Agno

Пошаговое руководство по настройке 100% локального AI-агента для автотестирования чат-ботов. GPT-OSS 20B, фреймворк Agno и llama.cpp сервер.

Обзор
M

Multi-Head Latent Attention: как DeepSeek переизобрела механизм внимания и почему это работает быстрее

Полный разбор Multi-Head Latent Attention от DeepSeek с кодом на PyTorch. Оптимизации KV-cache, сравнение с MHA/GQA/MQA и практическая реализация.

Обзор