Инструменты для работы с AI - AiManual
AiManual Logo Ai / Manual.

Инструменты

Подборка AI-инструментов. Только то, что работает.

A

Apple CLaRa-7B: как работает новая архитектура RAG и первые тесты open-source модели

Обзор Apple CLaRa-7B — модели с непрерывным латентным рассуждением. Тесты open-source модели, сравнение с классическим RAG, примеры кода.

Обзор
G

Grafted Titans: как заставить малую модель запоминать на 90% больше контекста

Технический разбор архитектуры Grafted Titans: как Test-Time Training и cross-attention gating расширяют память Qwen-2.5-0.5B на 90%. Код и эксперименты.

Обзор
M

MCP Doctor: как автоматизировать отладку конфигов MCP для Claude Desktop и Cursor

Инструмент CLI для проверки конфигов MCP. Находит ошибки JSON, переменные среды, проблемы с npm. Установка через npm. Экономит время разработчиков.

Обзор
E

EmergentFlow: собираем AI-агентов как LEGO прямо в браузере

Создавайте AI-агентов в браузере. Интеграция с Ollama, LM Studio, OpenAI API. Node-редактор без зависимостей. Полный обзор EmergentFlow.

Обзор
F

Flakestorm: Ломай своих агентов, пока их не сломали другие

Обзор open-source инструмента Flakestorm для тестирования уязвимостей локальных LLM-агентов через адверсарные промпты. Установка, примеры, альтернативы.

Обзор
L

LoongFlow: как заставить AI-агентов саморазвиваться с помощью эволюционных алгоритмов

Обзор LoongFlow — фреймворка для эволюционного развития AI-агентов. Как работают генетические алгоритмы для оптимизации промптов и workflow.

Обзор
E

EasyWhisperUI: Гайд по установке и использованию кроссплатформенного GUI для транскрибации аудио с GPU-ускорением

Пошаговый гайд по установке и использованию EasyWhisperUI - кроссплатформенного GUI для транскрибации аудио с поддержкой GPU-ускорения через Vulkan и Metal.

Обзор
S

Sparse: как сжать тонко настроенную модель с 14 ГБ до 50 МБ после обучения (альтернатива LoRA)

Обзор Sparse - инструмента для сжатия тонко настроенных LLM до 50 МБ без потерь. Сравнение с LoRA, примеры кода, когда использовать.

Обзор
O

Orla: превращаем терминал в фабрику локальных ИИ-агентов

Установка и использование Orla для запуска локальных AI-агентов через терминал. Интеграция с Ollama, примеры команд, сравнение с альтернативами.

Обзор
Л

Локальный RAG для видео: с нуля до поиска за 15 минут

Запустите RAG для видео локально: Whisper для транскрипции, OCR для текста на кадрах, векторный поиск. API и примеры кода.

Обзор
A

Adaptive-P: Когда llama.cpp наконец перестанет повторять одно и то же

Обзор Adaptive-P - нового сэмплера для llama.cpp. Как установить через PR, сравнение с Top-P и Top-K, примеры использования для креативного текста.

Обзор
T

TraceML: Поймай утечки памяти и простои даталоадера до того, как они убьют твой LLM-тюнинг

Обзор TraceML — инструмента для отслеживания утечек памяти CUDA и простоев даталоадера при обучении LLM на PyTorch. Сравнение с альтернативами, примеры кода для

Обзор