Инструменты для работы с AI - AiManual
AiManual Logo Ai / Manual.

Инструменты

Подборка AI-инструментов. Только то, что работает.

F

FLUX.2 Klein на стероидах: заставляем 9B-модель летать быстрее мысли на A100

Готовые скрипты Gradio и FastAPI для FLUX.2 Klein с оптимизациями torch.compile и fused QKV. Запуск за 0.9 секунды на A100.

Обзор
S

SEDAC v5: обзор фреймворка динамического ускорения LLM на основе семантической энтропии - применение для edge-устройств

Обзор фреймворка SEDAC v5 для динамического ускорения инференса языковых моделей на edge-устройствах с помощью семантической энтропии. Сравнение, примеры, реком

Обзор
c

cuda-nn: как запустить MoE-модель на 6.9B параметров без PyTorch на Rust, Go и CUDA

Обзор cuda-nn — inference движка на Rust, Go и CUDA для запуска MoE моделей на 6.9B параметров без PyTorch. Сравнение с альтернативами, оптимизация ядер.

Обзор
G

GFN v2.5.0: архитектура, которая забывает о памяти и вспоминает в 500 раз дальше

Как GFN решает проблему квадратичной сложности памяти трансформеров. Сравнение с альтернативами, примеры использования и кому подойдет эта архитектура.

Обзор
К

Книги на слух, без облаков: строим локальную фабрику аудиокниг с XTTS и GPT-SoVITS

Пошаговый обзор open-source проекта для полной автономной конвертации книг в аудио. Локально, без подписок, с модульными движками синтеза речи.

Обзор
G

GPU Rental Price Tracker: как следить за ценами на облачные GPU и экономить на аренде

Обзор GPU Rental Price Tracker — инструмента для отслеживания цен на облачные GPU. Сравнение провайдеров, настройка алертов, реальная экономия на аренде A100, H

Обзор
S

Speekium: ваш личный голосовой ассистент, который не шпионит

Установка, настройка и use cases Speekium — open-source голосового ассистента на Tauri и Rust с интеграцией Ollama. Полная приватность.

Обзор
M

Ministral 3 без цензуры и с глазами: как запустить разблокированную визуальную модель на домашнем железе

Полный гайд по запуску разблокированной Ministral 3 с поддержкой Vision. Сравнение квантований Q4, Q5, Q8, BF16 для моделей 4B, 8B, 14B. Установка через Hugging

Обзор
A

Agent-memory-state: когда ваш AI-агент наконец запомнит, что вы говорили вчера

Обзор agent-memory-state — Python библиотеки для управления памятью AI-агентов по паттерну OpenAI Cookbook. Примеры кода, сравнения, практическое применение.

Обзор
R

RLM-Toolkit: полный гайд по работе с контекстом 10M+ токенов, установка, архитектура и безопасность

Подробный обзор RLM-Toolkit для длинного контекста LLM. Установка pip, сравнение с аналогами, архитектура H-MEM и InfiniRetri, примеры кода и roadmap.

Обзор
H

HeartMula 3B: локальный Suno, который требует видеокарту за 2000$

Обзор HeartMula 3B — локального генератора музыки. Требования к железу (21.7 ГБ VRAM), сравнение качества с Suno и Udio, практические примеры.

Обзор
E

EmoCore: Как внедрить детерминированный губернатор для контроля бюджета риска и усилий в автономных AI-агентах

Обзор EmoCore - системы контроля бюджета риска и усилий для автономных AI-агентов. Как предотвратить runaway-поведение и бесконечные циклы.

Обзор