Инструменты для работы с AI - AiManual
AiManual Logo Ai / Manual.

Инструменты

Подборка AI-инструментов. Только то, что работает.

G

GAE (Geodesic Attention Engine): как запустить точное внимание для 1M токенов на 1 ГБ VRAM

Geodesic Attention Engine сокращает использование памяти на 99.6% для длинных контекстов. Узнайте, как запустить 1 млн токенов на 1 ГБ VRAM.

Обзор
M

Minimax m2.1 DWQ MLX: почему эта квантованная модель стала скрытым алмазом для Mac и исследовательской работы

Обзор Minimax m2.1 DWQ MLX — квантованной 4-bit модели для MLX на Mac. Сравнение с альтернативами, параметры запуска, примеры использования для владельцев M2 Ul

Обзор
Э

Эксперимент Anthropic: как 16 AI-агентов Claude создали компилятор C с нуля

Технический разбор эксперимента Anthropic: 16 автономных агентов Claude Opus 4.6 создали работающий компилятор C. Docker, Git, Rust и реальная стоимость API.

Обзор
S

Serpentine TTS: 90ms задержки и 3.5GB памяти — локальный синтез речи для Mac, который не просит денег

Обзор Serpentine TTS — локального TTS для Mac с задержкой 90ms, архитектурой look-ahead и поддержкой MLX. Сравнение с Elevenlabs, установка и примеры.

Обзор
Г

Голосовой агент с RAG на GTX 1650: как уложиться в 400 мс при 4 ГБ VRAM

Пошаговый гайд по созданию голосового агента с иерархическим RAG на GTX 1650 (4 ГБ VRAM). Код, оптимизации Zero-Copy Memory, задержка менее 400 мс.

Обзор
M

MacBook превращается в стенографиста: как собрать полностью локальный рекордер встреч с Whisper и Llama

Полное руководство по созданию приватного рекордера встреч для Mac на базе Whisper и Llama. Аудио не покидает устройство, полный контроль над данными.

Обзор
S

Structured Outputs в Amazon Bedrock: как создать валидные JSON-ответы без ручной проверки

Как использовать Structured Outputs в Amazon Bedrock для получения валидных JSON-ответов от LLM без ручной валидации. Примеры и сравнение с альтернативами.

Обзор
P

PersonaPod: ваш личный подкаст-франкенштейн, который говорит вашим голосом

Создайте персонализированный подкаст из RSS-лент с вашим клонированным голосом. PersonaPod на llama.cpp и MaskGCT TTS - установка, настройка, примеры.

Обзор
S

Superlinear: практический гайд по запуску модели с субквадратичным вниманием для контекста 10M токенов

Пошаговое руководство по запуску Superlinear — модели с субквадратичным вниманием O(L^(3/2)) для контекста до 10 миллионов токенов на одном GPU.

Обзор
P

PromptSec: легковесная Go-библиотека, которая затыкает дыры для prompt injection

Обзор PromptSec — легковесной Go-библиотеки для локальной защиты от prompt injection. Паттерн-матчинг, ~0.3 мс, сравнение с Lakera Guard. Актуально на 06.02.202

Обзор
A

Anagnorisis: семантический поиск по медиатеке без слежки стримингов

Разверните приватную систему поиска по музыке и видео с LAION CLAP, SigLIP и Jina v3. Сравнение моделей эмбеддингов для медиатек.

Обзор
A

AI Jukebox на RunPod: как запустить ACE-Step 1.5 за один клик и принимать Bitcoin-голоса

Пошаговая инструкция по запуску музыкального AI Jukebox с моделью ACE-Step 1.5 на RunPod. One-click деплой, Bitcoin Lightning голосование, генерация музыки.

Обзор