Инструменты для работы с AI - AiManual
AiManual Logo Ai / Manual.

Инструменты

Подборка AI-инструментов. Только то, что работает.

Г

Голосовой агент с RAG на GTX 1650: как уложиться в 400 мс при 4 ГБ VRAM

Пошаговый гайд по созданию голосового агента с иерархическим RAG на GTX 1650 (4 ГБ VRAM). Код, оптимизации Zero-Copy Memory, задержка менее 400 мс.

Обзор
M

MacBook превращается в стенографиста: как собрать полностью локальный рекордер встреч с Whisper и Llama

Полное руководство по созданию приватного рекордера встреч для Mac на базе Whisper и Llama. Аудио не покидает устройство, полный контроль над данными.

Обзор
S

Structured Outputs в Amazon Bedrock: как создать валидные JSON-ответы без ручной проверки

Как использовать Structured Outputs в Amazon Bedrock для получения валидных JSON-ответов от LLM без ручной валидации. Примеры и сравнение с альтернативами.

Обзор
P

PersonaPod: ваш личный подкаст-франкенштейн, который говорит вашим голосом

Создайте персонализированный подкаст из RSS-лент с вашим клонированным голосом. PersonaPod на llama.cpp и MaskGCT TTS - установка, настройка, примеры.

Обзор
S

Superlinear: практический гайд по запуску модели с субквадратичным вниманием для контекста 10M токенов

Пошаговое руководство по запуску Superlinear — модели с субквадратичным вниманием O(L^(3/2)) для контекста до 10 миллионов токенов на одном GPU.

Обзор
P

PromptSec: легковесная Go-библиотека, которая затыкает дыры для prompt injection

Обзор PromptSec — легковесной Go-библиотеки для локальной защиты от prompt injection. Паттерн-матчинг, ~0.3 мс, сравнение с Lakera Guard. Актуально на 06.02.202

Обзор
A

Anagnorisis: семантический поиск по медиатеке без слежки стримингов

Разверните приватную систему поиска по музыке и видео с LAION CLAP, SigLIP и Jina v3. Сравнение моделей эмбеддингов для медиатек.

Обзор
A

AI Jukebox на RunPod: как запустить ACE-Step 1.5 за один клик и принимать Bitcoin-голоса

Пошаговая инструкция по запуску музыкального AI Jukebox с моделью ACE-Step 1.5 на RunPod. One-click деплой, Bitcoin Lightning голосование, генерация музыки.

Обзор
H

Hugging Face Community Evals: как создавать и проверять бенчмарки моделей через PR

Как работает система Community Evals на Hugging Face для прозрачного тестирования AI-моделей через Pull Request и автоматическую верификацию результатов в 2026

Обзор
1

1376 реальных терминалов для тестирования AI-агентов: релиз SETA, который меняет правила игры

Обзор SETA — коллекции из 1376 открытых терминальных сред для реалистичного тестирования AI-агентов. Установка, использование, альтернативы.

Обзор
M

Minicpm-o 4.5: 9 миллиардов параметров, которые помещаются в ваш карман (и работают в реальном времени)

Обзор Minicpm-o 4.5 — 9B мультимодальной модели с дуплексным голосом и распознаванием видео в реальном времени. Тесты на Macbook M3, сравнение с аналогами, прим

Обзор
К

Квантование и запуск 1T параметров на CPU: полный разбор Kimi-k2.5 на AMD EPYC с llama.cpp

Технический разбор запуска MoE-модели Kimi-k2.5 (1.03T) на CPU через llama.cpp. Квантование Q4_K_S, производительность 10-12 tok/s, настройка podman и асинхронн

Обзор