Инструменты для работы с AI - AiManual
AiManual Logo Ai / Manual.

Инструменты

Подборка AI-инструментов. Только то, что работает.

M

Modly: как запустить локальную генерацию 3D-моделей с TripoSG и TRELLIS

Полный гайд по установке Modly для генерации 3D-моделей на своём ПК. Используйте TripoSG и TRELLIS для игровых ассетов и 3D-печати без интернета.

Обзор
V

Voxtral Codec: как ужать речь до 2.14 кбит/с и не заметить разницы

Обзор Voxtral Codec. Как работает новый кодек для TTS со сжатием речи до 2.14 кбит/с. Архитектура VQ+FSQ, сравнение с альтернативами, примеры использования.

Обзор
К

Конфигурация vLLM для Qwen 3.5 27B: как добиться 1.1M токен/с на кластере с B200

Рекордная скорость инференса 1.1M токен/с на Qwen 3.5 27B с vLLM, NVIDIA B200, FP8 KV cache и MTP-1. Настройки и конфиги.

Обзор
К

Кастомный бэкенд llama.cpp для AMD XDNA2 NPU: полное руководство по установке и настройке

Эксклюзивный гайд по сборке кастомного бэкенда llama.cpp для AMD XDNA2 NPU. Настройка XRT, offload GEMM операций, тесты на Ryzen AI MAX 385.

Обзор
О

Обзор OpenRoom от MiniMax: как запустить нишевую модель на Qwen 27B через llama.cpp

Обзор нишевой модели OpenRoom для генерации контента. Инструкция по локальному запуску Qwen 27B через llama.cpp, сравнение с аналогами и примеры использования.

Обзор
C

Cohere Transcribe: 2-миллиардный монстр для транскрипции, который не стесняется работать локально

Открытая модель транскрипции от Cohere с 2 млрд параметров. Сравнение с Whisper, Parakeet, запуск на своем GPU. Точность, скорость, приватность.

Обзор
O

OpenAgentPrompts: библиотека промптов для AI-агентов, которая экономит часы настроек

Обзор open-source библиотеки системных промптов для AI-агентов. Готовые конфигурации для Cursor, Claude и локальных моделей. Экономия времени, сообщество на Dis

Обзор
R

RotorQuant: новый метод квантования в 10-19 раз быстрее TurboQuant (CUDA и Metal ядра)

RotorQuant — прорыв в квантовании KV-кэша с использованием Clifford rotors. Скорость в 10-19 раз выше TurboQuant, реализации на CUDA и Metal. Обзор на 26.03.202

Обзор
З

Закройте свои Python-скрипты: ExecuTorch делает голосовые модели кроссплатформенными

Руководство по ExecuTorch для развертывания голосовых моделей на iOS, Android, macOS и Linux. Поддержка Metal, CUDA, Vulkan. Таблицы совместимости.

Обзор
N

NVIDIA GPT-OSS-Puzzle-88B: как 88 миллиардов параметров поместились в H100 и не задыхаются

Технический разбор GPT-OSS-Puzzle-88B от NVIDIA. Puzzle NAS, Mixture-of-Experts, оптимизация KV-cache и инференса для H100. Сравнение с аналогами.

Обзор
К

Как запустить RF-DETR Nano и YOLO26 на телефоне: on-device детекция объектов без интернета

Инструкция по запуску современных моделей детекции объектов RF-DETR Nano и YOLO26 на Android без интернета. Сравнение, шаги интеграции и примеры использования н

Обзор
Р

Российский локальный AI-агент: сборка с нуля без облака, VPN и подписок

Полный гайд по сборке автономного AI-агента на русском языке. Работает без облачных API, подписок и VPN. Актуально на март 2026.

Обзор