Инструменты для работы с AI - AiManual
AiManual Logo Ai / Manual.

Инструменты

Подборка AI-инструментов. Только то, что работает.

S

Speechos: ваш личный полигон для речевых моделей, который не шпионит за вами

Speechos: open-source инструмент для локального бенчмаркинга речевых моделей. Сравнивайте Whisper, Vosk, Supertonic 2 TTS без облаков. Адаптация к железу.

Обзор
C

Conda-пакеты для AI-моделей: версионирование, кэширование и безопасность с rattler-build

Как rattler-build решает проблемы версионирования, кэширования и безопасности AI-моделей в Conda-пакетах. Пример упаковки whisper.cpp.

Обзор
T

TranslateGemma UI: Веб-интерфейс для локального перевода, который не стыдно показать коллегам

Разверните свой приватный переводчик с веб-интерфейсом за 5 минут. Gemma 3, Docker, Ollama — и никаких облачных API. Полный гайд на февраль 2026 года.

Обзор
D

DeepSeek DeepGEMM: как обновление с mHC и поддержкой Blackwell ускорит работу LLM

Технический обзор DeepSeek DeepGEMM: как обновление с Manifold-constrained Hyper-connections и поддержкой NVIDIA Blackwell ускоряет матричные вычисления для LLM

Обзор
L

LLmFit: как одной командой подобрать идеальную LLM-модель под ваше железо

Обзор LLmFit - инструмента для подбора LLM-моделей под аппаратное обеспечение. Узнайте, как одной командой найти идеальную модель для вашего GPU и RAM.

Обзор
К

Как запустить гигантские MoE-модели на одной видеокарте: разбор гибридного рантайма Krasis и бенчмарки

Гибридный рантайм Krasis позволяет запускать гигантские MoE-модели на одной видеокарте. Бенчмарки скорости префилла на RTX 5080 и других GPU.

Обзор
П

Полное руководство по квантованию Qwen3.5-35B-A3B: разбор SOTA GGUFs от Unsloth и лучшие практики

Разбор динамических GGUF от Unsloth для Qwen3.5-35B-A3B: KL Divergence, чувствительные тензоры, сравнение методов квантования и рекомендации по выбору.

Обзор
P

PageAgent: браузерный AI-агент для локального запуска с Ollama — обзор и туториал

PageAgent - браузерный AI-агент, работающий локально с Ollama. DOM как текст, автоматизация без облачных API. Полный обзор, сравнение и туториал.

Обзор
Q

Qwen 3.5 122B A10B: разбор рекорда в UGI, запуск с UD Q2KXL и обход цензуры

Обзор Qwen 3.5 122B A10B: рекорд в бенчмарке UGI, сравнение с GPT OSS 120B, запуск с квантованием UD Q2KXL и методы обхода цензуры в reasoning.

Обзор
A

AutoBe: как слабые локальные LLM отладили генератор backend-приложений до 100% успеха

Как инструмент AutoBe использует слабые локальные LLM для отладки и достигает 100% успеха в генерации backend-приложений на NestJS и Prisma.

Обзор
P

Perplexity Computer: как работает супер-агент, который управляет другими ИИ (Claude, Gemini, GPT-5.2)

Как Perplexity Computer оркестрирует Claude Opus 4.6, GPT-5.2 и Gemini для сложных задач. Возможности, сравнение с аналогами и кому подойдет.

Обзор
p

pplx-embed от Perplexity: как использовать квантованные эмбеддинги для семантического поиска и RAG

Обзор pplx-embed от Perplexity: как int8-квантование ускоряет семантический поиск и RAG-системы. Примеры использования, сравнение с альтернативами.

Обзор