Инструменты для работы с AI - AiManual
AiManual Logo Ai / Manual.

Инструменты

Подборка AI-инструментов. Только то, что работает.

Q

Qwen Coders: когда картинка стоит тысячи бенчмарков

Обзор инструмента для визуального сравнения квантований Qwen Coder Next. Смотрим на IQ1, Q3, Q4 через lightshow-тесты и понимаем, какой квант реально работает в

Обзор
S

Step 3.5 Flash: быстрая, но нестабильная модель. Как исправить галлюцинации tool calls?

Практический обзор Step 3.5 Flash: как исправить галлюцинации tool calls, повторяющиеся reasoning traces и сравнение с GLM 4.7. Актуально на 04.02.2026.

Обзор
Y

Yuan 3.0 Flash 40B: китайский мультимодальный снайпер для RAG, который помещается в 8 ГБ VRAM

Тестируем Yuan 3.0 Flash 40B — китайскую мультимодальную модель 3.7B параметров, оптимизированную для RAG. Совместимость с llama.cpp, GGUF и сравнение с аналога

Обзор
G

Ghidra MCP Server: 110 инструментов для AI-реверса и поиска функций между версиями

Как подключить 110 инструментов Ghidra к Claude через MCP для анализа бинарников, нормализованного хеширования функций и поиска между версиями ПО.

Обзор
G

GGML реализация Qwen3-ASR: локальное распознавание речи с квантованием Q8 и forced alignment

Обзор GGML реализации Qwen3-ASR с квантованием Q8 для локального распознавания речи на 52 языках. Сравнение с Whisper, экономия памяти до 2 ГБ.

Обзор
Q

Qwen3-Coder-Next-NVFP4: как сжать модель с 149 ГБ до 45 ГБ с минимальной потерей качества

Технический разбор квантования Qwen3-Coder-Next в формат NVFP4. Сжатие с 149 ГБ до 45 ГБ при потере всего 1.63% на MMLU Pro+. Практическое руководство по запуск

Обзор
A

Alexandria: ваш личный режиссер аудиокниг, который раздает эмоции как конфеты

Полный гайд по установке и настройке Alexandria — локального генератора аудиокниг с эмоциональными метками, QWEN3 TTS и клонированием голоса. Работает без облак

Обзор
M

MiniCPM-o-4.5: Модель размером с кошку, но с мозгами слона

Полный обзор MiniCPM-o-4.5 - 9-миллиардной мультимодальной модели с речью, зрением и полным дуплексом для локального запуска. Сравнение, примеры, установка.

Обзор
H

Holo2-235B-A22B: как агентная локализация улучшает точность распознавания UI-элементов на 10-20%

Holo2-235B-A22B устанавливает новый стандарт распознавания UI-элементов. 78.5% на ScreenSpot-Pro, итеративное уточнение через агентную локализацию. Доступна на

Обзор
Q

Qwen3-Coder-Next 3B: как 3 миллиарда параметров переиграли гигантов кодинга

Анализ победы Qwen3-Coder-Next 3B в SWE-Bench Pro. Как многозадачный агентный подход позволил 3B модели обойти 70B конкурентов. Технические детали и практическо

Обзор
L

Loot-JSON: когда маленькие LLM ломают JSON, а вы спасаете данные

TS-библиотека для очистки и исправления некорректного JSON от маленьких LLM-моделей. Установка, примеры, сравнение с аналогами.

Обзор
M

MichiAI: как 530M параметров и Rectified Flow выжимают 75 мс из full-duplex речи на одной 4090

Технический разбор архитектуры MichiAI - речевой LLM на 530M параметров с Rectified Flow Matching и задержкой 75 мс для full-duplex диалога.

Обзор