Инструменты для работы с AI - AiManual
AiManual Logo Ai / Manual.

Инструменты

Подборка AI-инструментов. Только то, что работает.

P

PaddleOCR 3.5: как запустить OCR и парсинг документов с бэкендом Transformers

Обзор PaddleOCR 3.5 с поддержкой Transformers backend. Как настроить, сравнение с EasyOCR и Tesseract, примеры парсинга документов на Python.

Обзор
G

Google Cloud Agent Gateway: внешний контур безопасности для AI-агентов — архитектура и реальные кейсы

Разбираем архитектуру Agent Gateway от Google Cloud - внешний уровень защиты, не зависящий от промптов. Сравнение с альтернативами, примеры внедрения и советы д

Обзор
I

ICM: Память для AI-агентов, которую можно пощупать локально и без компромиссов

Обзор открытого инструмента ICM для долговременной памяти AI-агентов. Локальные бенчмарки, сравнение с Zep и Widemem, примеры кода. Кому подойдет и как внедрить

Обзор
К

Как построить агента, создающего агентов: разбор реализации на Python с Qwen3.6 35b

Разбор кода агента на чистом Python, который генерирует других агентов. Работа с Qwen3.6 35b в квантовании Q8_0, MTP, примеры и сравнение с альтернативами.

Обзор
M

MiroThinker-1.7: открытый deep research агент на Qwen3 MoE (3B активных) — запуск на потребительском железе

MiroThinker-1.7 — первый открытый deep research агент с 3B активных параметров на базе Qwen3 MoE. Запускается на RTX 3090/4090 и MacBook. Обзор, сравнение, прим

Обзор
H

Hexllama: GUI-менеджер шаблонов для llama.cpp — больше никаких простыней из флагов

Как Hexllama спасает от зубодробительных CLI-команд llama.cpp. Разбор возможностей, сравнение с аналогами, примеры настройки. Кому реально нужен этот GUI.

Обзор
A

Abliterlitics: как сравнить 5 методов аблайтерации Qwen3.6-27B с помощью бенчмарков и анализа весов

Открытый инструмент Abliterlitics для объективного сравнения 5 методов снятия цензуры на Qwen3.6-27B: бенчмарки, тесты безопасности, анализ весов. Экономит GPU-

Обзор
T

TRL v1.0: 75 методов пост-тренинга в одной библиотеке — как Hugging Face сломала старые шаблоны

TRL v1.0 от Hugging Face: 75+ методов пост-тренинга LLM, новая архитектура, примеры DPO/ORPO, сравнение с альтернативами. Кому подходит?

Обзор
G

Gemma 4: почему Google наконец-то сделала open-source модель, которую стоит запускать локально

Google выпустила Gemma 4 под Apache 2.0: мультимодальная модель для аудио, изображений и текста. Интеграция с llama.cpp, MLX, WebGPU. Что умеет и кому подойдет?

Обзор
O

OpenReader: твой личный сервер для чтения документов вслух (и это open-source)

Установи OpenReader на свой сервер: читай EPUB, PDF, DOCX с синхронной подсветкой и TTS. Скачай аудиокнигу локально. Бесплатно, без облаков.

Обзор
B

Build your own Clawdmeter: Как я собрал десктопный дашборд для токенов Claude Code и перестал просыпаться в холодном поту

Пошаговое руководство по сборке физического дашборда для мониторинга расхода токенов Claude Code в реальном времени. Сравнение с софтверными решениями, примеры

Обзор
S

StRuCom: датасет, который научит LLM писать докстринги по-русски (и это не шутка)

Датасет StRuCom решает проблему русскоязычной документации кода. Сравнение с CodeSearchNet, примеры дообучения модели и инструкция по применению.

Обзор