Инструменты для работы с AI - AiManual
AiManual Logo Ai / Manual.

Инструменты

Подборка AI-инструментов. Только то, что работает.

G

GLM-OCR: почему эта мультимодалка читает документы лучше, чем вы

Технический разбор GLM-OCR — мультимодальной модели для понимания сложных документов. Multi-Token Prediction loss, CogViT энкодер, двухэтапный пайплайн.

Обзор
N

NTTuner + GUI: Финтюн моделей на Windows без боли, с Unsloth под капотом

Пошаговое руководство по использованию NTTuner с графическим интерфейсом для тонкой настройки языковых моделей на Windows. Интеграция с Unsloth для ускорения в

Обзор
S

Step-3.5-Flash-int4: новый король для Mac с 128 ГБ памяти

Тестируем Step-3.5-Flash-int4 на M1 Ultra с 128 ГБ RAM. Реальные бенчмарки llama-bench, сравнение с альтернативами и полный контекст 256k.

Обзор
P

PromptProxy: как собирать датасеты для дистилляции, не сжигая API-ключи

Обзор PromptProxy: инструмент для безопасного сбора промптов и ответов от GPT-4o, Claude 3.7 и других LLM. Экономия токенов, защита API-ключей, создание датасет

Обзор
К

Когда Flash-Attention приходит на CPU: как ggml заставляет работать длинные контексты без GPU

Как использовать оптимизацию FA split across kv в ggml для ускорения декодирования длинных контекстов на CPU. Сравнение с альтернативами и практические примеры.

Обзор
T

Transformer Lab for Teams: когда один GPU — это смешно, а кластер — головная боль

Как Transformer Lab for Teams решает проблему фрагментации workflow в распределённом обучении моделей. Поддержка Slurm, SkyPilot, приватность.

Обзор
O

OpenAI Codex для MacOS: агентное приложение, которое наконец-то работает, а не обещает

Полный обзор нового агентного приложения OpenAI Codex для MacOS. Тестируем возможности, сравниваем с GPT-5.2-Codex и Claude Code. Актуально на февраль 2026.

Обзор
X

Xiaozhi (Робот Добби): китайский opensource робот на ESP32, который можно починить и перепрограммировать

Полный разбор китайского голосового робота Xiaozhi на ESP32. Аппаратная часть, прошивка, ремонт микрофона и сравнение с альтернативами на 2026 год.

Обзор
L

Large Plant Model: робот-убийца сорняков, который учился на 150 млн фото

Как модель на 150 млн фото распознаёт сорняки без переобучения. Технология Carbon Robotics для автономных роботов-фермеров. Обзор LPM на 2026 год.

Обзор
V

VRAM Guard: как защитить ноутбук от перегрева при работе с локальными LLM и Stable Diffusion

Обзор утилиты VRAM Guard для защиты ноутбуков от перегрева VRAM при запуске локальных LLM и Stable Diffusion. Метод импульсного троттлинга.

Обзор
M

MiniMax Agent 2.0: подробный обзор и сравнение с Claude Cowork и Moltbot для автоматизации файлов

Полный разбор MiniMax Agent 2.0: тестируем на уборке папки Загрузки, сравниваем с Claude Cowork и Moltbot. Какой AI-агент лучше автоматизирует рутину в 2026 год

Обзор
S

Step-3.5-Flash: 196 миллиардов параметров, но работает как 11. Почему это следующий шаг в локальных AI

Обзор Step-3.5-Flash (196B/A11B) - MoE модели с 11B активных параметров. Установка, тесты, сравнение производительности с DeepSeek v3.2 на февраль 2026.

Обзор