Инструменты для работы с AI - AiManual
AiManual Logo Ai / Manual.

Инструменты

Подборка AI-инструментов. Только то, что работает.

К

Когда Flash-Attention приходит на CPU: как ggml заставляет работать длинные контексты без GPU

Как использовать оптимизацию FA split across kv в ggml для ускорения декодирования длинных контекстов на CPU. Сравнение с альтернативами и практические примеры.

Обзор
T

Transformer Lab for Teams: когда один GPU — это смешно, а кластер — головная боль

Как Transformer Lab for Teams решает проблему фрагментации workflow в распределённом обучении моделей. Поддержка Slurm, SkyPilot, приватность.

Обзор
O

OpenAI Codex для MacOS: агентное приложение, которое наконец-то работает, а не обещает

Полный обзор нового агентного приложения OpenAI Codex для MacOS. Тестируем возможности, сравниваем с GPT-5.2-Codex и Claude Code. Актуально на февраль 2026.

Обзор
X

Xiaozhi (Робот Добби): китайский opensource робот на ESP32, который можно починить и перепрограммировать

Полный разбор китайского голосового робота Xiaozhi на ESP32. Аппаратная часть, прошивка, ремонт микрофона и сравнение с альтернативами на 2026 год.

Обзор
L

Large Plant Model: робот-убийца сорняков, который учился на 150 млн фото

Как модель на 150 млн фото распознаёт сорняки без переобучения. Технология Carbon Robotics для автономных роботов-фермеров. Обзор LPM на 2026 год.

Обзор
V

VRAM Guard: как защитить ноутбук от перегрева при работе с локальными LLM и Stable Diffusion

Обзор утилиты VRAM Guard для защиты ноутбуков от перегрева VRAM при запуске локальных LLM и Stable Diffusion. Метод импульсного троттлинга.

Обзор
M

MiniMax Agent 2.0: подробный обзор и сравнение с Claude Cowork и Moltbot для автоматизации файлов

Полный разбор MiniMax Agent 2.0: тестируем на уборке папки Загрузки, сравниваем с Claude Cowork и Moltbot. Какой AI-агент лучше автоматизирует рутину в 2026 год

Обзор
S

Step-3.5-Flash: 196 миллиардов параметров, но работает как 11. Почему это следующий шаг в локальных AI

Обзор Step-3.5-Flash (196B/A11B) - MoE модели с 11B активных параметров. Установка, тесты, сравнение производительности с DeepSeek v3.2 на февраль 2026.

Обзор
M

MAVEN: как снизить галлюцинации LLM на 85% с помощью мульти-агентной верификации

Обзор MAVEN — open-source системы мульти-агентной верификации, которая снижает галлюцинации LLM на 85.3%. Установка, интеграция, сравнение с аналогами.

Обзор
A

AIDA: Ваш личный AI-хакер в Docker-контейнере с 400+ инструментами

Настройте автономного AI-агента для пентестинга с доступом к 400+ инструментам через Claude и MCP сервер в Docker Exegol. Полный гайд на 2026 год.

Обзор
m

mq: Как сократить расход токенов агентов на 83% с помощью утилиты для query-документов

Обзор инструмента mq для query-документов. Как сократить расход токенов AI-агентов на 83% без RAG. Работа с PDF, JSON, HTML через jq-подобный синтаксис.

Обзор
P

PocketCoder: зачем платить $120 за Claude Code, если можно собрать своего агента на Ollama

Обзор open-source PocketCoder: CLI-агент с долгосрочной памятью для кодинга на Ollama и OpenAI. Экономия $120/месяц. Архитектура, установка, примеры использован

Обзор