Инструменты для работы с AI - AiManual
AiManual Logo Ai / Manual.

Инструменты

Подборка AI-инструментов. Только то, что работает.

O

OpenAI Agent SDK для Java: когда Python-разработчики перестали быть единственными счастливчиками

Полный обзор OpenAI Agent SDK для Java. Установка через Maven, создание первого AI-агента, сравнение с Python-альтернативами и примеры использования.

Обзор
V

V6rge: Windows AI-студия для тех, кто ненавидит Python и CUDA

Обзор V6rge — Windows AI-студии для запуска локальных LLM, генерации изображений и музыки без установки Python и CUDA. Установка, возможности, сравнение.

Обзор
A

AgentCrawl: Как создать оптимизированный под LLM скрапер с автоматическим переходом на headless-браузер

AgentCrawl - библиотека для гибридного веб-скрапинга под LLM с автоматическим переходом на Playwright. Оптимизация токенов, чистый Markdown, интеграция Vercel A

Обзор
G

GLM-4.7 Flash: китайский снайпер против Qwen 32B

GLM-4.7 Flash бенчмарки, сравнение производительности с Qwen 32B, скачать модель Zhipu AI. Полная инструкция по запуску и квантованию.

Обзор
L

LlamaBarn 0.23: macOS-приложение, которое само загружает модели и не просит помощи

Обзор LlamaBarn 0.23 - macOS-приложения для локальных LLM с автоматической загрузкой моделей, Router Mode и оптимизацией памяти. Установка через Homebrew.

Обзор
G

Ghost Engine: как запустить Llama-3-8B на 3 ГБ VRAM и не сойти с ума

Революционный метод сжатия LLM через архитектуру Predator-Prey. Запускаем Llama-3-8B на 3 ГБ видеопамяти — полный обзор технологии.

Обзор
C

Claude Cowork: полный обзор агентского режима Anthropic на macOS — возможности, интеграции и реальные недостатки

Разбираем Claude Cowork — агентский режим Anthropic для macOS. Как работает изолированная Linux VM, интеграции MCP, подписка Claude Max. Реальные проблемы с про

Обзор
O

On-device браузерный агент на Qwen: локальный Chrome без облаков

Как установить и использовать браузерный AI-агент на Qwen для автоматизации задач прямо в Chrome без интернета. On-device решение для приватности.

Обзор
О

Оптимизированный Top-K для LLM: ускорение инференса в 20 раз на CPU с AVX2

Как оптимизированный Top-K с AVX2 ускоряет выборку токенов в llama.cpp до 20 раз на обычных процессорах. Бенчмарки, интеграция, сравнение с альтернативами.

Обзор
W

WallPlan: как нейросети генерируют планировки через графы стен, а не пиксели

Технический разбор WallPlan - нейросети, которая генерирует архитектурные планировки через графы стен, а не пиксели. Три CNN: WinNet, GraphNet, LabelNet.

Обзор
I

Iris Agent: фреймворк, где вы видите каждую шестерёнку

Обзор минималистичного Iris Agent - open-source фреймворка для создания и обучения AI-агентов с полной прозрачностью архитектуры.

Обзор
F

FLUX.2 Klein на стероидах: заставляем 9B-модель летать быстрее мысли на A100

Готовые скрипты Gradio и FastAPI для FLUX.2 Klein с оптимизациями torch.compile и fused QKV. Запуск за 0.9 секунды на A100.

Обзор