Инструменты для работы с AI - AiManual
AiManual Logo Ai / Manual.

Инструменты

Подборка AI-инструментов. Только то, что работает.

G

GLiNER 2: Как маленький энкодер бьет гигантские LLM в NER и экономит кучу денег

Сравнение GLiNER 2 с крупными языковыми моделями для извлечения сущностей. Почему специализированные энкодеры выигрывают в скорости, стоимости и детерминированн

Обзор
S

Skills и CLI для coding agents: как LangChain улучшил производительность Claude Code до 95%

LangChain выпустил skills и CLI для LangSmith, которые подняли производительность Claude Code с 29% до 95%. Обзор новых инструментов и сравнение с альтернативам

Обзор
G

GestaltSyntax - семантический пресс для старого кода: как впихнуть FORTRAN в контекстное окно AI

Открытый инструмент GestaltSyntax сжимает legacy-код до 12 раз для перевода AI-моделями. Возможности, сравнение с альтернативами, примеры использования.

Обзор
C

Cicikus v3 Prometheus 4.4B: тестируем экспериментальную модель для логических задач на слабом железе

Тестируем экспериментальную модель Cicikus v3 Prometheus 4.4B для логических задач. Franken-merge, сравнение с Llama 3.2 и Gemma 3, примеры использования на сла

Обзор
У

Ускорение vLLM на Jetson Orin в 3.8 раза: установка pre-built wheel с Marlin GPTQ

Готовый wheel для vLLM с поддержкой Marlin GPTQ ускоряет вывод LLM на Jetson Orin в 3.8 раза. Установка, бенчмарки, сравнение.

Обзор
П

Патч CUTLASS и настройки для ускорения Qwen3.5-397B в 5 раз на Blackwell GPU (до 282 токенов/с)

Экстремальная оптимизация Qwen3.5-397B MoE. Кастомное ядро, патч SM120, Docker-образ. 282 токена/с на Blackwell. Гайд по установке.

Обзор
A

ASI: локальный AI-ассистент для Android, который понимает прикосновения

Обзор open-source проекта ASI: локальный AI-ассистент для Android с сенсорным восприятием на базе Gemma 3. Работает без интернета, полностью приватно.

Обзор
R

Reprompt: ваш промпт останется в семье

Как анализировать и оценивать промпты для AI-кодинга локально с помощью Reprompt. TF-IDF, Ollama и полная приватность данных. Установка и примеры.

Обзор
A

Autoresearch Карпати в 2026: когда ИИ исследует сам себя

Разбираем autoresearch Карпати - систему автономных ML-экспериментов. Актуально на март 2026: установка, примеры, сравнение с альтернативами.

Обзор
I

IndexCache для vLLM/SGLang: Ускоряем DeepSeek-V3.2 до 1.8x за счёт кеширования индексов внимания

Патч IndexCache для vLLM и SGLang ускоряет sparse attention в DeepSeek-V3.2 до 1.82x, сокращая время prefill для больших контекстов.

Обзор
L

LocoTrainer-4B: как установить и использовать экспертного агента для фреймворка MS-SWIFT

Полное руководство по установке и использованию LocoTrainer-4B - экспертного агента для тонкой настройки моделей в фреймворке MS-SWIFT. Сравнение, примеры, реко

Обзор
M

Manga-Translator: Rust-приложение, которое переводит комиксы офлайн с помощью локальных LLM

Как Rust-приложение с YOLO, LaMa и локальными LLM переводит мангу без интернета. Обзор возможностей, сравнение с аналогами и примеры использования.

Обзор