Инструменты для работы с AI - AiManual
AiManual Logo Ai / Manual.

Инструменты

Подборка AI-инструментов. Только то, что работает.

M

Mistral-Small-4-119B-NVFP4: Зачем французы затачивают ИИ под чипы NVIDIA и как это использовать

Что такое формат NVFP4, как он ускоряет Mistral-Small-4-119B на GPU NVIDIA Blackwell и пошаговый гайд по запуску. Сравнение с INT4 и MXFP4.

Обзор
M

MaximusLLM: Тренируй гигантские модели на картошке — один T4 и никакого стресса

Как тренировать большие языковые модели на слабом железе с помощью MaximusLLM. Ghost Logit Loss, Kronecker Sketching и другие техники экономии VRAM.

Обзор
M

Mistral Small 4: Французский эксперт, который съедает 128 котлет, но переваривает только две

Полный разбор Mistral Small 4: архитектура MoE 128/4, 119B параметров, мультимодальность. API, сравнение с GPT-4.5 и Claude 3.5, кому подходит в 2026.

Обзор
N

Nemotron-3-Nano-4B в GGUF: NVIDIA наконец-то играет по нашим правилам

NVIDIA выпустила компактную модель Nemotron-3-Nano-4B в формате GGUF. Полный гайд: как скачать с Hugging Face, запустить на слабом ПК и сравнить с Phi-4 и Qwen3

Обзор
t

text-generation-webui 4.1: полный гайд по tool-calling и созданию своих функций в один .py файл

Научитесь создавать кастомные функции для локальных LLM в text-generation-webui 4.1. Гайд по tool-calling через простые Python-скрипты с примерами и сравнениями

Обзор
К

Как развернуть продакшн-агента на LangSmith: полный гайд по новому CLI LangGraph Deploy

Пошаговая инструкция по деплою AI-агентов через новый LangGraph Deploy CLI. Установка uvx, CI/CD пайплайн, Docker образы и мониторинг в LangSmith.

Обзор
O

Open-Toys: как собрать локальную storytelling-игрушку для детей на Qwen3-TTS и MLX для Apple Silicon

Пошаговый гайд по созданию оффлайн storytelling-игрушки для детей с использованием Qwen3-TTS, MLX и ESP32. Приватность и открытый код.

Обзор
n

nano-KvLLM: Сжимаем KV-кеш в 4 раза без потерь для длинных контекстов

Обзор nano-KvLLM 2.1 - фреймворка для сжатия KV-кеша на основе nano-vLLM. Ускорение работы с длинным контекстом, сравнение с vLLM и llama.cpp, примеры использов

Обзор
R

Recursive Mamba: когда одной итерации мало — как рекурсивные SSM ломают reasoning в малых моделях

Экспериментальная архитектура Recursive Mamba улучшает reasoning в малых моделях через рекурсивные циклы скрытых состояний State-Space Model. Технические детали

Обзор
Х

Хакинг голоса Ani из Grok: как собрать датасет и выжать из CosyVoice максимум

Пошаговый гайд по сборке датасета и обучению локального клона голоса Ani из Grok на open-source моделях CosyVoice и XTTS v2. Работает без облаков.

Обзор
O

Open Swarm: полный обзор и первые шаги для запуска тысяч AI-агентов с доступом к почте, соцсетям и Google Workspace

Полный обзор Open Swarm - open-source системы для параллельного запуска AI-агентов с доступом к Gmail, Twitter, Google Workspace. Первые шаги, сравнения, пример

Обзор
O

Opencode порт Autoresearch от Karpathy: установка и использование для автоматизации исследований

Установите порт Autoresearch от Karpathy на Opencode для автоматизации научных исследований. Полное руководство по настройке и использованию на 2026 год.

Обзор