Инструменты для работы с AI - AiManual
AiManual Logo Ai / Manual.

Инструменты

Подборка AI-инструментов. Только то, что работает.

M

ModelRegistry: как я перестал ждать загрузки LLM и полюбил торренты (с резервным планом)

ModelRegistry — утилита, которая качает открытые модели через BitTorrent с веб-сидами от Hugging Face. Скорость, надёжность и никаких прерванных загрузок. Подро

Обзор
C

ChatGPT Multi Pane: как скрестить ChatGPT с многооконностью и забыть о лимитах Codex

Обзор плагина ChatGPT Multi Pane: мультипанель, агентный цикл, обход лимитов, установка из GitHub. Сравнение с Codex и Codex-lb.

Обзор
R

RAGpad: Терминальный блокнот с локальным ИИ, который не сливает ваши заметки

Privacy-focused приложение для заметок с RAG в терминале. Работает оффлайн на llama.cpp. Сравнение с Obsidian, NotebookLM, примеры использования.

Обзор
S

SpectralQuant выжимает 96.5% точности BF16 из Q4_K_M: как калибровка чинит квантование для Qwen3.5 0.8B

SpectralQuant — калибровочно-осведомлённое квантование Q4_K_M с восстановлением 96.5% точности BF16. Сравнение с альтернативами, примеры, рекомендации. Техничес

Обзор
C

ContextForge: SDK для бесконечного контекста LLM с долгосрочной памятью — обзор и установка

Обзор open-source SDK ContextForge, который решает проблему ограниченного контекста LLM. Установка, примеры кода, сравнение с LCME и NGT Memory.

Обзор
С

Скальпель для голоса: как собрать локальный медицинский стенограф на MacBook без интернета и компромиссов

Обзор локального медицинского STT на MacBook: Parakeet 0.6B, Whisper, MLX. Реальное время, конфиденциальность, точность до 95%. Сравнение с Dragon Medical и Goo

Обзор
К

Как объединить RTX 5080 и RTX 4060 для инференса LLM: гайд по гетерогенной сборке

Пошаговая инструкция: как скрестить RTX 5080 и RTX 4060 в одной системе для инференса больших языковых моделей. Тесты с Qwen, реальные цифры, грабли и советы.

Обзор
Р

Рецепт от катастрофического забывания: изоляция весов вместо общих параметров — разбор метода и код на GitHub

Разбираем подход к continual learning через изоляцию весов на примере проекта paradigm-swarm. Сравнение с EWC, Progressive Networks и PackNet. Пример кода на Gi

Обзор
Б

Бесплатный медицинский RAG API для локальных LLM – быстрый доступ к фактам без GPU

Бесплатный API на ARM VPS для быстрого поиска медицинских фактов из Wikipedia. Интеграция с локальными LLM, никаких GPU не нужно. Кому подойдет и как использова

Обзор
Н

Не жди, пока Claude подорожает: тащим артефакты на локальные модели — готовый репозиторий и инструкция

Готовый код на GitHub для запуска интерактивных артефактов Claude на любой локальной LLM. Инструкция, примеры, сравнение альтернатив. Экономь без потери функцио

Обзор
O

Ornith-1.0: 397B MoE, который выкачаете на ноутбук. SOTA без подвоха?

Разбираем семейство Ornith-1.0: 9B, 31B, 35B и монстр 397B MoE. Сравниваем с DeepSeek, Qwen, Llama 4. Даем инструкцию по запуску на Hugging Face. Кому реально н

Обзор
L

LLM Sandbox: Реализация агента с Docker-песочницей для безопасного исполнения кода

Обзор open-source инструмента LLM Sandbox: Docker-изоляция для AI-агентов, субагенты, оркестрация. Сравнение с gVisor, Firecracker, LangSmith Sandboxes. Примеры

Обзор