Инструменты
Подборка AI-инструментов. Только то, что работает.
vLLM Studio: как тестировать OCR модели локально без Python и Docker (21.03.2026)
Обзор vLLM Studio 2.4 для Windows, Mac, Linux. Тестируйте Chandra, GLM OCR, PaddleOCR-VL локально на PDF и изображениях без программирования.
Multi-Token Prediction в mlx-lm: как ускорить инференс Qwen 3.5 на Apple Silicon в 1.5 раза
Обзор Multi-Token Prediction в mlx-lm: как технология ускоряет генерацию Qwen 3.5 в 1.5 раза на Apple Silicon. Сравнение, примеры использования.
TaskShield CLI: как ИИ-агенты ломают ваши задачи и что с этим делать
ИИ-агенты путают ваши проекты? Обзор TaskShield CLI 2.0 — open-source утилиты, которая защищает декомпозицию задач. Установка, примеры и сравнение.
Nemotron 3 Super Uncensored для Mac: рекордные 96% на MMLU и установка с Hugging Face
Аблированная модель Nemotron 3 Super показывает рекордные 96% на MMLU. Как установить и использовать на Mac через Hugging Face. Сравнение с аналогами.
Как настроить vLLM для моделей Qwen3.5 на двух AMD Radeon 7900 XTX: секретные переменные окружения и бенчмарки
Полное руководство по запуску vLLM для Qwen3.5 на двух AMD RX 7900 XTX. Секретные флаги окружения, команды для бенчмаркинга и сравнение с llama.cpp. Актуально н
Секретные MoE-модели Microsoft: запускаем Phi-mini-MoE на ноутбуке с 8 ГБ ОЗУ
Пошаговый гайд: как найти и запустить скрытые MoE-модели Phi-mini-MoE и Phi-tiny-MoE от Microsoft на ноутбуке всего с 8 ГБ оперативной памяти.
Nemotron 3 Content Safety 4B: мультимодальная модерация контента от NVIDIA — обзор и применение
Обзор мультимодальной модели безопасности контента от NVIDIA для 2026 года: возможности, сравнение с альтернативами, сценарии использования для текста и изображ
Inline Visualizer: Интерактивные графики в чате с локальными LLM без облаков
Обзор Inline Visualizer — open-source инструмента для создания интерактивных диаграмм в чате с локальными LLM. Работает с любыми моделями, поддерживающими tool
Сравнение Mistral Small 4 и Qwen3.5-9B в понимании документов: детальный разбор бенчмарков
Полный разбор IDP leaderboard, OlmOCR и OmniDocBench. Какая модель — Mistral Small 4 или Qwen3.5-9B — реально работает с документами, а где вас обманут. Данные
Как запустить TinyLlama на PowerBook G4 2002 года: разбор платформы MacinAI Local, оптимизация AltiVec и квантование
Подробное руководство по запуску TinyLlama на PowerBook G4 2002 года с использованием MacinAI Local, оптимизацией AltiVec и квантованием Q8. Актуально на 20.03.
SeeQL: Как построить open-source интерфейс для общения с SQL-базой на естественном языке
Обзор SeeQL — локального интерфейса для запросов к SQL на русском языке. Технологии OpenUI Lang, MCP server и современные LLM. Установка и примеры.
Как управлять поведением LLM через активации: патч llama-server и Sparse Autoencoders
Полный разбор управления поведением Llama и Mistral через низкоуровневые активации. Патч для llama-server и Sparse Autoencoders для контроля сикофансии и креати