Инструменты
Подборка AI-инструментов. Только то, что работает.
Step-3.5-Flash: 196 миллиардов параметров, но работает как 11. Почему это следующий шаг в локальных AI
Обзор Step-3.5-Flash (196B/A11B) - MoE модели с 11B активных параметров. Установка, тесты, сравнение производительности с DeepSeek v3.2 на февраль 2026.
MAVEN: как снизить галлюцинации LLM на 85% с помощью мульти-агентной верификации
Обзор MAVEN — open-source системы мульти-агентной верификации, которая снижает галлюцинации LLM на 85.3%. Установка, интеграция, сравнение с аналогами.
AIDA: Ваш личный AI-хакер в Docker-контейнере с 400+ инструментами
Настройте автономного AI-агента для пентестинга с доступом к 400+ инструментам через Claude и MCP сервер в Docker Exegol. Полный гайд на 2026 год.
mq: Как сократить расход токенов агентов на 83% с помощью утилиты для query-документов
Обзор инструмента mq для query-документов. Как сократить расход токенов AI-агентов на 83% без RAG. Работа с PDF, JSON, HTML через jq-подобный синтаксис.
PocketCoder: зачем платить $120 за Claude Code, если можно собрать своего агента на Ollama
Обзор open-source PocketCoder: CLI-агент с долгосрочной памятью для кодинга на Ollama и OpenAI. Экономия $120/месяц. Архитектура, установка, примеры использован
Слой исполнения правил ИИ на JSON: как сделать поведение LLM наблюдаемым, а не просто промпт-инжиниринг
Практический wrapper для управления LLM через JSON-правила. Решает проблему наблюдаемости, сравнения моделей и контроля дрейфа поведения на 01.02.2026.
ChatLLM.cpp + Qwen3-ASR: Запустите распознавание и выравнивание речи локально без облаков
Пошаговый гайд по установке и запуску связки ChatLLM.cpp и Qwen3-ASR для локального распознавания и выравнивания аудио. Работает без интернета на CPU и GPU.
Nano Banana Pro: дизайн интерьера за 5 минут вместо 5 дней
Обзор Nano Banana Pro: как бесплатный ИИ-инструмент генерирует концепт-дизайн интерьеров за секунды. Примеры, сравнение с аналогами, инструкция.
MLX-Video и LTX-2: как запустить видео-модель на Mac и почему она весит 314 ГБ
Практический гайд по запуску LTX-2 через MLX-Video на Mac. Разбираемся, почему модель весит 314 ГБ и как её оптимизировать под Apple Silicon.
OLMo 3.5 Hybrid: как гибридная архитектура с линейным вниманием экономит память
Обзор OLMo 3.5 Hybrid: гибридная архитектура Gated Deltanet с линейным вниманием для работы с длинным контекстом при малых затратах памяти. Сравнение, примеры,
Falcon-H1-Tiny (90M): микро-модель, которая работает на чем угодно. Даже на холодильнике
Как запустить Falcon-H1-Tiny (90M) локально на слабом железе. Архитектура Mamba+Attention, Anti-curriculum обучение, интеграция с VS Code. Сравнение с Gemma 3 2
Новые короли без цензуры: GLM-4.7 Flash, GPT OSS и другие uncensored-модели на Hugging Face
Обзор самых актуальных uncensored моделей на Hugging Face на февраль 2026 года. GLM-4.7 Flash, GPT OSS, Gemma 3 и Qwen - прямые ссылки на GGUF-файлы, сравнение