Инструменты
Подборка AI-инструментов. Только то, что работает.
skill-compass — хук для Claude Code, который сам находит нужные скиллы (и вам не нужно гадать)
Skill-compass — хук для Claude Code на Node.js, который анализирует задачу и сам подключает нужные скиллы. Как работает, примеры, сравнение с ручным подбором и
Локальный AI-переводчик с потоковым выводом: собираем open-source решение, которое не сливает данные
Подробный обзор и пошаговая инструкция по созданию локального переводчика с потоковым выводом на базе open-source моделей. Защита данных, работа офлайн, сравнен
NUMA Mirror в llama.cpp: как выжать максимум из многосокетных серверов без боли
Разбор нового режима NUMA mirror в форке ik_llama.cpp: как он решает проблему межсокетного доступа к памяти и удваивает скорость инференса на серверных CPU.
Qwen 3.6 27B Abliterated: удаление безопасностных ограничений с минимальной потерей качества
Инструмент Apostate для аблайтерации Qwen 3.6 27B: удаление safety alignment с потерей менее 1% качества. Сравнение с альтернативами, примеры запуска и рекоменд
Как ИИ-агенты автоматизируют бэкпорты в Valkey: опыт форка Redis
Реальный кейс: как AI-агент берет на себя бэкпортирование коммитов в Valkey, разрешает merge-конфликты, проверяет лицензии и тесты. Опыт форка Redis.
SnarkRoute: строим нодовые редакторы для AI, которые не привязаны к фабрике
Разбираем SnarkRoute: протокол Open Route Protocol, портабельные ноды и route.yaml. Кому нужен этот open-source конструктор и почему он лучше ComfyUI и LangFlow
OCC-RAG: маленькие модели, которые отвечают только по делу (0.6B и 1.7B)
Обзор OCC-RAG: компактные SLM от AIRI с фокусом на faithfulness, открытые веса в GGUF. Как запустить, сравнение с альтернативами и практические примеры.
LongConspectWriter: как выжать конспект лекции из 8 ГБ и не потерять середину
Обзор мультиагентного пайплайна LongConspectWriter для локальных SLM. Как решить проблему деградации на длинных контекстах, уместиться в 8 ГБ VRAM и получить ст
Интеграция Nemotron 3.5 Content Safety: настройка мультимодальной безопасности для enterprise AI
Разбор архитектуры Nemotron 3.5 Content Safety: настройка кастомных политик, сравнение с конкурентами, примеры кода для RAG и агентов. Актуально на июнь 2026.
Mistral Small 4: открытый MoE-зверь с рассуждением, картинками и кодом — как приручить локально
Обзор Mistral Small 4 — 119B MoE от Mistral AI. Архитектура, мультимодальность, кодинг, рассуждения. Полный гайд по развёртыванию на своём железе.
Subquadratic SubQ: прорыв в скорости и контексте LLM — анализ заявлений и независимых тестов
Анализ заявлений Subquadratic о модели SubQ: 12x быстрее Transformer? Независимые тесты, сравнение с альтернативами, скепсис и практические рекомендации.
cocoindex-code: семантический поиск по коду для AI-агентов за две команды
Обзор cocoindex-code — инструмента семантического поиска по коду для AI-агентов. Установка за две команды, сравнение с аналогами, примеры использования на 2026