Инструменты
Подборка AI-инструментов. Только то, что работает.
Refiner: библиотека робототехники от бывшей команды Hugging Face, которая переворачивает претрейнинг
Обзор Refiner — open-source библиотеки для робототехники от бывшей команды претрейнинга Hugging Face. Возможности, сравнение с LeRobot, примеры использования и
Локальный AI-мониторинг экрана: запускаем open-source инструмент одной командой
ScreenWatch — open-source инструмент для приватного AI-мониторинга экрана. Запускается одной командой, использует локальную LLM, никаких облаков.
Интеграция LLM в корпоративную шину: обзор redb.Route.Llm и enterprise-паттернов
Как встроить языковые модели в корпоративную шину без монолита? Обзор библиотеки redb.Route.Llm, Enterprise Integration Patterns для LLM и примеры кода для .NET
Lemonade v10.7: как запускать LLM на любом железе — обзор новых рабочих групп и функций
Новая версия Lemonade 10.7: поддержка рабочих групп, запуск LLM на AMD, Intel, Apple Silicon. Сравнение с Ollama, LM Studio. Кому подойдет?
FlashMemory-DeepSeek-V4: новый метод Lookahead Sparse Attention для ультра-длинного контекста
Разбираем инновацию DeepSeek — Lookahead Sparse Attention. Как работает, с чем сравнивать, кому подойдёт. Контекст до 1M токенов без потери качества.
Когда Hypothesis пасует: как LLM-агент откопал баги в NumPy, SciPy и Pandas
Разбор метода property-based testing с LLM-агентом: как нейросеть находит ошибки в популярных Python-библиотеках, реальные примеры багов и сравнение с альтернат
OSCAR RotationZoo: новое квантование KV Cache до 2 бит — инструкция по установке и применению
Разбираем OSCAR RotationZoo — квантование KV Cache до 2 бит со спектральным вращением. Инструкция по установке, сравнение с альтернативами, примеры для локально
ntkMirror: как заставить LLM расписаться в собственной лжи без дообучения (ICML 2026)
ntkMirror — тренировка-free метод предсказуемого контроля галлюцинаций в LLM. Как работает, сравнение с RAG и RLHF, примеры кода. Результаты ICML 2026.
Unsloth выпустил GGUF-квантизации Gemma 4 с QAT и MTP: запускаем на GPU и CPU
Новые GGUF-квантизации Gemma 4 от Unsloth с QAT и MTP. Ускорение до 40 токенов/c на RTX 4090, запуск на CPU. Сравнение квантований, примеры команд.
Cohere North Mini Code 1.0: 30B MoE-модель для кодинга с A3B архитектурой — обзор и ссылки
Обзор Cohere North Mini Code 1.0: новая кодинг-модель 30B MoE с архитектурой A3B. Веса на HuggingFace, возможности локального запуска, сравнение с альтернативам
KV Cache Sharing for Multi-Agent LLM Pipelines: как ускорить инференс в 2 раза на старых GPU
Техника KV Cache Sharing для мультиагентных пайплайнов: как получить 1.95x ускорение на RTX 3090 без покупки новых карт. Реализация в llama.cpp, бенчмарки, copy
Spring Explore Skill: настройка AI-агента для работы с Spring Boot и генерации кода
Как настроить AI-агента с помощью Spring Explore Skill. Установка через npx skills, примеры генерации Spring-кода, сравнение с альтернативами в 2026 году.