Инструменты для работы с AI

R

Refiner: библиотека робототехники от бывшей команды Hugging Face, которая переворачивает претрейнинг

Обзор Refiner — open-source библиотеки для робототехники от бывшей команды претрейнинга Hugging Face. Возможности, сравнение с LeRobot, примеры использования и

Обзор

Л

Локальный AI-мониторинг экрана: запускаем open-source инструмент одной командой

ScreenWatch — open-source инструмент для приватного AI-мониторинга экрана. Запускается одной командой, использует локальную LLM, никаких облаков.

Обзор

И

Интеграция LLM в корпоративную шину: обзор redb.Route.Llm и enterprise-паттернов

Как встроить языковые модели в корпоративную шину без монолита? Обзор библиотеки redb.Route.Llm, Enterprise Integration Patterns для LLM и примеры кода для .NET

Обзор

L

Lemonade v10.7: как запускать LLM на любом железе — обзор новых рабочих групп и функций

Новая версия Lemonade 10.7: поддержка рабочих групп, запуск LLM на AMD, Intel, Apple Silicon. Сравнение с Ollama, LM Studio. Кому подойдет?

Обзор

F

FlashMemory-DeepSeek-V4: новый метод Lookahead Sparse Attention для ультра-длинного контекста

Разбираем инновацию DeepSeek — Lookahead Sparse Attention. Как работает, с чем сравнивать, кому подойдёт. Контекст до 1M токенов без потери качества.

Обзор

К

Когда Hypothesis пасует: как LLM-агент откопал баги в NumPy, SciPy и Pandas

Разбор метода property-based testing с LLM-агентом: как нейросеть находит ошибки в популярных Python-библиотеках, реальные примеры багов и сравнение с альтернат

Обзор

O

OSCAR RotationZoo: новое квантование KV Cache до 2 бит — инструкция по установке и применению

Разбираем OSCAR RotationZoo — квантование KV Cache до 2 бит со спектральным вращением. Инструкция по установке, сравнение с альтернативами, примеры для локально

Обзор

n

ntkMirror: как заставить LLM расписаться в собственной лжи без дообучения (ICML 2026)

ntkMirror — тренировка-free метод предсказуемого контроля галлюцинаций в LLM. Как работает, сравнение с RAG и RLHF, примеры кода. Результаты ICML 2026.

Обзор

U

Unsloth выпустил GGUF-квантизации Gemma 4 с QAT и MTP: запускаем на GPU и CPU

Новые GGUF-квантизации Gemma 4 от Unsloth с QAT и MTP. Ускорение до 40 токенов/c на RTX 4090, запуск на CPU. Сравнение квантований, примеры команд.

Обзор

C

Cohere North Mini Code 1.0: 30B MoE-модель для кодинга с A3B архитектурой — обзор и ссылки

Обзор Cohere North Mini Code 1.0: новая кодинг-модель 30B MoE с архитектурой A3B. Веса на HuggingFace, возможности локального запуска, сравнение с альтернативам

Обзор

K

KV Cache Sharing for Multi-Agent LLM Pipelines: как ускорить инференс в 2 раза на старых GPU

Техника KV Cache Sharing для мультиагентных пайплайнов: как получить 1.95x ускорение на RTX 3090 без покупки новых карт. Реализация в llama.cpp, бенчмарки, copy

Обзор

S

Spring Explore Skill: настройка AI-агента для работы с Spring Boot и генерации кода

Как настроить AI-агента с помощью Spring Explore Skill. Установка через npx skills, примеры генерации Spring-кода, сравнение с альтернативами в 2026 году.

Обзор