Инструменты
Подборка AI-инструментов. Только то, что работает.
GLiNER 2: Как маленький энкодер бьет гигантские LLM в NER и экономит кучу денег
Сравнение GLiNER 2 с крупными языковыми моделями для извлечения сущностей. Почему специализированные энкодеры выигрывают в скорости, стоимости и детерминированн
Skills и CLI для coding agents: как LangChain улучшил производительность Claude Code до 95%
LangChain выпустил skills и CLI для LangSmith, которые подняли производительность Claude Code с 29% до 95%. Обзор новых инструментов и сравнение с альтернативам
GestaltSyntax - семантический пресс для старого кода: как впихнуть FORTRAN в контекстное окно AI
Открытый инструмент GestaltSyntax сжимает legacy-код до 12 раз для перевода AI-моделями. Возможности, сравнение с альтернативами, примеры использования.
Cicikus v3 Prometheus 4.4B: тестируем экспериментальную модель для логических задач на слабом железе
Тестируем экспериментальную модель Cicikus v3 Prometheus 4.4B для логических задач. Franken-merge, сравнение с Llama 3.2 и Gemma 3, примеры использования на сла
Ускорение vLLM на Jetson Orin в 3.8 раза: установка pre-built wheel с Marlin GPTQ
Готовый wheel для vLLM с поддержкой Marlin GPTQ ускоряет вывод LLM на Jetson Orin в 3.8 раза. Установка, бенчмарки, сравнение.
Патч CUTLASS и настройки для ускорения Qwen3.5-397B в 5 раз на Blackwell GPU (до 282 токенов/с)
Экстремальная оптимизация Qwen3.5-397B MoE. Кастомное ядро, патч SM120, Docker-образ. 282 токена/с на Blackwell. Гайд по установке.
ASI: локальный AI-ассистент для Android, который понимает прикосновения
Обзор open-source проекта ASI: локальный AI-ассистент для Android с сенсорным восприятием на базе Gemma 3. Работает без интернета, полностью приватно.
Reprompt: ваш промпт останется в семье
Как анализировать и оценивать промпты для AI-кодинга локально с помощью Reprompt. TF-IDF, Ollama и полная приватность данных. Установка и примеры.
Autoresearch Карпати в 2026: когда ИИ исследует сам себя
Разбираем autoresearch Карпати - систему автономных ML-экспериментов. Актуально на март 2026: установка, примеры, сравнение с альтернативами.
IndexCache для vLLM/SGLang: Ускоряем DeepSeek-V3.2 до 1.8x за счёт кеширования индексов внимания
Патч IndexCache для vLLM и SGLang ускоряет sparse attention в DeepSeek-V3.2 до 1.82x, сокращая время prefill для больших контекстов.
LocoTrainer-4B: как установить и использовать экспертного агента для фреймворка MS-SWIFT
Полное руководство по установке и использованию LocoTrainer-4B - экспертного агента для тонкой настройки моделей в фреймворке MS-SWIFT. Сравнение, примеры, реко
Manga-Translator: Rust-приложение, которое переводит комиксы офлайн с помощью локальных LLM
Как Rust-приложение с YOLO, LaMa и локальными LLM переводит мангу без интернета. Обзор возможностей, сравнение с аналогами и примеры использования.