Инструменты
Подборка AI-инструментов. Только то, что работает.
OpenAgentPrompts: библиотека промптов для AI-агентов, которая экономит часы настроек
Обзор open-source библиотеки системных промптов для AI-агентов. Готовые конфигурации для Cursor, Claude и локальных моделей. Экономия времени, сообщество на Dis
RotorQuant: новый метод квантования в 10-19 раз быстрее TurboQuant (CUDA и Metal ядра)
RotorQuant — прорыв в квантовании KV-кэша с использованием Clifford rotors. Скорость в 10-19 раз выше TurboQuant, реализации на CUDA и Metal. Обзор на 26.03.202
Закройте свои Python-скрипты: ExecuTorch делает голосовые модели кроссплатформенными
Руководство по ExecuTorch для развертывания голосовых моделей на iOS, Android, macOS и Linux. Поддержка Metal, CUDA, Vulkan. Таблицы совместимости.
NVIDIA GPT-OSS-Puzzle-88B: как 88 миллиардов параметров поместились в H100 и не задыхаются
Технический разбор GPT-OSS-Puzzle-88B от NVIDIA. Puzzle NAS, Mixture-of-Experts, оптимизация KV-cache и инференса для H100. Сравнение с аналогами.
Как запустить RF-DETR Nano и YOLO26 на телефоне: on-device детекция объектов без интернета
Инструкция по запуску современных моделей детекции объектов RF-DETR Nano и YOLO26 на Android без интернета. Сравнение, шаги интеграции и примеры использования н
Российский локальный AI-агент: сборка с нуля без облака, VPN и подписок
Полный гайд по сборке автономного AI-агента на русском языке. Работает без облачных API, подписок и VPN. Актуально на март 2026.
Ботинок: как запустить консольный SSH-агент на слабом железе без 24 ГБ VRAM
Обзор инструмента Ботинок для запуска консольного SSH-агента на маломощном оборудовании. Сравнение с альтернативами, примеры использования, кому подойдет.
Как запустить полностью локальный голосовой ИИ на iPhone с FluidAudio и llama.cpp
Запустите голосового ассистента на iPhone без интернета. Используйте FluidAudio 3.0 для аудио и llama.cpp 2.5 для ИИ. Полная приватность и скорость.
Детектор AI-контента на Android: как запустить оптимизированную ViT модель через ONNX Runtime в фоне
Локальный детектор AI-генеративных изображений на Android с Vision Transformer и ONNX Runtime. Работает в фоне через Quick Tile. Обзор технологии и примеры испо
Как портировать TurboQuant (QJL) на MLX: сжатие KV-кэша в 1 бит для Llama на Mac
Практическое руководство по портированию TurboQuant (QJL) на MLX для сжатия KV-кэша в 1 бит. Экономия памяти 41.8% для Llama 3.2 3B на Mac.
Как стабилизировать multi-agent циклы на локальных LLM: разбор архитектуры и промптов
Практический разбор EvidionAI для создания стабильных multi-agent систем на локальных LLM. Решение проблем doubt loops, skeptic agent и маршрутизации. Актуально
Полный обзор Nemotron-3 Nano 4B Uncensored: как удалить GenRM и использовать агрессивную версию
Пошаговая инструкция по удалению GenRM из Nemotron-3 Nano 4B для полного снятия цензуры. Технические детали, сравнение с аналогами и примеры использования на 20