Инструменты для работы с AI

O

OpenAgentPrompts: библиотека промптов для AI-агентов, которая экономит часы настроек

Обзор open-source библиотеки системных промптов для AI-агентов. Готовые конфигурации для Cursor, Claude и локальных моделей. Экономия времени, сообщество на Dis

Обзор

R

RotorQuant: новый метод квантования в 10-19 раз быстрее TurboQuant (CUDA и Metal ядра)

RotorQuant — прорыв в квантовании KV-кэша с использованием Clifford rotors. Скорость в 10-19 раз выше TurboQuant, реализации на CUDA и Metal. Обзор на 26.03.202

Обзор

З

Закройте свои Python-скрипты: ExecuTorch делает голосовые модели кроссплатформенными

Руководство по ExecuTorch для развертывания голосовых моделей на iOS, Android, macOS и Linux. Поддержка Metal, CUDA, Vulkan. Таблицы совместимости.

Обзор

N

NVIDIA GPT-OSS-Puzzle-88B: как 88 миллиардов параметров поместились в H100 и не задыхаются

Технический разбор GPT-OSS-Puzzle-88B от NVIDIA. Puzzle NAS, Mixture-of-Experts, оптимизация KV-cache и инференса для H100. Сравнение с аналогами.

Обзор

К

Как запустить RF-DETR Nano и YOLO26 на телефоне: on-device детекция объектов без интернета

Инструкция по запуску современных моделей детекции объектов RF-DETR Nano и YOLO26 на Android без интернета. Сравнение, шаги интеграции и примеры использования н

Обзор

Р

Российский локальный AI-агент: сборка с нуля без облака, VPN и подписок

Полный гайд по сборке автономного AI-агента на русском языке. Работает без облачных API, подписок и VPN. Актуально на март 2026.

Обзор

Б

Ботинок: как запустить консольный SSH-агент на слабом железе без 24 ГБ VRAM

Обзор инструмента Ботинок для запуска консольного SSH-агента на маломощном оборудовании. Сравнение с альтернативами, примеры использования, кому подойдет.

Обзор

К

Как запустить полностью локальный голосовой ИИ на iPhone с FluidAudio и llama.cpp

Запустите голосового ассистента на iPhone без интернета. Используйте FluidAudio 3.0 для аудио и llama.cpp 2.5 для ИИ. Полная приватность и скорость.

Обзор

Д

Детектор AI-контента на Android: как запустить оптимизированную ViT модель через ONNX Runtime в фоне

Локальный детектор AI-генеративных изображений на Android с Vision Transformer и ONNX Runtime. Работает в фоне через Quick Tile. Обзор технологии и примеры испо

Обзор

К

Как портировать TurboQuant (QJL) на MLX: сжатие KV-кэша в 1 бит для Llama на Mac

Практическое руководство по портированию TurboQuant (QJL) на MLX для сжатия KV-кэша в 1 бит. Экономия памяти 41.8% для Llama 3.2 3B на Mac.

Обзор

К

Как стабилизировать multi-agent циклы на локальных LLM: разбор архитектуры и промптов

Практический разбор EvidionAI для создания стабильных multi-agent систем на локальных LLM. Решение проблем doubt loops, skeptic agent и маршрутизации. Актуально

Обзор

П

Полный обзор Nemotron-3 Nano 4B Uncensored: как удалить GenRM и использовать агрессивную версию

Пошаговая инструкция по удалению GenRM из Nemotron-3 Nano 4B для полного снятия цензуры. Технические детали, сравнение с аналогами и примеры использования на 20

Обзор