Инструменты
Подборка AI-инструментов. Только то, что работает.
Modly: как запустить локальную генерацию 3D-моделей с TripoSG и TRELLIS
Полный гайд по установке Modly для генерации 3D-моделей на своём ПК. Используйте TripoSG и TRELLIS для игровых ассетов и 3D-печати без интернета.
Voxtral Codec: как ужать речь до 2.14 кбит/с и не заметить разницы
Обзор Voxtral Codec. Как работает новый кодек для TTS со сжатием речи до 2.14 кбит/с. Архитектура VQ+FSQ, сравнение с альтернативами, примеры использования.
Конфигурация vLLM для Qwen 3.5 27B: как добиться 1.1M токен/с на кластере с B200
Рекордная скорость инференса 1.1M токен/с на Qwen 3.5 27B с vLLM, NVIDIA B200, FP8 KV cache и MTP-1. Настройки и конфиги.
Кастомный бэкенд llama.cpp для AMD XDNA2 NPU: полное руководство по установке и настройке
Эксклюзивный гайд по сборке кастомного бэкенда llama.cpp для AMD XDNA2 NPU. Настройка XRT, offload GEMM операций, тесты на Ryzen AI MAX 385.
Обзор OpenRoom от MiniMax: как запустить нишевую модель на Qwen 27B через llama.cpp
Обзор нишевой модели OpenRoom для генерации контента. Инструкция по локальному запуску Qwen 27B через llama.cpp, сравнение с аналогами и примеры использования.
Cohere Transcribe: 2-миллиардный монстр для транскрипции, который не стесняется работать локально
Открытая модель транскрипции от Cohere с 2 млрд параметров. Сравнение с Whisper, Parakeet, запуск на своем GPU. Точность, скорость, приватность.
OpenAgentPrompts: библиотека промптов для AI-агентов, которая экономит часы настроек
Обзор open-source библиотеки системных промптов для AI-агентов. Готовые конфигурации для Cursor, Claude и локальных моделей. Экономия времени, сообщество на Dis
RotorQuant: новый метод квантования в 10-19 раз быстрее TurboQuant (CUDA и Metal ядра)
RotorQuant — прорыв в квантовании KV-кэша с использованием Clifford rotors. Скорость в 10-19 раз выше TurboQuant, реализации на CUDA и Metal. Обзор на 26.03.202
Закройте свои Python-скрипты: ExecuTorch делает голосовые модели кроссплатформенными
Руководство по ExecuTorch для развертывания голосовых моделей на iOS, Android, macOS и Linux. Поддержка Metal, CUDA, Vulkan. Таблицы совместимости.
NVIDIA GPT-OSS-Puzzle-88B: как 88 миллиардов параметров поместились в H100 и не задыхаются
Технический разбор GPT-OSS-Puzzle-88B от NVIDIA. Puzzle NAS, Mixture-of-Experts, оптимизация KV-cache и инференса для H100. Сравнение с аналогами.
Как запустить RF-DETR Nano и YOLO26 на телефоне: on-device детекция объектов без интернета
Инструкция по запуску современных моделей детекции объектов RF-DETR Nano и YOLO26 на Android без интернета. Сравнение, шаги интеграции и примеры использования н
Российский локальный AI-агент: сборка с нуля без облака, VPN и подписок
Полный гайд по сборке автономного AI-агента на русском языке. Работает без облачных API, подписок и VPN. Актуально на март 2026.