Инструменты
Подборка AI-инструментов. Только то, что работает.
Speechos: ваш личный полигон для речевых моделей, который не шпионит за вами
Speechos: open-source инструмент для локального бенчмаркинга речевых моделей. Сравнивайте Whisper, Vosk, Supertonic 2 TTS без облаков. Адаптация к железу.
Conda-пакеты для AI-моделей: версионирование, кэширование и безопасность с rattler-build
Как rattler-build решает проблемы версионирования, кэширования и безопасности AI-моделей в Conda-пакетах. Пример упаковки whisper.cpp.
TranslateGemma UI: Веб-интерфейс для локального перевода, который не стыдно показать коллегам
Разверните свой приватный переводчик с веб-интерфейсом за 5 минут. Gemma 3, Docker, Ollama — и никаких облачных API. Полный гайд на февраль 2026 года.
DeepSeek DeepGEMM: как обновление с mHC и поддержкой Blackwell ускорит работу LLM
Технический обзор DeepSeek DeepGEMM: как обновление с Manifold-constrained Hyper-connections и поддержкой NVIDIA Blackwell ускоряет матричные вычисления для LLM
LLmFit: как одной командой подобрать идеальную LLM-модель под ваше железо
Обзор LLmFit - инструмента для подбора LLM-моделей под аппаратное обеспечение. Узнайте, как одной командой найти идеальную модель для вашего GPU и RAM.
Как запустить гигантские MoE-модели на одной видеокарте: разбор гибридного рантайма Krasis и бенчмарки
Гибридный рантайм Krasis позволяет запускать гигантские MoE-модели на одной видеокарте. Бенчмарки скорости префилла на RTX 5080 и других GPU.
Полное руководство по квантованию Qwen3.5-35B-A3B: разбор SOTA GGUFs от Unsloth и лучшие практики
Разбор динамических GGUF от Unsloth для Qwen3.5-35B-A3B: KL Divergence, чувствительные тензоры, сравнение методов квантования и рекомендации по выбору.
PageAgent: браузерный AI-агент для локального запуска с Ollama — обзор и туториал
PageAgent - браузерный AI-агент, работающий локально с Ollama. DOM как текст, автоматизация без облачных API. Полный обзор, сравнение и туториал.
Qwen 3.5 122B A10B: разбор рекорда в UGI, запуск с UD Q2KXL и обход цензуры
Обзор Qwen 3.5 122B A10B: рекорд в бенчмарке UGI, сравнение с GPT OSS 120B, запуск с квантованием UD Q2KXL и методы обхода цензуры в reasoning.
AutoBe: как слабые локальные LLM отладили генератор backend-приложений до 100% успеха
Как инструмент AutoBe использует слабые локальные LLM для отладки и достигает 100% успеха в генерации backend-приложений на NestJS и Prisma.
Perplexity Computer: как работает супер-агент, который управляет другими ИИ (Claude, Gemini, GPT-5.2)
Как Perplexity Computer оркестрирует Claude Opus 4.6, GPT-5.2 и Gemini для сложных задач. Возможности, сравнение с аналогами и кому подойдет.
pplx-embed от Perplexity: как использовать квантованные эмбеддинги для семантического поиска и RAG
Обзор pplx-embed от Perplexity: как int8-квантование ускоряет семантический поиск и RAG-системы. Примеры использования, сравнение с альтернативами.