Инструменты
Подборка AI-инструментов. Только то, что работает.
Qwen3.5 397B на FP4: запускаем гиганта на Blackwell и RTX PRO 6000 без компромиссов
Полное руководство по запуску Qwen3.5 397B с квантованием FP4 на NVIDIA Blackwell и RTX PRO 6000. Аппаратные требования, настройка SGLANG, спекулятивный декодин
Zero-Shot Transferable Adapter: хак, который меняет правила fine-tuning'а
Новая методика переноса знаний между моделями без fine-tuning: экономия ресурсов, soft targets и практическое применение в 2026 году.
Decompose: ускорьте RAG в 70 раз, отфильтровав документы regex-ом перед отправкой в LLM
Библиотека Decompose ускоряет RAG-системы в 70 раз, фильтруя документы regex-ом перед отправкой в LLM. Установка, примеры, сравнение с альтернативами.
Podscript: когда хочется расшифровать подкаст, а не жизнь
Обзор Podscript — CLI-утилиты для автоматической транскрибации с таймкодами и диаризацией через ElevenLabs API. Установка, сравнение, примеры.
Mengram: бесплатный open-source Mem0 с тремя типами памяти. Ставим за 5 минут
Полный гайд по установке Mengram - бесплатной open-source альтернативы Mem0 с семантической, эпизодической и процедурной памятью. FastAPI, PostgreSQL, pgvector,
Как собрать локальный семантический поиск по файлам на Rust: туториал по созданию приватного аналога Windows Recall
Пошаговый туториал по созданию локального семантического поиска по файлам на Rust и Tauri. Приватная альтернатива Windows Recall без облака.
Tiny Aya: 70 языков в кармане. Запускаем 3.35B модель на ноутбуке без H100
Полный обзор семейства Tiny Aya от Cohere: 3.35B параметров, 70 языков, локальный запуск. Сравнение с Gemma 3, Granite 4.0, инструкция по установке.
Запуск Qwen3.5-397B на 128GB GPU: детальный разбор smol-IQ2_XS квантования в llama.cpp
Практическое руководство по запуску Qwen3.5-397B на 128GB GPU с smol-IQ2_XS квантованием в llama.cpp. Детали, команды, сравнение с альтернативами.
Ваш смартфон теперь AI-сервер: ставим приватного ассистента с Qwen3 и Stable Diffusion
Запускаем локальный Qwen3, Stable Diffusion и Whisper на Android/iOS. Полная приватность, работа без интернета, сравнение CPU/GPU. Инструкция на февраль 2026.
Бесконечные циклы Qwen3 Coder Next в OpenCode: плагин для Read-инструмента, который всё чинит
Готовый плагин для OpenCode, который останавливает бесконечные циклы Qwen3 Coder Next в квантованных версиях. Установка, примеры, сравнение.
NadirClaw: как интеллектуальный роутер LLM режет облачные счета на 60%
Практическое руководство по настройке NadirClaw - умного роутера LLM для экономии облачной квоты на 60%. Установка, конфигурация, сравнение с альтернативами.
BAZINGA: Когда один ИИ — ненадежный свидетель, а семь — консилиум
Гайд по установке BAZINGA — инструмента для защиты от ошибок ИИ через консенсус нескольких LLM. φ-coherence scoring, интеграция с Ollama, блокировка деструктивн