Инструменты для работы с AI

D

Decompose: ускорьте RAG в 70 раз, отфильтровав документы regex-ом перед отправкой в LLM

Библиотека Decompose ускоряет RAG-системы в 70 раз, фильтруя документы regex-ом перед отправкой в LLM. Установка, примеры, сравнение с альтернативами.

Обзор

P

Podscript: когда хочется расшифровать подкаст, а не жизнь

Обзор Podscript — CLI-утилиты для автоматической транскрибации с таймкодами и диаризацией через ElevenLabs API. Установка, сравнение, примеры.

Обзор

M

Mengram: бесплатный open-source Mem0 с тремя типами памяти. Ставим за 5 минут

Полный гайд по установке Mengram - бесплатной open-source альтернативы Mem0 с семантической, эпизодической и процедурной памятью. FastAPI, PostgreSQL, pgvector,

Обзор

К

Как собрать локальный семантический поиск по файлам на Rust: туториал по созданию приватного аналога Windows Recall

Пошаговый туториал по созданию локального семантического поиска по файлам на Rust и Tauri. Приватная альтернатива Windows Recall без облака.

Обзор

T

Tiny Aya: 70 языков в кармане. Запускаем 3.35B модель на ноутбуке без H100

Полный обзор семейства Tiny Aya от Cohere: 3.35B параметров, 70 языков, локальный запуск. Сравнение с Gemma 3, Granite 4.0, инструкция по установке.

Обзор

З

Запуск Qwen3.5-397B на 128GB GPU: детальный разбор smol-IQ2_XS квантования в llama.cpp

Практическое руководство по запуску Qwen3.5-397B на 128GB GPU с smol-IQ2_XS квантованием в llama.cpp. Детали, команды, сравнение с альтернативами.

Обзор

В

Ваш смартфон теперь AI-сервер: ставим приватного ассистента с Qwen3 и Stable Diffusion

Запускаем локальный Qwen3, Stable Diffusion и Whisper на Android/iOS. Полная приватность, работа без интернета, сравнение CPU/GPU. Инструкция на февраль 2026.

Обзор

Б

Бесконечные циклы Qwen3 Coder Next в OpenCode: плагин для Read-инструмента, который всё чинит

Готовый плагин для OpenCode, который останавливает бесконечные циклы Qwen3 Coder Next в квантованных версиях. Установка, примеры, сравнение.

Обзор

N

NadirClaw: как интеллектуальный роутер LLM режет облачные счета на 60%

Практическое руководство по настройке NadirClaw - умного роутера LLM для экономии облачной квоты на 60%. Установка, конфигурация, сравнение с альтернативами.

Обзор

B

BAZINGA: Когда один ИИ — ненадежный свидетель, а семь — консилиум

Гайд по установке BAZINGA — инструмента для защиты от ошибок ИИ через консенсус нескольких LLM. φ-coherence scoring, интеграция с Ollama, блокировка деструктивн

Обзор

I

Izwi: локальный монстр для аудио, который понимает кто говорит и как

Полный разбор Izwi — Rust-движка для аудио на Qwen3. Транскрипция, разделение спикеров, синтез речи на одной машине. Сравнение с Whisper, Ollama.

Обзор

Ф

Физический закон приватности: как запустить AI-агент Physiclaw без единого облачного запроса

Пошаговая инструкция по развертыванию форка Physiclaw в air-gapped среде. Удаляем телеметрию, подключаем локальные vLLM и llama.cpp эндпоинты.

Обзор