Инструменты
Подборка AI-инструментов. Только то, что работает.
Cognitive OS: локальная IDE для мультиагентных workflow с графом знаний
Архитектура локальной IDE для управления AI-агентами с персистентным состоянием, графом знаний и JIT-инъекцией контекста. Обзор на 26.01.2026.
Llama 3.2 3B на iPhone: как заставить телефон самому заказывать пиццу без интернета
Полный стек для локального тулкиттинга на iPhone: Llama 3.2 3B, React Native и RunAnywhere SDK. Запускаем функции без облаков.
RTX PRO 4000 Blackwell в SFF-корпусе: как запихнуть 48 ГБ VRAM в коробку из-под обуви и не сжечь квартиру
Практический гайд по установке RTX PRO 4000 Blackwell в SFF-ПК, настройка llama-server с CUDA и Vulkan, оптимизация VRAM под большие LLM модели.
FP8 на RTX 3090: самодельный Torch-экстеншен для экономии VRAM
Как заставить RTX 3090 работать с FP8 без аппаратной поддержки. Самодельный Torch-экстеншен, экономия VRAM и ускорение инференса LLM на старом железе.
CompactAI: Автоматический fine-tuning LLM за 5 минут или пустая трата времени?
Как работает CompactAI для автоматического fine-tuning моделей, сравнение с альтернативами и стоит ли использовать в 2026 году.
PassLLM: когда нейросеть угадывает ваш пароль с первой попытки
Обзор PassLLM - самого точного AI-угадывателя паролей. Как установить локально, примеры работы, сравнение с альтернативами и этические границы использования в 2
Как сделать автоматические субтитры для видео локально в браузере: Parakeet и SileroVAD
Автоматические субтитры для видео в браузере: Parakeet и SileroVAD
R3-Engine: 1.58-битный LLM-движок на Rust, который ломает мозг и AVX-512
Технический разбор R3-Engine: как работает 1.58-битное квантование BitNet b1.58 на Rust с AVX-512, проблема активации SiLU и сравнение с llama.cpp.
Vallignus: как создать супервизор для локальных AI-агентов (CrewAI/AutoGen) и остановить бесконечные циклы
Инструмент Vallignus решает проблему бесконечных циклов локальных AI-агентов. Настройка мониторинга, ограничение времени выполнения, безопасное завершение проце
ClaraVerse vs n8n/Zapier: как создать локальную AI-автоматизацию с 50+ интеграциями
Сравнение ClaraVerse с n8n и Zapier. Создаем локальные AI-воркфлоу с 50+ интеграциями. CLI, API из workflow, приватность данных.
Локальный AI-агент для автотестирования чат-ботов: собираем стенд на GPT-OSS 20B и Agno
Пошаговое руководство по настройке 100% локального AI-агента для автотестирования чат-ботов. GPT-OSS 20B, фреймворк Agno и llama.cpp сервер.
Multi-Head Latent Attention: как DeepSeek переизобрела механизм внимания и почему это работает быстрее
Полный разбор Multi-Head Latent Attention от DeepSeek с кодом на PyTorch. Оптимизации KV-cache, сравнение с MHA/GQA/MQA и практическая реализация.