Инструменты
Подборка AI-инструментов. Только то, что работает.
Kimi OK Computer: Что нашли в утекшем ядре автономных агентов
Полный разбор утечки кода Kimi OK Computer от Moonshot AI: системные промпты, инструменты, контейнерная архитектура и схемы автономных агентов на 2026 год.
DoomsdayOS: ваш автономный AI на флешке, который переживет апокалипсис
Пошаговое руководство по созданию портативной ОС с локальными LLM, RAG и офлайн-данными. Работает без интернета на любом компьютере.
Автоматический тест-сьют для локальных LLM: как перестать гадать и начать измерять
Практический гайд по автоматическому тестированию локальных LLM. Интеграция с LM Studio, сравнение Qwen3-Coder-Next, GPT-OSS-20B и других моделей.
MLX 26.2 и RDMA: как распределённые вычисления на Mac с Thunderbolt 5 ускоряют запуск LLM
Обзор MLX 26.2 с RDMA для распределённых вычислений на Mac через Thunderbolt 5. Как снизить TTFT для локальных моделей в 3 раза. Тесты MoE-архитектур.
Mutsu Studio Lite: когда чат с ИИ превращается в визуальную новеллу на вашем компьютере
Настройка Mutsu Studio Lite для приватных ролевых игр с ИИ в стиле Visual Novel. Live2D модели, Emotional Damping, системные промпты - полный гайд на 2026 год.
Agentic Debugging: как заставить LLM искать баги в C/C++ коде с помощью OpenCode и term-cli
Пошаговый гайд по использованию OpenCode и term-cli для автоматической отладки багов в нативном коде на примере ffmpeg/x264. Сравнение с альтернативами и практи
GAE (Geodesic Attention Engine): как запустить точное внимание для 1M токенов на 1 ГБ VRAM
Geodesic Attention Engine сокращает использование памяти на 99.6% для длинных контекстов. Узнайте, как запустить 1 млн токенов на 1 ГБ VRAM.
Minimax m2.1 DWQ MLX: почему эта квантованная модель стала скрытым алмазом для Mac и исследовательской работы
Обзор Minimax m2.1 DWQ MLX — квантованной 4-bit модели для MLX на Mac. Сравнение с альтернативами, параметры запуска, примеры использования для владельцев M2 Ul
Эксперимент Anthropic: как 16 AI-агентов Claude создали компилятор C с нуля
Технический разбор эксперимента Anthropic: 16 автономных агентов Claude Opus 4.6 создали работающий компилятор C. Docker, Git, Rust и реальная стоимость API.
Serpentine TTS: 90ms задержки и 3.5GB памяти — локальный синтез речи для Mac, который не просит денег
Обзор Serpentine TTS — локального TTS для Mac с задержкой 90ms, архитектурой look-ahead и поддержкой MLX. Сравнение с Elevenlabs, установка и примеры.
Голосовой агент с RAG на GTX 1650: как уложиться в 400 мс при 4 ГБ VRAM
Пошаговый гайд по созданию голосового агента с иерархическим RAG на GTX 1650 (4 ГБ VRAM). Код, оптимизации Zero-Copy Memory, задержка менее 400 мс.
MacBook превращается в стенографиста: как собрать полностью локальный рекордер встреч с Whisper и Llama
Полное руководство по созданию приватного рекордера встреч для Mac на базе Whisper и Llama. Аудио не покидает устройство, полный контроль над данными.