Инструменты
Подборка AI-инструментов. Только то, что работает.
Как запустить 1-битные модели Bonsai на CPU и AMD GPU: фиксы в llama.cpp и инструкции по ROCm
Подробное руководство по запуску 1-битных моделей Bonsai через исправленный форк llama.cpp. Инструкции для CPU с AVX512 и AMD GPU через ROCm на 02.04.2026.
Сверхмалые эмбеддинги: семейство моделей от 700KB, которые не стыдно использовать
Полный обзор семейства статических эмбеддинг-моделей от 700KB до 125MB. Сравнение производительности на MTEB, интеграция с sentence-transformers и сценарии испо
Open-Source агент «Союз»: ваш новый параноидальный друг на рабочем столе
Установка, настройка и использование open-source агента Союз. Сравнение с альтернативами, примеры автоматизации рабочих процессов на Kotlin. Безопасный десктопн
Как обойти защиту Gemma 4 методом ARA (Arbitrary-Rank Ablation) — туториал по Heretic
Пошаговое руководство по снятию цензуры с Gemma 4 с помощью метода Arbitrary-Rank Ablation и инструмента Heretic. Обход alignment за 15 минут.
Как запустить многомодальную Gemma 4 локально: обзор квантований и интеграции с llama.cpp, MLX и WebGPU
Полное руководство по запуску многомодальной Gemma 4 на своем устройстве. Обзор квантований, интеграция с llama.cpp, MLX и WebGPU. Примеры использования.
Google Vids обновлён: как бесплатно генерировать видео (Veo 3.1), музыку (Lyria) и управлять аватарами через промпты
Полный обзор Google Vids. Как использовать 10 бесплатных генераций Veo 3.1 в месяц, создавать саундтреки Lyria 3 и управлять аватарами через промпты. Экспорт в
Bonsai: тестирование 1-битной версии Qwen3 и форка llama.cpp - 107 токенов в секунду на RTX 4060
Тестирование Bonsai - 1-битной модели Qwen3 от PrismML. Рекорд 107 t/s на RTX 4060. Установка, сравнение с альтернативами, кому подойдет. Актуально на 02.04.202
Sova AI: первый ИИ-агент на Android, который работает без ПК, ADB и root-прав
Обзор Sova AI — первого полностью автономного ИИ-агента на Android. Работает через Accessibility API, не требует ПК, ADB или root-прав. Примеры использования и
mlx-tinker: локальное continual RL для Qwen3.5 на Apple Silicon — установка и использование
Обзор mlx-tinker: локальное continual reinforcement learning для Qwen3.5 на Apple Silicon. Установка, сравнение с mlx-tune, примеры использования на 02.04.2026.
Rust-графы для AI: храним эмбеддинги и связи в одном движке
Интеграция векторных эмбеддингов и графовых зависимостей в одной Rust-базе. Примеры использования Cypher запросов и GNN для AI-проектов.
Создание локального игрового AI-агента: связка LM Studio, Qwen 35B и игрового движка
Пошаговый гайд по созданию автономного игрового AI-агента на LM Studio и Qwen 3.5 35B A3B Q4_K_M. Интеграция с игровыми движками, сравнение альтернатив.
Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled: когда дистилляция вкуснее оригинала
Тестирование модели, дистиллированной от Claude 4.6 Opus, для создания AI-агентов. Сравнение с альтернативами, примеры использования и рекомендации на 2026 год.