Инструменты
Подборка AI-инструментов. Только то, что работает.
ds4 WebUI: минимализм, который не бесит, или как antirez подарил нам UI для сервера из одного файла
Обзор ds4-webui — минималистичного веб-интерфейса для сервера ds4 от antirez. Сравнение с Oobabooga, Jan AI, LM Studio и Open WebUI, примеры использования, для
Три в одном: Nvidia Star Elastic — как 12B, 23B и 30B живут в одном файле, и зачем тебе Zero-Shot Slicing
Nvidia Star Elastic хранит три модели в одном чекпоинте. Узнайте, как работает Zero-Shot Slicing, и получите пошаговое руководство по запуску на своем железе.
OncoAgent: open-source мультиагентная система для онкологии на LangGraph и QLoRA
Обзор OncoAgent — мультиагентной системы на LangGraph и QLoRA для анализа рака. Приватное развертывание на AMD MI300X. Сравнение с Med-PaLM, примеры.
LazyWeb: бесплатный MCP-сервер для AI-дизайна интерфейсов с пулом из 257 000 экранов реальных приложений
Бесплатный MCP-сервер LazyWeb с пулом из 257 000 реальных скриншотов приложений. Решает проблему AI-look, помогает генерировать уникальные интерфейсы через Clau
BeeLlama.cpp: форк llama.cpp с TurboQuant и DFlash – ускорение Qwen 27B до 135 tps на 3090
Обзор форка llama.cpp с TurboQuant и DFlash: как выжать 135 tps из Qwen 27B на RTX 3090. Детали квантования Q5, контекст 200k, сравнение с альтернативами.
Как запустить MiMo-V2.5 с контекстом 1M на локальном ПК: тест производительности и настройка
Пошаговый гайд по запуску MiMo-V2.5 с контекстом 1M токенов. Оптимизация памяти, команды для llama-server, тесты скорости и реальные сценарии использования.
Caliby: новая open-source векторная БД для AI-агентов, превосходящая pgvector и FAISS
Обзор Caliby — встраиваемой векторной БД, которая обгоняет pgvector и FAISS по скорости и эффективности на диске. Примеры, сравнения, рекомендации.
CyberSecQwen-4B: маленькая, злая и полностью ваша. Локальная LLM для безопасности
CyberSecQwen-4B - 4-миллиардная модель для SOC и пентестеров. Работает офлайн, не сливает данные, понимает логи, атаки, уязвимости. Полный обзор и сравнение с а
EMO — новая MoE-модель с эмерджентной модульностью: обзор архитектуры и как использовать 12.5% экспертов
Разбираем архитектуру EMO от Allen AI: как модель сама выращивает модули из данных, почему достаточно 12.5% экспертов и как запустить веса с HuggingFace.
z-lab взял Gemma 4 и выжал из неё DFlash: обзор, установка и первые впечатления
Разбираем новое квантование DFlash для Gemma 4 26B: установка, тесты скорости, сравнение с IQ4_XS и Bartowski. Когда 4 активных миллиарда работают как 26.
DS4: новый инференс-движок для DeepSeek 4 Flash на MacBook с 128GB – обзор и установка
DS4 – специализированный движок для запуска DeepSeek 4 Flash на Mac с 128GB. Сравнение с MLX, llama.cpp, пошаговая установка и примеры использования.
Быстрее молнии: тестируем MLX-AgentCore 2.0 — новый AI-движок для Apple Silicon, разгоняющий агентов до 600 ток/с
Подробный обзор MLX-AgentCore 2.0 — быстрого локального AI-движка для Mac на Apple Silicon. Тесты производительности, сравнение с Ollama и vLLM-MLX, примеры аге