Инструменты для работы с AI

d

ds4 WebUI: минимализм, который не бесит, или как antirez подарил нам UI для сервера из одного файла

Обзор ds4-webui — минималистичного веб-интерфейса для сервера ds4 от antirez. Сравнение с Oobabooga, Jan AI, LM Studio и Open WebUI, примеры использования, для

Обзор

Т

Три в одном: Nvidia Star Elastic — как 12B, 23B и 30B живут в одном файле, и зачем тебе Zero-Shot Slicing

Nvidia Star Elastic хранит три модели в одном чекпоинте. Узнайте, как работает Zero-Shot Slicing, и получите пошаговое руководство по запуску на своем железе.

Обзор

O

OncoAgent: open-source мультиагентная система для онкологии на LangGraph и QLoRA

Обзор OncoAgent — мультиагентной системы на LangGraph и QLoRA для анализа рака. Приватное развертывание на AMD MI300X. Сравнение с Med-PaLM, примеры.

Обзор

L

LazyWeb: бесплатный MCP-сервер для AI-дизайна интерфейсов с пулом из 257 000 экранов реальных приложений

Бесплатный MCP-сервер LazyWeb с пулом из 257 000 реальных скриншотов приложений. Решает проблему AI-look, помогает генерировать уникальные интерфейсы через Clau

Обзор

B

BeeLlama.cpp: форк llama.cpp с TurboQuant и DFlash – ускорение Qwen 27B до 135 tps на 3090

Обзор форка llama.cpp с TurboQuant и DFlash: как выжать 135 tps из Qwen 27B на RTX 3090. Детали квантования Q5, контекст 200k, сравнение с альтернативами.

Обзор

К

Как запустить MiMo-V2.5 с контекстом 1M на локальном ПК: тест производительности и настройка

Пошаговый гайд по запуску MiMo-V2.5 с контекстом 1M токенов. Оптимизация памяти, команды для llama-server, тесты скорости и реальные сценарии использования.

Обзор

C

Caliby: новая open-source векторная БД для AI-агентов, превосходящая pgvector и FAISS

Обзор Caliby — встраиваемой векторной БД, которая обгоняет pgvector и FAISS по скорости и эффективности на диске. Примеры, сравнения, рекомендации.

Обзор

C

CyberSecQwen-4B: маленькая, злая и полностью ваша. Локальная LLM для безопасности

CyberSecQwen-4B - 4-миллиардная модель для SOC и пентестеров. Работает офлайн, не сливает данные, понимает логи, атаки, уязвимости. Полный обзор и сравнение с а

Обзор

E

EMO — новая MoE-модель с эмерджентной модульностью: обзор архитектуры и как использовать 12.5% экспертов

Разбираем архитектуру EMO от Allen AI: как модель сама выращивает модули из данных, почему достаточно 12.5% экспертов и как запустить веса с HuggingFace.

Обзор

z

z-lab взял Gemma 4 и выжал из неё DFlash: обзор, установка и первые впечатления

Разбираем новое квантование DFlash для Gemma 4 26B: установка, тесты скорости, сравнение с IQ4_XS и Bartowski. Когда 4 активных миллиарда работают как 26.

Обзор

D

DS4: новый инференс-движок для DeepSeek 4 Flash на MacBook с 128GB – обзор и установка

DS4 – специализированный движок для запуска DeepSeek 4 Flash на Mac с 128GB. Сравнение с MLX, llama.cpp, пошаговая установка и примеры использования.

Обзор

Б

Быстрее молнии: тестируем MLX-AgentCore 2.0 — новый AI-движок для Apple Silicon, разгоняющий агентов до 600 ток/с

Подробный обзор MLX-AgentCore 2.0 — быстрого локального AI-движка для Mac на Apple Silicon. Тесты производительности, сравнение с Ollama и vLLM-MLX, примеры аге

Обзор