Инструменты для работы с AI

О

Обзор лучших открытых LLM апреля 2026: что запустить локально?

Актуальный обзор открытых LLM: Qwen3, Llama 4, Gemma 4 и другие. Сравнение по качеству и требованиям к железу. Тесты, советы, квантование.

Обзор

D

DeepSeek Thinking-with-Visual-Primitives: фреймворк, который заставит ИИ думать картинками

Разбираем новый фреймворк DeepSeek для визуального мышления: что такое Visual Primitives, как это работает и кому пригодится. Сравнение с аналогами, примеры код

Обзор

A

Agent-browser от Vercel: бунт AI-агентов против Playwright? Обзор нового инструмента

Разбираем agent-browser от Vercel: зачем AI-агентам отдельный браузер, чем он лучше Playwright и Puppeteer, и как его использовать с MCP. Актуально на апрель 20

Обзор

З

Запуск llama.cpp с поддержкой NVFP4 на Blackwell: что это даёт и как настроить

Полный гайд по сборке llama.cpp с NVFP4 для GPU Blackwell. Как ускорить LLM в 2 раза, сохранив качество. Тесты, бенчмарки и примеры настройки.

Обзор

X

Xiaomi MiMo-V2.5: Sparse MoE 310B модель — запуск, квантование и производительность на обычном железе

Обзор Xiaomi MiMo-V2.5: разреженная MoE 310B с 15B активных параметров. Как запустить на RTX 4090, квантование, сравнение с DeepSeek и Qwen. Тесты производитель

Обзор

N

Nemotron Nano 3 Omni в llama.cpp: конвертируем мультимодальную модель NVIDIA своими руками

Полный гайд по конвертации Nemotron Nano 3 Omni (NVIDIA) в GGUF для llama.cpp. Поддержка текста, изображений, аудио. Инструкция, примеры, сравнение с альтернати

Обзор

K

KV cache бенчмарк Qwen 3.6-35B-A3B на M5 Max: f16, q8_0, turbo3 и turbo4 до 1M контекста

Тестируем KV cache квантование для Qwen 3.6-35B-A3B на Mac M5 Max. Сравнение f16, q8_0, TurboQuant 3/4bit. Замеры до 1M токенов. Рекомендации по выбору.

Обзор

L

Lemonade OmniRouter: Как объединить локальные AI-модели для работы с текстом, изображениями и аудио

Lemonade OmniRouter — инструмент для создания единого API из локальных LLM, генераторов изображений и распознавания речи. Как настроить и кому это нужно.

Обзор

P

Poolside Laguna XS.2: возможности 33B MoE модели с открытой лицензией

Обзор Poolside Laguna XS.2 — открытой 33B MoE модели, сравнимой с Qwen 3.5. Агентские бенчмарки, примеры использования, сравнение с аналогами.

Обзор

О

Отлавливаем NaN в PyTorch за 3 мс: forward hook для точной локализации первого NaN в слое

Как с помощью forward hook в PyTorch за 3 мс найти первый NaN в нейросети. Сравнение с detect_anomaly и torch.isnan. Пример кода и рекомендации.

Обзор

T

TRELLIS.2 от Microsoft: 4 миллиарда причин забыть о ручном моделировании

Microsoft открыла TRELLIS.2 — нейросеть, которая из одной картинки делает 3D-модель с PBR-текстурами. 4 миллиарда параметров, 16x сжатие и лицензия MIT.

Обзор

N

NV-Raw2Insights-US: как голая физика сигнала меняет УЗИ

NVIDIA и Siemens выпустили модель NV-Raw2Insights-US, которая анализирует необработанные ультразвуковые сигналы. Физически-информированное машинное обучение пов

Обзор