Инструменты
Подборка AI-инструментов. Только то, что работает.
Обзор лучших открытых LLM апреля 2026: что запустить локально?
Актуальный обзор открытых LLM: Qwen3, Llama 4, Gemma 4 и другие. Сравнение по качеству и требованиям к железу. Тесты, советы, квантование.
DeepSeek Thinking-with-Visual-Primitives: фреймворк, который заставит ИИ думать картинками
Разбираем новый фреймворк DeepSeek для визуального мышления: что такое Visual Primitives, как это работает и кому пригодится. Сравнение с аналогами, примеры код
Agent-browser от Vercel: бунт AI-агентов против Playwright? Обзор нового инструмента
Разбираем agent-browser от Vercel: зачем AI-агентам отдельный браузер, чем он лучше Playwright и Puppeteer, и как его использовать с MCP. Актуально на апрель 20
Запуск llama.cpp с поддержкой NVFP4 на Blackwell: что это даёт и как настроить
Полный гайд по сборке llama.cpp с NVFP4 для GPU Blackwell. Как ускорить LLM в 2 раза, сохранив качество. Тесты, бенчмарки и примеры настройки.
Xiaomi MiMo-V2.5: Sparse MoE 310B модель — запуск, квантование и производительность на обычном железе
Обзор Xiaomi MiMo-V2.5: разреженная MoE 310B с 15B активных параметров. Как запустить на RTX 4090, квантование, сравнение с DeepSeek и Qwen. Тесты производитель
Nemotron Nano 3 Omni в llama.cpp: конвертируем мультимодальную модель NVIDIA своими руками
Полный гайд по конвертации Nemotron Nano 3 Omni (NVIDIA) в GGUF для llama.cpp. Поддержка текста, изображений, аудио. Инструкция, примеры, сравнение с альтернати
KV cache бенчмарк Qwen 3.6-35B-A3B на M5 Max: f16, q8_0, turbo3 и turbo4 до 1M контекста
Тестируем KV cache квантование для Qwen 3.6-35B-A3B на Mac M5 Max. Сравнение f16, q8_0, TurboQuant 3/4bit. Замеры до 1M токенов. Рекомендации по выбору.
Lemonade OmniRouter: Как объединить локальные AI-модели для работы с текстом, изображениями и аудио
Lemonade OmniRouter — инструмент для создания единого API из локальных LLM, генераторов изображений и распознавания речи. Как настроить и кому это нужно.
Poolside Laguna XS.2: возможности 33B MoE модели с открытой лицензией
Обзор Poolside Laguna XS.2 — открытой 33B MoE модели, сравнимой с Qwen 3.5. Агентские бенчмарки, примеры использования, сравнение с аналогами.
Отлавливаем NaN в PyTorch за 3 мс: forward hook для точной локализации первого NaN в слое
Как с помощью forward hook в PyTorch за 3 мс найти первый NaN в нейросети. Сравнение с detect_anomaly и torch.isnan. Пример кода и рекомендации.
TRELLIS.2 от Microsoft: 4 миллиарда причин забыть о ручном моделировании
Microsoft открыла TRELLIS.2 — нейросеть, которая из одной картинки делает 3D-модель с PBR-текстурами. 4 миллиарда параметров, 16x сжатие и лицензия MIT.
NV-Raw2Insights-US: как голая физика сигнала меняет УЗИ
NVIDIA и Siemens выпустили модель NV-Raw2Insights-US, которая анализирует необработанные ультразвуковые сигналы. Физически-информированное машинное обучение пов