Инструменты
Подборка AI-инструментов. Только то, что работает.
NousCoder-14B-GGUF: Qwen3 на стероидах, который решает 7 из 10 задач с первого раза
Обзор NousCoder-14B-GGUF: как Qwen3 14B после RL-дообучения на 24k задач выдает 67.87% Pass@1. Сравнение с альтернативами, тесты и рекомендации.
CUGA: конфигурируемый агент для веб и API задач - обзор и запуск в Hugging Face Spaces
Обзор CUGA - конфигурируемого агента с открытым кодом для веб и API задач. Запуск демо в Hugging Face Spaces, сравнение с альтернативами и примеры использования
Anthology: когда виртуальным личностям нужна настоящая биография
Обзор Anthology — инструмента для генерации консистентных виртуальных персонажей с полными backstories для исследований в социальных науках и тестирования LLM.
PLAID: дизайнер белков, который использует AlphaFold как кисть
Как PLAID использует диффузионные модели и латентное пространство AlphaFold для одновременной генерации последовательности и 3D-структуры белков. Обзор технолог
World Models от Runway: когда ИИ сам создает миры вместо картинок
Что такое World Models (GWM-1) от Runway, как работают авторегрессионные модели для генерации виртуальных миров и предсказания кадров в Gen-4.5
Nemotron-Personas-Japan: как NVIDIA создала японские персоны для LLM и почему это важно
Обзор первого открытого датасета японских персон от NVIDIA. Как использовать синтетические данные для тонкой настройки LLM под культурный контекст Японии.
GPT-5.2: Instant, Thinking и Pro — что выбрать, сколько платить и зачем это всё
Полный разбор GPT-5.2: отличия Instant, Thinking и Pro моделей, цена API, 400K контекст и кому какая версия подойдет.
AI Sheets: как работать с изображениями в таблицах без кода — извлечение текста, генерация и редактирование
Обзор open-source AI Sheets. Извлекайте текст из чеков, генерируйте картинки, редактируйте фото прямо в таблицах. Без кода, через тысячи моделей.
FLUX.2 в Diffusers: новая архитектура, которая заставит забыть про Stable Diffusion
Полный разбор FLUX.2 от Black Forest Labs: новая MM-DiT архитектура, запуск в Diffusers, LoRA-обучение и сравнение с альтернативами.
Mistral Vibe и Devstral 2: автономный кодер, который не просит ключ API
Разбираем Devstral 2 — автономный агент для кодинга на 123B параметров с открытыми весами. Результаты на SWE-bench, CLI под Apache 2.0 и сравнение с проприетарн
Granite 4.0 Nano 350M: тестируем сверхмалую модель IBM для edge-устройств
Тестирование Granite 4.0 Nano 350M от IBM. Сверхмалая модель для edge-вычислений с Apache 2.0 лицензией. Сравнение с Gemma 3 270M, запуск на Raspberry Pi.
BigCodeArena: как оценивать код от ИИ через выполнение — практическое руководство
Как работает BigCodeArena — платформа для оценки сгенерированного ИИ кода через его реальное выполнение. Сравнение с HumanEval, примеры использования и кому под