Инструменты
Подборка AI-инструментов. Только то, что работает.
Король вернулся: Qwen3-Coder-Next-FP8 с 8-битной точностью — тест нового чемпиона
Обзор Qwen3-Coder-Next-FP8 — модели для программирования с квантованием FP8. Сравнение с альтернативами, тесты производительности, установка и рекомендации на 2
NTTuner: GUI для тонкой настройки LLM, который не заставит вас ненавидеть fine-tuning
Полный обзор NTTuner — графического интерфейса для тонкой настройки LLM с Unsloth, скрейпером данных и экспортом в Ollama. Настройка моделей без командной строк
Voxtral-Mini 4B Realtime: Как запустить сверхбыструю транскрипцию речи с задержкой <500ms локально
Как запустить Mistral Voxtral-Mini 4B Realtime для сверхбыстрой транскрипции речи локально на своем компьютере. Сравнение с Whisper, инструкция по установке и н
AlphaGenome: как ИИ DeepMind наконец-то нашёл смысл в «геномном мусоре»
Технический обзор AlphaGenome от DeepMind. Как работает ИИ для анализа некодирующей ДНК, сравнение с альтернативами и практическое применение в геномике на 2026
Nemotron ColEmbed V2: как NVIDIA заново придумала мультимодальный поиск
Обзор новой мультимодальной модели NVIDIA для поиска по документам с изображениями и таблицами. Late-interaction архитектура, установка и практическое сравнение
Intern-S1-Pro: Модель на триллионе параметров, которая заставит вас забыть про ChatGPT для науки
Обзор гигантской open-source модели Intern-S1-Pro на 1 триллион параметров для научного мышления. Тесты на vLLM и SGLang, сравнение с альтернативами.
Qwen Coders: когда картинка стоит тысячи бенчмарков
Обзор инструмента для визуального сравнения квантований Qwen Coder Next. Смотрим на IQ1, Q3, Q4 через lightshow-тесты и понимаем, какой квант реально работает в
Step 3.5 Flash: быстрая, но нестабильная модель. Как исправить галлюцинации tool calls?
Практический обзор Step 3.5 Flash: как исправить галлюцинации tool calls, повторяющиеся reasoning traces и сравнение с GLM 4.7. Актуально на 04.02.2026.
Yuan 3.0 Flash 40B: китайский мультимодальный снайпер для RAG, который помещается в 8 ГБ VRAM
Тестируем Yuan 3.0 Flash 40B — китайскую мультимодальную модель 3.7B параметров, оптимизированную для RAG. Совместимость с llama.cpp, GGUF и сравнение с аналога
Ghidra MCP Server: 110 инструментов для AI-реверса и поиска функций между версиями
Как подключить 110 инструментов Ghidra к Claude через MCP для анализа бинарников, нормализованного хеширования функций и поиска между версиями ПО.
GGML реализация Qwen3-ASR: локальное распознавание речи с квантованием Q8 и forced alignment
Обзор GGML реализации Qwen3-ASR с квантованием Q8 для локального распознавания речи на 52 языках. Сравнение с Whisper, экономия памяти до 2 ГБ.
Qwen3-Coder-Next-NVFP4: как сжать модель с 149 ГБ до 45 ГБ с минимальной потерей качества
Технический разбор квантования Qwen3-Coder-Next в формат NVFP4. Сжатие с 149 ГБ до 45 ГБ при потере всего 1.63% на MMLU Pro+. Практическое руководство по запуск