Инструменты
Подборка AI-инструментов. Только то, что работает.
MinerU-Diffusion: как диффузионный OCR ускоряет парсинг PDF в 3 раза (код на GitHub, поддержка MLX)
Обзор MinerU-Diffusion на 27.03.2026: как диффузионный декодирование и поддержка MLX ускоряют OCR для парсинга PDF-файлов. Сравнение с Tesseract, EasyOCR, инстр
MemAware: почему память RAG-агентов проваливается на неявном контексте и как это тестировать
Открытый бенчмарк MemAware вскрывает главную слабость RAG-систем: неспособность работать с неявным контекстом. Примеры, сравнения и как тестировать свои агенты.
Как Veai 5.7 ускоряет разработку: работа с директориями и переключение моделей в IDE
Обзор плагина Veai 5.7. Как работа с контекстом папок и переключение между OpenAI, Anthropic и локальными LLM ускоряют код в IntelliJ IDEA.
Как заставить LLM играть в визуальные новеллы: патчинг Ren'Py, Ollama и автоматизация диалогов
Как интегрировать локальную LLM в игры Ren'Py для автоматизации диалогов. Подробный гайд по патчингу, настройке Ollama и созданию ИИ-агента для визуальных новел
Microsoft GraphRAG и Ollama: практическое руководство по построению графа знаний на локальной машине
Пошаговая сборка графа знаний с Microsoft GraphRAG и Ollama 0.6.0. Извлекаем сущности, визуализируем в Gephi, делаем запросы. Полный код и актуальные модели на
AdamBench: полный обзор бенчмарка для локальных LLM в агентском кодинге на RTX 5080
Полный обзор AdamBench — бенчмарка для оценки локальных LLM в агентском кодинге на RTX 5080. Сравнение моделей, метрики, примеры использования.
Modly: как запустить локальную генерацию 3D-моделей с TripoSG и TRELLIS
Полный гайд по установке Modly для генерации 3D-моделей на своём ПК. Используйте TripoSG и TRELLIS для игровых ассетов и 3D-печати без интернета.
Voxtral Codec: как ужать речь до 2.14 кбит/с и не заметить разницы
Обзор Voxtral Codec. Как работает новый кодек для TTS со сжатием речи до 2.14 кбит/с. Архитектура VQ+FSQ, сравнение с альтернативами, примеры использования.
Конфигурация vLLM для Qwen 3.5 27B: как добиться 1.1M токен/с на кластере с B200
Рекордная скорость инференса 1.1M токен/с на Qwen 3.5 27B с vLLM, NVIDIA B200, FP8 KV cache и MTP-1. Настройки и конфиги.
Кастомный бэкенд llama.cpp для AMD XDNA2 NPU: полное руководство по установке и настройке
Эксклюзивный гайд по сборке кастомного бэкенда llama.cpp для AMD XDNA2 NPU. Настройка XRT, offload GEMM операций, тесты на Ryzen AI MAX 385.
Обзор OpenRoom от MiniMax: как запустить нишевую модель на Qwen 27B через llama.cpp
Обзор нишевой модели OpenRoom для генерации контента. Инструкция по локальному запуску Qwen 27B через llama.cpp, сравнение с аналогами и примеры использования.
Cohere Transcribe: 2-миллиардный монстр для транскрипции, который не стесняется работать локально
Открытая модель транскрипции от Cohere с 2 млрд параметров. Сравнение с Whisper, Parakeet, запуск на своем GPU. Точность, скорость, приватность.