Инструменты для работы с AI

M

MinerU-Diffusion: как диффузионный OCR ускоряет парсинг PDF в 3 раза (код на GitHub, поддержка MLX)

Обзор MinerU-Diffusion на 27.03.2026: как диффузионный декодирование и поддержка MLX ускоряют OCR для парсинга PDF-файлов. Сравнение с Tesseract, EasyOCR, инстр

Обзор

M

MemAware: почему память RAG-агентов проваливается на неявном контексте и как это тестировать

Открытый бенчмарк MemAware вскрывает главную слабость RAG-систем: неспособность работать с неявным контекстом. Примеры, сравнения и как тестировать свои агенты.

Обзор

К

Как Veai 5.7 ускоряет разработку: работа с директориями и переключение моделей в IDE

Обзор плагина Veai 5.7. Как работа с контекстом папок и переключение между OpenAI, Anthropic и локальными LLM ускоряют код в IntelliJ IDEA.

Обзор

К

Как заставить LLM играть в визуальные новеллы: патчинг Ren'Py, Ollama и автоматизация диалогов

Как интегрировать локальную LLM в игры Ren'Py для автоматизации диалогов. Подробный гайд по патчингу, настройке Ollama и созданию ИИ-агента для визуальных новел

Обзор

M

Microsoft GraphRAG и Ollama: практическое руководство по построению графа знаний на локальной машине

Пошаговая сборка графа знаний с Microsoft GraphRAG и Ollama 0.6.0. Извлекаем сущности, визуализируем в Gephi, делаем запросы. Полный код и актуальные модели на

Обзор

A

AdamBench: полный обзор бенчмарка для локальных LLM в агентском кодинге на RTX 5080

Полный обзор AdamBench — бенчмарка для оценки локальных LLM в агентском кодинге на RTX 5080. Сравнение моделей, метрики, примеры использования.

Обзор

M

Modly: как запустить локальную генерацию 3D-моделей с TripoSG и TRELLIS

Полный гайд по установке Modly для генерации 3D-моделей на своём ПК. Используйте TripoSG и TRELLIS для игровых ассетов и 3D-печати без интернета.

Обзор

V

Voxtral Codec: как ужать речь до 2.14 кбит/с и не заметить разницы

Обзор Voxtral Codec. Как работает новый кодек для TTS со сжатием речи до 2.14 кбит/с. Архитектура VQ+FSQ, сравнение с альтернативами, примеры использования.

Обзор

К

Конфигурация vLLM для Qwen 3.5 27B: как добиться 1.1M токен/с на кластере с B200

Рекордная скорость инференса 1.1M токен/с на Qwen 3.5 27B с vLLM, NVIDIA B200, FP8 KV cache и MTP-1. Настройки и конфиги.

Обзор

К

Кастомный бэкенд llama.cpp для AMD XDNA2 NPU: полное руководство по установке и настройке

Эксклюзивный гайд по сборке кастомного бэкенда llama.cpp для AMD XDNA2 NPU. Настройка XRT, offload GEMM операций, тесты на Ryzen AI MAX 385.

Обзор

О

Обзор OpenRoom от MiniMax: как запустить нишевую модель на Qwen 27B через llama.cpp

Обзор нишевой модели OpenRoom для генерации контента. Инструкция по локальному запуску Qwen 27B через llama.cpp, сравнение с аналогами и примеры использования.

Обзор

C

Cohere Transcribe: 2-миллиардный монстр для транскрипции, который не стесняется работать локально

Открытая модель транскрипции от Cohere с 2 млрд параметров. Сравнение с Whisper, Parakeet, запуск на своем GPU. Точность, скорость, приватность.

Обзор