Инструменты
Подборка AI-инструментов. Только то, что работает.
Локальная память для Codex на SQLite: как создать плагин Hermes для постоянных правил проекта
Создайте плагин Hermes для Codex, который хранит правила проекта в SQLite и не даёт агенту забыть ваши требования. Примеры кода, архитектура, сравнение с MCP.
Медицинская ASR модель Parakeet 0.6B: fine-tuning и локальный запуск на Mac и CUDA
Полный обзор медицинской ASR модели Parakeet 0.6B: возможности, дообучение под терминологию, запуск на Mac (MLX) и Linux (CUDA). Сравнение с Whisper, примеры ко
Визуальный конструктор команд llama.cpp: как перестать гадать на флагах и начать запускать LLM
Готовый бесплатный инструмент для построения CLI команд llama.cpp с полным списком флагов и сохранением конфигурации. Забудь про копипаст из Readme.
ByteShape против Unsloth: выбор квантизации для Qwen3.6-35B-A3B в задачах tool calling и long context
Сравниваем квантизации ByteShape и Unsloth для Qwen3.6-35B-A3B: точность tool calling, поведение на длинном контексте, скорость и KV cache. Бенчмарки и рекоменд
NanoQuant: экстремальное квантование LLM до 0.5 бит — обзор реализации и первые тесты
Обзор NanoQuant — открытого инструмента для суб-1-битного квантования LLM до 0.5 бита на вес. Установка, сравнение с GPTQ/TurboQuant, первые тесты на Llama 3.1
Luce Spark: 35B MoE модель для 16GB GPU без offload – обзор и установка
Luce Spark 35B MoE — модель, которая умещается в 16GB VRAM без offload. Сравнение с аналогами, бенчмарки, инструкция по установке для локального запуска.
Видео в llama.cpp: как включить поддержку видео через mtmd (PR #24269)
Разбираем PR #24269 от ngxson: как добавить поддержку видео в llama.cpp через mtmd. Примеры сборки, сравнение с альтернативами, практические советы.
Локальная суммаризация arXiv с Ollama и Gemma 4: полный пайплайн от установки до Cloudflare DB
Пошаговый гайд: как собрать пайплайн для суммаризации arXiv статей на локальной LLM (Ollama + Gemma 4) и сохранить результаты в Cloudflare D1. Примеры кода, про
Meddies PII: снимаем маску с пациентов, не нарушая закон
Обзор Meddies PII — открытой мультиязычной модели для удаления PII из медицинских записей. Возможности, сравнение с альтернативами, примеры использования и реко
vllm-doctor: когда vLLM заболел, вызывайте диагноста с CLI
Обзор vllm-doctor — утилиты для мониторинга и диагностики инференс-серверов vLLM. Команды, метрики, сравнение с альтернативами и примеры использования.
PyTorch MoE/MoD Training Framework: кастомные CUDA-ядра, DeepSpeed и ускорение в 7 раз на T4
Обзор открытого фреймворка для обучения MoE/MoD-моделей с кастомными CUDA-кернелами и DeepSpeed. Ускорение до 7x на T4, лицензия Apache 2.0. Кому нужен и как ра
Landforge: ваш лендинг за 10 минут — с SEO, A/B-тестами и Claude Code Skills
Обзор open-source инструмента Landforge — лендинги на Claude Code Skills, встроенная SEO-оптимизация, A/B-тесты и автодеплой. Сравнение с альтернативами, пример