Инструменты для работы с AI

Л

Локальная память для Codex на SQLite: как создать плагин Hermes для постоянных правил проекта

Создайте плагин Hermes для Codex, который хранит правила проекта в SQLite и не даёт агенту забыть ваши требования. Примеры кода, архитектура, сравнение с MCP.

Обзор

М

Медицинская ASR модель Parakeet 0.6B: fine-tuning и локальный запуск на Mac и CUDA

Полный обзор медицинской ASR модели Parakeet 0.6B: возможности, дообучение под терминологию, запуск на Mac (MLX) и Linux (CUDA). Сравнение с Whisper, примеры ко

Обзор

В

Визуальный конструктор команд llama.cpp: как перестать гадать на флагах и начать запускать LLM

Готовый бесплатный инструмент для построения CLI команд llama.cpp с полным списком флагов и сохранением конфигурации. Забудь про копипаст из Readme.

Обзор

B

ByteShape против Unsloth: выбор квантизации для Qwen3.6-35B-A3B в задачах tool calling и long context

Сравниваем квантизации ByteShape и Unsloth для Qwen3.6-35B-A3B: точность tool calling, поведение на длинном контексте, скорость и KV cache. Бенчмарки и рекоменд

Обзор

N

NanoQuant: экстремальное квантование LLM до 0.5 бит — обзор реализации и первые тесты

Обзор NanoQuant — открытого инструмента для суб-1-битного квантования LLM до 0.5 бита на вес. Установка, сравнение с GPTQ/TurboQuant, первые тесты на Llama 3.1

Обзор

L

Luce Spark: 35B MoE модель для 16GB GPU без offload – обзор и установка

Luce Spark 35B MoE — модель, которая умещается в 16GB VRAM без offload. Сравнение с аналогами, бенчмарки, инструкция по установке для локального запуска.

Обзор

В

Видео в llama.cpp: как включить поддержку видео через mtmd (PR #24269)

Разбираем PR #24269 от ngxson: как добавить поддержку видео в llama.cpp через mtmd. Примеры сборки, сравнение с альтернативами, практические советы.

Обзор

Л

Локальная суммаризация arXiv с Ollama и Gemma 4: полный пайплайн от установки до Cloudflare DB

Пошаговый гайд: как собрать пайплайн для суммаризации arXiv статей на локальной LLM (Ollama + Gemma 4) и сохранить результаты в Cloudflare D1. Примеры кода, про

Обзор

M

Meddies PII: снимаем маску с пациентов, не нарушая закон

Обзор Meddies PII — открытой мультиязычной модели для удаления PII из медицинских записей. Возможности, сравнение с альтернативами, примеры использования и реко

Обзор

v

vllm-doctor: когда vLLM заболел, вызывайте диагноста с CLI

Обзор vllm-doctor — утилиты для мониторинга и диагностики инференс-серверов vLLM. Команды, метрики, сравнение с альтернативами и примеры использования.

Обзор

P

PyTorch MoE/MoD Training Framework: кастомные CUDA-ядра, DeepSpeed и ускорение в 7 раз на T4

Обзор открытого фреймворка для обучения MoE/MoD-моделей с кастомными CUDA-кернелами и DeepSpeed. Ускорение до 7x на T4, лицензия Apache 2.0. Кому нужен и как ра

Обзор

L

Landforge: ваш лендинг за 10 минут — с SEO, A/B-тестами и Claude Code Skills

Обзор open-source инструмента Landforge — лендинги на Claude Code Skills, встроенная SEO-оптимизация, A/B-тесты и автодеплой. Сравнение с альтернативами, пример

Обзор