Инструменты
Подборка AI-инструментов. Только то, что работает.
ModelRegistry: как я перестал ждать загрузки LLM и полюбил торренты (с резервным планом)
ModelRegistry — утилита, которая качает открытые модели через BitTorrent с веб-сидами от Hugging Face. Скорость, надёжность и никаких прерванных загрузок. Подро
ChatGPT Multi Pane: как скрестить ChatGPT с многооконностью и забыть о лимитах Codex
Обзор плагина ChatGPT Multi Pane: мультипанель, агентный цикл, обход лимитов, установка из GitHub. Сравнение с Codex и Codex-lb.
RAGpad: Терминальный блокнот с локальным ИИ, который не сливает ваши заметки
Privacy-focused приложение для заметок с RAG в терминале. Работает оффлайн на llama.cpp. Сравнение с Obsidian, NotebookLM, примеры использования.
SpectralQuant выжимает 96.5% точности BF16 из Q4_K_M: как калибровка чинит квантование для Qwen3.5 0.8B
SpectralQuant — калибровочно-осведомлённое квантование Q4_K_M с восстановлением 96.5% точности BF16. Сравнение с альтернативами, примеры, рекомендации. Техничес
ContextForge: SDK для бесконечного контекста LLM с долгосрочной памятью — обзор и установка
Обзор open-source SDK ContextForge, который решает проблему ограниченного контекста LLM. Установка, примеры кода, сравнение с LCME и NGT Memory.
Скальпель для голоса: как собрать локальный медицинский стенограф на MacBook без интернета и компромиссов
Обзор локального медицинского STT на MacBook: Parakeet 0.6B, Whisper, MLX. Реальное время, конфиденциальность, точность до 95%. Сравнение с Dragon Medical и Goo
Как объединить RTX 5080 и RTX 4060 для инференса LLM: гайд по гетерогенной сборке
Пошаговая инструкция: как скрестить RTX 5080 и RTX 4060 в одной системе для инференса больших языковых моделей. Тесты с Qwen, реальные цифры, грабли и советы.
Рецепт от катастрофического забывания: изоляция весов вместо общих параметров — разбор метода и код на GitHub
Разбираем подход к continual learning через изоляцию весов на примере проекта paradigm-swarm. Сравнение с EWC, Progressive Networks и PackNet. Пример кода на Gi
Бесплатный медицинский RAG API для локальных LLM – быстрый доступ к фактам без GPU
Бесплатный API на ARM VPS для быстрого поиска медицинских фактов из Wikipedia. Интеграция с локальными LLM, никаких GPU не нужно. Кому подойдет и как использова
Не жди, пока Claude подорожает: тащим артефакты на локальные модели — готовый репозиторий и инструкция
Готовый код на GitHub для запуска интерактивных артефактов Claude на любой локальной LLM. Инструкция, примеры, сравнение альтернатив. Экономь без потери функцио
Ornith-1.0: 397B MoE, который выкачаете на ноутбук. SOTA без подвоха?
Разбираем семейство Ornith-1.0: 9B, 31B, 35B и монстр 397B MoE. Сравниваем с DeepSeek, Qwen, Llama 4. Даем инструкцию по запуску на Hugging Face. Кому реально н
LLM Sandbox: Реализация агента с Docker-песочницей для безопасного исполнения кода
Обзор open-source инструмента LLM Sandbox: Docker-изоляция для AI-агентов, субагенты, оркестрация. Сравнение с gVisor, Firecracker, LangSmith Sandboxes. Примеры