Инструменты
Подборка AI-инструментов. Только то, что работает.
Бюджетные GPU для LLM: какую карту за копейки взять в 2026 году
Практическое сравнение бюджетных GPU для запуска локальных нейросетей. Таблицы скорости, реальные токены в секунду и советы по выбору карты до $250.
ZINC: новый движок для вывода LLM на Zig, запускающий 35B модели на бюджетных AMD GPU
ZINC — inference-движок на Zig и Vulkan. Запускает 35B модели на дешевых AMD видеокартах. Сравнение с llama.cpp, vLLM и ZLUDA.
AI Doomsday Toolbox: ваш швейцарский нож для локального ИИ на Android в 2026
Глубокий разбор AI Doomsday Toolbox: как запускать LLM, тестировать модели и создавать датасеты на смартфоне. Актуально на март 2026.
TurboQuant: онлайн-квантование векторов без калибровки — разбор реализации на Python
Обзор TurboQuant - метода онлайн-квантования векторов без калибровки. Сравнение с аналогами, примеры использования и рекомендации для инженеров в 2026.
Обучаем LLM с нуля для языка луганда и запускаем на Android без GPU: социальный AI в действии
Практический опыт создания языковой модели для языка луганда с нуля и её оптимизация для работы на мобильных устройствах без GPU. Примеры и сравнение с альтерна
Tinylora: как тонкая настройка LoRA работает всего с 13 параметрами — эксперименты и код
Обзор Tinylora — прорывной техники тонкой настройки LLM всего с 13 глобальными параметрами. Эксперименты на Qwen3.5, код и сравнение с обычной LoRA.
Tokentap: MitM-прокси для мониторинга токенов и запросов к LLM — установка и использование
Обзор Tokentap - MitM-прокси для контроля токенов и безопасности запросов к LLM. Установка через pipx, примеры, сравнение с аналогами.
Обзор Agentic RAG System: продвинутая реализация с инструментами и оценкой
Глубокий разбор продвинутой Agentic RAG системы с инструментами и встроенной оценкой. Сравнение с аналогами, архитектура на FastAPI и pgvector, кому подойдет в
Project-graph-mcp: как ИИ-агенты анализируют код с помощью графа зависимостей и сжатого JSON
Обзор MCP-сервера для анализа мультиязычных проектов. Сжатие структуры кода в 10-50 раз, экономия токенов, интеграция с ИИ-агентами.
Плагины OpenAI Codex: как одна кнопка превратила ИИ-помощника в полноценного коллегу
Обзор системы плагинов OpenAI Codex на март 2026. Как установить, что умеют MCP серверы, и сравнение с Claude Code и Gemini. Практические примеры использования.
Интеграция VK ботов в OpenClaw: обзор vk-plugin для российских AI-ассистентов
Обзор vk-plugin для OpenClaw: настройка бота во ВКонтакте, сравнение с Telegram, примеры использования для российских AI-ассистентов. Актуально на 2026 год.
Вредоносное манипулирование в ИИ: как использовать открытый toolkit от DeepMind для исследований
Как использовать открытый toolkit от DeepMind для измерения вредоносного манипулирования в ИИ. Возможности, сравнение с альтернативами, примеры использования.