Инструменты
Подборка AI-инструментов. Только то, что работает.
Mistral-Small-4-119B-NVFP4: Зачем французы затачивают ИИ под чипы NVIDIA и как это использовать
Что такое формат NVFP4, как он ускоряет Mistral-Small-4-119B на GPU NVIDIA Blackwell и пошаговый гайд по запуску. Сравнение с INT4 и MXFP4.
MaximusLLM: Тренируй гигантские модели на картошке — один T4 и никакого стресса
Как тренировать большие языковые модели на слабом железе с помощью MaximusLLM. Ghost Logit Loss, Kronecker Sketching и другие техники экономии VRAM.
Mistral Small 4: Французский эксперт, который съедает 128 котлет, но переваривает только две
Полный разбор Mistral Small 4: архитектура MoE 128/4, 119B параметров, мультимодальность. API, сравнение с GPT-4.5 и Claude 3.5, кому подходит в 2026.
Nemotron-3-Nano-4B в GGUF: NVIDIA наконец-то играет по нашим правилам
NVIDIA выпустила компактную модель Nemotron-3-Nano-4B в формате GGUF. Полный гайд: как скачать с Hugging Face, запустить на слабом ПК и сравнить с Phi-4 и Qwen3
text-generation-webui 4.1: полный гайд по tool-calling и созданию своих функций в один .py файл
Научитесь создавать кастомные функции для локальных LLM в text-generation-webui 4.1. Гайд по tool-calling через простые Python-скрипты с примерами и сравнениями
Как развернуть продакшн-агента на LangSmith: полный гайд по новому CLI LangGraph Deploy
Пошаговая инструкция по деплою AI-агентов через новый LangGraph Deploy CLI. Установка uvx, CI/CD пайплайн, Docker образы и мониторинг в LangSmith.
Open-Toys: как собрать локальную storytelling-игрушку для детей на Qwen3-TTS и MLX для Apple Silicon
Пошаговый гайд по созданию оффлайн storytelling-игрушки для детей с использованием Qwen3-TTS, MLX и ESP32. Приватность и открытый код.
nano-KvLLM: Сжимаем KV-кеш в 4 раза без потерь для длинных контекстов
Обзор nano-KvLLM 2.1 - фреймворка для сжатия KV-кеша на основе nano-vLLM. Ускорение работы с длинным контекстом, сравнение с vLLM и llama.cpp, примеры использов
Recursive Mamba: когда одной итерации мало — как рекурсивные SSM ломают reasoning в малых моделях
Экспериментальная архитектура Recursive Mamba улучшает reasoning в малых моделях через рекурсивные циклы скрытых состояний State-Space Model. Технические детали
Хакинг голоса Ani из Grok: как собрать датасет и выжать из CosyVoice максимум
Пошаговый гайд по сборке датасета и обучению локального клона голоса Ani из Grok на open-source моделях CosyVoice и XTTS v2. Работает без облаков.
Open Swarm: полный обзор и первые шаги для запуска тысяч AI-агентов с доступом к почте, соцсетям и Google Workspace
Полный обзор Open Swarm - open-source системы для параллельного запуска AI-агентов с доступом к Gmail, Twitter, Google Workspace. Первые шаги, сравнения, пример
Opencode порт Autoresearch от Karpathy: установка и использование для автоматизации исследований
Установите порт Autoresearch от Karpathy на Opencode для автоматизации научных исследований. Полное руководство по настройке и использованию на 2026 год.