Инструменты для работы с AI

O

Open-vocabulary детекция объектов и их редактирование с Gemini: полный туториал с кодом

Полное руководство по open-vocabulary детекции и пространственному редактированию объектов с Gemini Nano Banana 3. Код, примеры, сравнение с альтернативами. Акт

Обзор

V

VBVR: 2 миллиона видео, чтобы заставить ИИ думать как человек

Полный обзор датасета VBVR на 2 млн видео и модели Wan2.2, которая превосходит Sora 2 в когнитивных задачах. Открытые веса, бенчмарк и примеры использования.

Обзор

C

CLaaS: обзор и настройка open-source библиотеки для обучения LLM вашими фидбеками в реальном времени

Как настроить CLaaS для continual learning LLM с LoRA адаптерами. Решение проблемы катастрофического забывания. Примеры использования с Telegram и OpenClaw.

Обзор

M

Multi-LoRA serving в vLLM 0.15.0: как обслуживать десятки MoE-моделей на одном GPU

Как vLLM 0.15.0 с multi-LoRA serving экономит GPU при запуске десятков fine-tuned MoE-моделей. Сравнение с альтернативами, примеры и настройка.

Обзор

К

Как обновить llama.cpp для Qwen 3.5: исправление multi-GPU crash и настройка prompt caching

Пошаговый гайд по обновлению llama.cpp, применению патча для исправления краша на нескольких GPU и настройке prompt caching под Qwen 3.5. Актуально на февраль 2

Обзор

C

CodeWiki Skill: Документация, которая пишет сама себя. Или как настроить мультиагентную систему за 15 минут

Как настроить мультиагентную систему CodeWiki Skill для автоматического создания структурированной документации к любому коду. Работа с Claude Code и семантичес

Обзор

F

FlashLM v6 SUPERNOVA: революционная архитектура P-RCSM без внимания и свёрток, 3500 токенов/с на CPU

Обзор FlashLM v6 SUPERNOVA: архитектура P-RCSM без внимания и сверток, тернарные веса, 4.1M параметров, 3500 токенов/с на CPU. Сравнение с альтернативами.

Обзор

Q

Qwen3.5-27B на RTX A6000: как получить 19.7 токенов в секунду с качеством GPT-4?

Пошаговая инструкция по запуску Qwen3.5-27B с квантованием Q8_0 через llama.cpp и CUDA на RTX A6000. Сравнение с Llama 3.1 и Mixtral.

Обзор

S

SWE-bench Multilingual Leaderboard: какой ИИ лучше всего пишет код на 9 языках и сколько это стоит

Сравнение GPT-5.2, GLM-4.7, DeepSeek v3.2 и MiniMax 2.5 на SWE-bench Multilingual Leaderboard. Какая модель лучше пишет код на 9 языках и сколько стоит inferenc

Обзор

L

Liquid AI LFM2-24B-A2B: руководство по запуску MoE-модели на локальном железе с 32 ГБ ОЗУ

Пошаговое руководство по запуску модели Liquid AI LFM2-24B-A2B на локальном компьютере с 32 ГБ ОЗУ. Используем llama.cpp, vLLM, SGLang для эффективной работы sp

Обзор

К

Как настроить 4B-агент для навигации по коду: GGUF, Qwen и 100% валидность tool-calling

Пошаговая настройка 4B-агента для навигации по коду. GGUF модель, 100% валидность tool-calling, экономия токенов. Сравнение с Claude и GPT.

Обзор

L

LLM Simulator: браузерный симулятор железа для обучения и инференса моделей (GPTQ, AWQ)

Браузерный симулятор для расчета памяти, стоимости и throughput LLM. Поддержка GPTQ, AWQ, 70+ моделей и 25 GPU. Актуальный обзор на февраль 2026.

Обзор