Инструменты для работы с AI

T

TranslateGemma UI: Веб-интерфейс для локального перевода, который не стыдно показать коллегам

Разверните свой приватный переводчик с веб-интерфейсом за 5 минут. Gemma 3, Docker, Ollama — и никаких облачных API. Полный гайд на февраль 2026 года.

Обзор

D

DeepSeek DeepGEMM: как обновление с mHC и поддержкой Blackwell ускорит работу LLM

Технический обзор DeepSeek DeepGEMM: как обновление с Manifold-constrained Hyper-connections и поддержкой NVIDIA Blackwell ускоряет матричные вычисления для LLM

Обзор

L

LLmFit: как одной командой подобрать идеальную LLM-модель под ваше железо

Обзор LLmFit - инструмента для подбора LLM-моделей под аппаратное обеспечение. Узнайте, как одной командой найти идеальную модель для вашего GPU и RAM.

Обзор

К

Как запустить гигантские MoE-модели на одной видеокарте: разбор гибридного рантайма Krasis и бенчмарки

Гибридный рантайм Krasis позволяет запускать гигантские MoE-модели на одной видеокарте. Бенчмарки скорости префилла на RTX 5080 и других GPU.

Обзор

П

Полное руководство по квантованию Qwen3.5-35B-A3B: разбор SOTA GGUFs от Unsloth и лучшие практики

Разбор динамических GGUF от Unsloth для Qwen3.5-35B-A3B: KL Divergence, чувствительные тензоры, сравнение методов квантования и рекомендации по выбору.

Обзор

P

PageAgent: браузерный AI-агент для локального запуска с Ollama — обзор и туториал

PageAgent - браузерный AI-агент, работающий локально с Ollama. DOM как текст, автоматизация без облачных API. Полный обзор, сравнение и туториал.

Обзор

Q

Qwen 3.5 122B A10B: разбор рекорда в UGI, запуск с UD Q2KXL и обход цензуры

Обзор Qwen 3.5 122B A10B: рекорд в бенчмарке UGI, сравнение с GPT OSS 120B, запуск с квантованием UD Q2KXL и методы обхода цензуры в reasoning.

Обзор

A

AutoBe: как слабые локальные LLM отладили генератор backend-приложений до 100% успеха

Как инструмент AutoBe использует слабые локальные LLM для отладки и достигает 100% успеха в генерации backend-приложений на NestJS и Prisma.

Обзор

P

Perplexity Computer: как работает супер-агент, который управляет другими ИИ (Claude, Gemini, GPT-5.2)

Как Perplexity Computer оркестрирует Claude Opus 4.6, GPT-5.2 и Gemini для сложных задач. Возможности, сравнение с аналогами и кому подойдет.

Обзор

p

pplx-embed от Perplexity: как использовать квантованные эмбеддинги для семантического поиска и RAG

Обзор pplx-embed от Perplexity: как int8-квантование ускоряет семантический поиск и RAG-системы. Примеры использования, сравнение с альтернативами.

Обзор

O

OASIS: как запустить и использовать локальный бенчмарк для тестирования LLM на задачах кибербезопасности

Полный обзор OASIS — локального бенчмарка для оценки LLM на задачах кибербезопасности. Запуск в Docker, тестирование уязвимостей, сравнение моделей.

Обзор

L

LightMem: система памяти для LLM-агентов с 10x ростом точности и 100x снижением затрат

Обзор LightMem - легковесной системы памяти для LLM-агентов. Увеличивает точность в 10 раз, сокращает затраты на токены и API-вызовы в 100 раз. Открытый код, мо

Обзор