Инструменты для работы с AI

Р

Рекурсивные языковые модели (RLM): как обрабатывать миллионы токенов с помощью fast-rlm

Обзор fast-rlm 0.1.4 — минималистичного инструмента для экспериментов с RLM. Установка, возможности, сравнение с альтернативами и кому подойдет.

Обзор

l

llm-checker: Железный детектив для моделей Ollama

Обзор llm-checker — CLI-инструмента для оценки вашего железа и подбора совместимых моделей Ollama. Установка, возможности, сравнение. Актуально на 24.02.2026.

Обзор

R

RWKV-7: когда память перестала быть проблемой для локальных LLM на ARM

Практический гайд по архитектуре RWKV-7. Запускаем локальную LLM на Raspberry Pi и Snapdragon, сравниваем память и скорость с Transformer. Веса на HuggingFace.

Обзор

S

Steerling-8B: черный ящик ИИ взломали, и вот почему это изменит всё

Как архитектура Steerling-8B отслеживает каждый токен до обучающих данных. Сравнение с GPT-5 и Llama 4, примеры использования и кому подойдет в 2026 году.

Обзор

С

Создаем open-source оркестратор для AI-агентов на Rust: альтернатива Claude Code для локальных моделей

Обзор Rust SDK для оркестрации AI-агентов с локальными моделями через llamacpp, sandboxing и контролем доступа. Альтернатива Claude Code для embedded-приложений

Обзор

M

Mem0 vs OpenAI Memory, LangMem, MemGPT: полный бенчмарк систем памяти для AI-агентов с кодом

Сравнение систем памяти для AI-агентов по задержке и точности. Тесты Mem0, OpenAI Memory, LangMem и MemGPT с кодом для воспроизведения.

Обзор

T

TinyTeapot-77M: Революция в CPU-инференсе или просто игрушка?

Обзор TinyTeapot-77M — языковой модели на 77 млн параметров, работающей на CPU со скоростью 40 токенов в секунду. Сравнение с альтернативами, примеры использова

Обзор

N

NeuroStack: как собрать локального ИИ-ассистента уровня Gemini 3 Deep Think за вечер

Практический обзор фреймворка NeuroStack: настройка, сравнение с альтернативами и реальные примеры для замены облачных ИИ. Актуально на февраль 2026.

Обзор

C

Codex-lb: когда один аккаунт ChatGPT — это слишком мало, а платить за Enterprise — слишком много

Обзор Codex-lb — обратного прокси для обхода лимитов ChatGPT. Настройка Docker, сравнение с аналогами, примеры использования. Актуально на февраль 2026.

Обзор

Г

Голосовые эмбеддинги Qwen3: как клонировать и математически модифицировать голос с помощью векторов размерности 1024

Практическое руководство по работе с голосовыми эмбеддингами Qwen3-TTS 1.7B. Клонирование голоса, математические операции с векторами размерности 1024, создание

Обзор

C

Crane: Rust-движок для локального ИИ с поддержкой Qwen3-TTS — обзор и бенчмарки против PyTorch

Обзор Crane — Rust-движка для локального ИИ. Поддержка Qwen3-TTS, ускорение на Apple Silicon Metal. Сравнение с PyTorch: в 6 раз быстрее. Кому подойдет.

Обзор

M

MoOLE-T: когда ортогональные LoRA превращаются в модульный MoE-монстр

Обзор MoOLE-T - фреймворка смеси экспертов на основе O-LoRA для динамической подгрузки весов, экономии VRAM и создания специализированных моделей Gemma 3.

Обзор