Инструменты для работы с AI

S

Sparsity: как прототип для разреженных эмбеддингов экономит 15-50x памяти

Обзор прототипа Sparsity — разреженные эмбеддинги с декомпозицией матриц. Экономия 15-50x памяти для векторных БД и RAG. Актуально на февраль 2026.

Обзор

N

Nanollama: как за 30 минут обучить свою Llama 3 и получить GGUF

Пошаговый гайд по обучению Llama 3 с помощью Nanollama. Создайте свою модель, экспортируйте в GGUF формат и запустите локально за полчаса.

Обзор

C

Code-memory: MCP-сервер, который понимает ваш код лучше, чем вы сами (и не сожрет всю VRAM)

Инструкция по AST-парсингу и векторному поиску для экономии контекста в LLM. Локальные эмбеддинги, sqlite-vec, tree-sitter.

Обзор

V

Void-Box: как запустить AI-агентов в изолированных микро-ВМ на Rust для максимальной безопасности

Обзор Void-Box — инструмента для запуска AI-агентов в изолированных микро-ВМ на Rust. Сравнение с Docker и Firecracker, примеры использования для безопасных wor

Обзор

K

Kon: кодирующий агент, который помещается в 1K токенов и работает на любом железе

Обзор Kon - open-source кодирующего агента с системным промптом менее 1K токенов. Работает на локальных моделях, сравнение с конкурентами, примеры использования

Обзор

s

smolcluster: когда один Mac mini не тянет Llama 3.2, а учить распределённое обучение с PyTorch — больно

Обзор smolcluster — библиотеки для распределённого обучения LLM на чистом Python и socket. FSDP, Model Parallelism, гетерогенное железо.

Обзор

O

OpenClaw и Browser Sandbox: как избавиться от узкого места браузерной автоматизации

Firecrawl Browser Sandbox для OpenClaw: удаленный браузинг, изоляция безопасности и масштабирование агентов. Установка и примеры на 2026 год.

Обзор

O

Ouro 2.6B GGUF: петлевой вывод на вашем ноутбуке и что за слои пропали при конвертации

Полный разбор Ouro 2.6B в формате GGUF: как запустить модель с петлевым выводом, чем она отличается от оригинала и почему early_exit_gate пропал при конвертации

Обзор

G

Gemini 3 Deep Think: как модель находит ошибки в научных статьях и оптимизирует исследования

Как Gemini 3 Deep Think находит логические ошибки в статьях, оптимизирует эксперименты и работает с математическим анализом. Примеры использования и сравнение с

Обзор

Т

Твой личный ИИ-лаборант: агент, который следит за экспериментами пока ты спишь

Готовое решение на LangChain для автоматического мониторинга сбоев в обучении моделей, анализа метрик и перезапуска джобов. Практический обзор на февраль 2026 г

Обзор

П

Персональный GitHub-рекап на локальной LLM: код, который не шпионит за твоими коммитами

Собираем приватную аналитику GitHub на локальной LLM: архитектура, код и визуализация активности разработчика без отправки данных в облако.

Обзор

O

Ouro-2.6B-Thinking снова жив: как починить рекуррентную модель после обновления transformers

Подробный гайд по запуску рекуррентной модели Ouro-2.6B-Thinking с исправлением ошибок в transformers 4.55. Сравнение инференса с обычными трансформерами.

Обзор