Инструменты
Подборка AI-инструментов. Только то, что работает.
GLM-OCR: почему эта мультимодалка читает документы лучше, чем вы
Технический разбор GLM-OCR — мультимодальной модели для понимания сложных документов. Multi-Token Prediction loss, CogViT энкодер, двухэтапный пайплайн.
NTTuner + GUI: Финтюн моделей на Windows без боли, с Unsloth под капотом
Пошаговое руководство по использованию NTTuner с графическим интерфейсом для тонкой настройки языковых моделей на Windows. Интеграция с Unsloth для ускорения в
Step-3.5-Flash-int4: новый король для Mac с 128 ГБ памяти
Тестируем Step-3.5-Flash-int4 на M1 Ultra с 128 ГБ RAM. Реальные бенчмарки llama-bench, сравнение с альтернативами и полный контекст 256k.
PromptProxy: как собирать датасеты для дистилляции, не сжигая API-ключи
Обзор PromptProxy: инструмент для безопасного сбора промптов и ответов от GPT-4o, Claude 3.7 и других LLM. Экономия токенов, защита API-ключей, создание датасет
Когда Flash-Attention приходит на CPU: как ggml заставляет работать длинные контексты без GPU
Как использовать оптимизацию FA split across kv в ggml для ускорения декодирования длинных контекстов на CPU. Сравнение с альтернативами и практические примеры.
Transformer Lab for Teams: когда один GPU — это смешно, а кластер — головная боль
Как Transformer Lab for Teams решает проблему фрагментации workflow в распределённом обучении моделей. Поддержка Slurm, SkyPilot, приватность.
OpenAI Codex для MacOS: агентное приложение, которое наконец-то работает, а не обещает
Полный обзор нового агентного приложения OpenAI Codex для MacOS. Тестируем возможности, сравниваем с GPT-5.2-Codex и Claude Code. Актуально на февраль 2026.
Xiaozhi (Робот Добби): китайский opensource робот на ESP32, который можно починить и перепрограммировать
Полный разбор китайского голосового робота Xiaozhi на ESP32. Аппаратная часть, прошивка, ремонт микрофона и сравнение с альтернативами на 2026 год.
Large Plant Model: робот-убийца сорняков, который учился на 150 млн фото
Как модель на 150 млн фото распознаёт сорняки без переобучения. Технология Carbon Robotics для автономных роботов-фермеров. Обзор LPM на 2026 год.
VRAM Guard: как защитить ноутбук от перегрева при работе с локальными LLM и Stable Diffusion
Обзор утилиты VRAM Guard для защиты ноутбуков от перегрева VRAM при запуске локальных LLM и Stable Diffusion. Метод импульсного троттлинга.
MiniMax Agent 2.0: подробный обзор и сравнение с Claude Cowork и Moltbot для автоматизации файлов
Полный разбор MiniMax Agent 2.0: тестируем на уборке папки Загрузки, сравниваем с Claude Cowork и Moltbot. Какой AI-агент лучше автоматизирует рутину в 2026 год
Step-3.5-Flash: 196 миллиардов параметров, но работает как 11. Почему это следующий шаг в локальных AI
Обзор Step-3.5-Flash (196B/A11B) - MoE модели с 11B активных параметров. Установка, тесты, сравнение производительности с DeepSeek v3.2 на февраль 2026.