Инструменты
Подборка AI-инструментов. Только то, что работает.
Amazon SageMaker Data Agent: автономный аналитик, который сам пишет SQL за врачей
Как автономный AI-агент от Amazon ускоряет исследования в медицине. Генерация SQL кода, когортный анализ и работа с реальными данными.
Qwen3-Coder-Next: китайский ответ на CodeLlama, который умеет думать как программист
Тестируем Qwen3-Coder-Next на реальных задачах, сравниваем с CodeLlama и DeepSeek-Coder. Кому подойдет новая модель для программирования.
Mistral-Helcyon-Mercury-12b: локальная модель с тоном GPT-4o — тест и настройка
Тест Mistral-Helcyon-Mercury-12b - локальной модели с тоном GPT-4o. Сравнение, настройка GGUF, инференс на RTX 3060 12GB. Альтернатива Mistral и Qwen2.5.
Tanaos Sentiment Analysis: крошечная модель, которая понимает иронию лучше маркетологов
Обзор Tanaos Sentiment Analysis — 500Мб модели для анализа тональности текста. Сравнение с аналогами, примеры работы через API, инструкция по локальному запуску
EdgeGate: когда CI-тестирование мобильного AI перестает быть кошмаром
Обзор EdgeGate — инструмента для CI-тестирования on-device AI на реальном железе. Как он решает проблемы p95/p99 latency, троттлинга и энергопотребления на Snap
Gonka: как децентрализованная сеть снижает стоимость LLM-инференса в 10 раз
Обзор Gonka — децентрализованной сети для запуска LLM с Transformer Proof-of-Work. Сравнение с OpenAI, снижение затрат на 90%, инвестиции Bitfury.
MRS-Core: минимальный слой логики для локальных ИИ-агентов
Обзор MRS-Core — минимального reasoning слоя для сборки персистентных локальных ИИ-агентов с Ollama и LM Studio. Установка, примеры, сравнения.
Исправление ошибки Jinja в Devstral Small 2: кастомный шаблон для llama.cpp и агентов
Готовое решение для исправления runtime error в Devstral Small 2 при использовании с llama.cpp и агентскими инструментами. Кастомный chat template и примеры код
GLM-OCR: почему эта мультимодалка читает документы лучше, чем вы
Технический разбор GLM-OCR — мультимодальной модели для понимания сложных документов. Multi-Token Prediction loss, CogViT энкодер, двухэтапный пайплайн.
NTTuner + GUI: Финтюн моделей на Windows без боли, с Unsloth под капотом
Пошаговое руководство по использованию NTTuner с графическим интерфейсом для тонкой настройки языковых моделей на Windows. Интеграция с Unsloth для ускорения в
Step-3.5-Flash-int4: новый король для Mac с 128 ГБ памяти
Тестируем Step-3.5-Flash-int4 на M1 Ultra с 128 ГБ RAM. Реальные бенчмарки llama-bench, сравнение с альтернативами и полный контекст 256k.
PromptProxy: как собирать датасеты для дистилляции, не сжигая API-ключи
Обзор PromptProxy: инструмент для безопасного сбора промптов и ответов от GPT-4o, Claude 3.7 и других LLM. Экономия токенов, защита API-ключей, создание датасет