Инструменты для работы с AI

P

PLC Smart Splitter: как open-source тупой парсер ТЗ из АСУ ТП обогнал инженеров с Excel

Обзор PLC Smart Splitter — инструмента на Python Flask для автоматического парсинга ТЗ, генерации IOLIST и интеграции с PLC Studio. Сравнение с ручным разбором

Обзор

С

Строим самоподдерживающуюся Wiki-базу знаний на LLM: реализация MCP-сервера с графовым хранилищем

Пошаговое руководство по созданию production-ready базы знаний на основе MCP-сервера, типизированных связей и гибридного поиска. Забудьте про RAG.

Обзор

E

EVA-Bench 2.0: что нового в бенчмарке для enterprise voice-агентов и как его использовать

EVA-Bench 2.0 — открытый датасет с 213 реалистичными сценариями для оценки голосовых агентов. Три домена: авиакомпании, IT-поддержка, HR. Код загрузки на Python

Обзор

H

Holo3.1: Локальные компьютерные агенты с поддержкой квантований FP8 и GGUF — обзор и производительность

Разбираем Holo3.1 — open-source агент для компьютера с квантизациями FP8 и GGUF. Производительность 82% на OSWorld, запуск на 3090. Обзор и сравнение.

Обзор

M

Mellum2: Обзор новой 12B MoE модели от JetBrains — производительность, квантование и применение для кода

Подробный обзор Mellum2 — 12B MoE модели от JetBrains с открытой лицензией Apache 2.0. Бенчмарки, квантование, запуск на CPU/GPU, примеры для кода и RAG. Реальн

Обзор

M

MoQ и GSQ: революция в низкобитном квантовании GGUF — как это улучшит запуск моделей на слабом железе

Новые методы квантования MoQ и GSQ в GGUF позволяют запускать модели на 4 ГБ VRAM с минимальной потерей качества. Разбор, сравнение, практика.

Обзор

S

StepFun 3.7 Flash на Strix Halo: бенчмарки, MTP и настройка производительности

Тесты StepFun 3.7 Flash на AMD Strix Halo: скорость генерации, MTP-ускорение до 111%, настройка квантования UD-IQ4_XS. Команды и результаты.

Обзор

d

dots.tts 2B: SOTA TTS от RedNote — обзор возможностей и перспективы локального запуска

Обзор dots.tts 2B — новой SOTA модели синтеза речи (TTS) от Xiaohongshu (RedNote). Сравнение с альтернативами, требования к железу, примеры использования и реко

Обзор

O

OpenLumara: новый модульный AI-агент для локальных LLM с минимальным потреблением токенов

Обзор OpenLumara — фреймворка для локальных LLM-агентов с крошечным системным промптом и модульной архитектурой. Сравнение с альтернативами, примеры, кому подой

Обзор

Б

Бенчмаркинг GGUF моделей на iPhone: вышло приложение, которое покажет реальную скорость

Новое iOS-приложение для тестирования GGUF моделей на iPhone. Измеряет токены/с, задержку и память. Сравнение с альтернативами, примеры использования на iPhone

Обзор

L

Lightweight Terminal Agent: когда ИИ переезжает в консоль и не просит видеокарту

Разбираем легковесный open-source проект для запуска AI-агентов прямо в консоли. Возможности, сравнение с аналогами, примеры использования и кому это реально ну

Обзор

W

Wiki-MCP-Server: распределённый граф знаний с авторизацией и MCP-протоколом — доработка идеи Карпати

Разбираем Wiki-MCP-Server — эволюцию идеи Карпати: распределённый граф знаний на AlloyDB, pgvector, типизированные рёбра и MCP-протокол. Примеры использования,

Обзор