Инструменты
Подборка AI-инструментов. Только то, что работает.
Falcon-OCR и Falcon-Perception: локальное зрение, которое работает без интернета
Полный гайд по установке Falcon-OCR и Falcon-Perception, их запуску и интеграции с llama.cpp. Локальное компьютерное зрение без облаков и API.
Turboquant на llama.cpp для Apple Silicon: устанавливаем и тестируем Rust-клиент для ускорения моделей на Metal
Практический обзор Turboquant — Rust-клиента для llama.cpp, который ускоряет запуск моделей вроде Qwen и Llama на Mac с помощью Metal. Установка, тесты, сравнен
1-битные LLM на устройстве: запуск модели на iPhone, бенчмарки и энергоэффективность
Как 1-битное квантование позволяет запускать 8B-модели на iPhone. Тесты памяти (1.15 ГБ), скорости и влияние на батарею. Сравнение с 4-битными аналогами.
Attn-rot (TurboQuant lite) в llama.cpp: разбор нового метода квантования KV-кэша и бенчмарки для Qwen3.5
Разбор Attn-rot (TurboQuant lite) в llama.cpp: как новый метод квантования KV-кэша снижает KLD и ускоряет инференс Qwen3.5. Бенчмарки и сравнения.
CodonRoBERTa: обучаем mRNA языковые модели для 25 видов за $165 (и это работает)
Как обучать mRNA языковые модели для 25 биологических видов всего за $165. Архитектура CodonRoBERTa, сравнение с альтернативами и примеры использования в биоинф
Bonsai-8B: первая 1-битная LLM с MMLU-R 65.7 — тесты, установка и возможности
Подробный обзор Bonsai-8B — прорывной 1-битной LLM от PrismML. Сравнение с альтернативами, тесты производительности и руководство по локальному запуску на слабо
Обзор модели Liquid AI LFM2.5-350M: агенты и инструменты на слабом железе
Обзор LFM2.5-350M: 350M параметров, <500MB после квантования, обучение на 28T токенах. Запуск на CPU и мобильных. Сравнение с Qwen3.5-0.8B.
Как настроить ИИ-агент для автономной работы в КОМПАС-3D: обзор MCP и практические примеры
Практическое руководство по настройке ИИ-агента для автономной работы в КОМПАС-3D через Model Context Protocol. Примеры использования, сравнение с Agent Skills.
Qwen 3.6 Plus Preview: Глубокий тест на агентском кодировании — как модель справилась с IDE и PATCH-командами
Глубокий практический тест новой модели Qwen 3.6 Plus (179B параметров) в задачах агентского кодирования с использованием IDE и PATCH-команд. Результаты и сравн
LongCat-Next и DiNA: один токенизатор для текста, изображений и аудио
Как работает фреймворк DiNA и модель LongCat-Next. Единое дискретное пространство для трех модальностей. Сравнение с аналогами, примеры использования.
CLI-MCP-конвертер: как дать локальной AI-модели доступ к kubectl, docker и git без написания кода
Rust-инструмент CLI-MCP-конвертер автоматически создает MCP-серверы. Дайте локальным AI доступ к kubectl, docker, git. Обзор, примеры, настройка за 5 минут.
AI-IQ: Туториал по установке и использованию персистентной памяти для локальных AI-агентов на SQLite
Пошаговая установка ai-iq. Как работает персистентная память на SQLite с векторным поиском и графом знаний для локальных ИИ-агентов. Примеры кода и сравнение с