Инструменты для работы с AI

F

Falcon-OCR и Falcon-Perception: локальное зрение, которое работает без интернета

Полный гайд по установке Falcon-OCR и Falcon-Perception, их запуску и интеграции с llama.cpp. Локальное компьютерное зрение без облаков и API.

Обзор

T

Turboquant на llama.cpp для Apple Silicon: устанавливаем и тестируем Rust-клиент для ускорения моделей на Metal

Практический обзор Turboquant — Rust-клиента для llama.cpp, который ускоряет запуск моделей вроде Qwen и Llama на Mac с помощью Metal. Установка, тесты, сравнен

Обзор

1

1-битные LLM на устройстве: запуск модели на iPhone, бенчмарки и энергоэффективность

Как 1-битное квантование позволяет запускать 8B-модели на iPhone. Тесты памяти (1.15 ГБ), скорости и влияние на батарею. Сравнение с 4-битными аналогами.

Обзор

A

Attn-rot (TurboQuant lite) в llama.cpp: разбор нового метода квантования KV-кэша и бенчмарки для Qwen3.5

Разбор Attn-rot (TurboQuant lite) в llama.cpp: как новый метод квантования KV-кэша снижает KLD и ускоряет инференс Qwen3.5. Бенчмарки и сравнения.

Обзор

C

CodonRoBERTa: обучаем mRNA языковые модели для 25 видов за $165 (и это работает)

Как обучать mRNA языковые модели для 25 биологических видов всего за $165. Архитектура CodonRoBERTa, сравнение с альтернативами и примеры использования в биоинф

Обзор

B

Bonsai-8B: первая 1-битная LLM с MMLU-R 65.7 — тесты, установка и возможности

Подробный обзор Bonsai-8B — прорывной 1-битной LLM от PrismML. Сравнение с альтернативами, тесты производительности и руководство по локальному запуску на слабо

Обзор

О

Обзор модели Liquid AI LFM2.5-350M: агенты и инструменты на слабом железе

Обзор LFM2.5-350M: 350M параметров, <500MB после квантования, обучение на 28T токенах. Запуск на CPU и мобильных. Сравнение с Qwen3.5-0.8B.

Обзор

К

Как настроить ИИ-агент для автономной работы в КОМПАС-3D: обзор MCP и практические примеры

Практическое руководство по настройке ИИ-агента для автономной работы в КОМПАС-3D через Model Context Protocol. Примеры использования, сравнение с Agent Skills.

Обзор

Q

Qwen 3.6 Plus Preview: Глубокий тест на агентском кодировании — как модель справилась с IDE и PATCH-командами

Глубокий практический тест новой модели Qwen 3.6 Plus (179B параметров) в задачах агентского кодирования с использованием IDE и PATCH-команд. Результаты и сравн

Обзор

L

LongCat-Next и DiNA: один токенизатор для текста, изображений и аудио

Как работает фреймворк DiNA и модель LongCat-Next. Единое дискретное пространство для трех модальностей. Сравнение с аналогами, примеры использования.

Обзор

C

CLI-MCP-конвертер: как дать локальной AI-модели доступ к kubectl, docker и git без написания кода

Rust-инструмент CLI-MCP-конвертер автоматически создает MCP-серверы. Дайте локальным AI доступ к kubectl, docker, git. Обзор, примеры, настройка за 5 минут.

Обзор

A

AI-IQ: Туториал по установке и использованию персистентной памяти для локальных AI-агентов на SQLite

Пошаговая установка ai-iq. Как работает персистентная память на SQLite с векторным поиском и графом знаний для локальных ИИ-агентов. Примеры кода и сравнение с

Обзор