Инструменты для работы с AI

c

cocoindex-code: семантический поиск по коду для AI-агентов за две команды

Обзор cocoindex-code — инструмента семантического поиска по коду для AI-агентов. Установка за две команды, сравнение с аналогами, примеры использования на 2026

Обзор

D

DreamX-World 1.0: Камера в кармане у модели мира — и никаких склеек

DreamX-World 1.0 — 5B параметров, Apache 2.0, управление камерой и память сцен. Сравнение с Runway, Google Genie, Yume1.5. Кому нужна и как работает.

Обзор

s

semantic-memory: создаём локальную базу знаний на Rust с векторным поиском и MCP сервером

Обзор semantic-memory — инструмента на Rust для векторного поиска и гибридного хранения знаний через MCP. Сравнение с Mem0, Chroma и Qdrant. Примеры настройки.

Обзор

T

TernML: запуск нейросетей на микроконтроллерах без FPU за 36 рублей — руководство и бенчмарки

TernML позволяет запустить тернарную нейросеть на STM32G031 за 36 руб. Реальные бенчмарки, пошаговый гайд и сравнение с альтернативами.

Обзор

G

GLM 5.2: Китайцы снова пытаются. На этот раз — с эффективностью 98% и вдвое меньшим расходом токенов

Новый LLM от THUDM обещает революцию в токен-экономии. Реальность или маркетинг? Сравнение с альтернативами, примеры использования и кому подойдет.

Обзор

A

Attention Algebra: когда грамматика текста превращается в музыку сфер

Обзор Attention Algebra — открытого инструмента для перевода естественного языка в спектрограммы с помощью формальной грамматики и Jungian типов. Сравнение с эм

Обзор

Н

Не пудри мне мозги, grep: как cocoindex-code нашел то, что искал Claude Code

Установи cocoindex-code за минуту и забудь про grep. Сравниваем с CodeGraph и SocratiCode. Как AI-агенты перестали тупить.

Обзор

Д

Две Radeon R9700, vLLM и проклятый long-context: как я заставил RDNA4 работать с 128K токенов

Пошаговое руководство по multi-GPU конфигурации AMD Radeon R9700 на vLLM: исправление бага long-context decode с помощью AITER Unified Attention, настройка FP8

Обзор

К

Как добавить веб-поиск в ИИ-агентов на AWS: настройка Web Search on Amazon Bedrock AgentCore с MCP

Пошаговое руководство по интеграции веб-поиска в AWS Bedrock агентов с помощью AgentCore и Model Context Protocol. Код, конфигурация, сравнение с Tavily и Bing.

Обзор

O

OCC-RAG: компактные модели для честного RAG без галлюцинаций — обзор и гайд по запуску

OCC-RAG (0.6B и 1.7B) — SLM для faithful RAG. Обзор возможностей, сравнение с альтернативами и пошаговый гайд по запуску ONNX/GGUF на локалке.

Обзор

G

GLM-5.2 744B: запуск 2-битной версии на 4×3090 — бенчмарки и почему IQ1_M не ускорил вывод

Запустили GLM-5.2 744B в 2-битном квантовании IQ1_M на четырех RTX 3090. Бенчмарки скорости, сравнение с IQ2, причины низкой производительности IQ1_M и рекоменд

Обзор

Q

Qwopus 3.6 27B Coder в 2-битном GGUF: запуск агентного кодинга на видеокартах до 10GB

Обзор 2-битного GGUF кванта Qwopus 3.6 27B Coder: размеры IQ2_XS, IQ2_M, Q2_K_S, pass rate на SWE-bench, сохранение MTP. Запуск агентного кодинга на RTX 3060, 4

Обзор