Инструменты
Подборка AI-инструментов. Только то, что работает.
OpenAI Agent SDK для Java: когда Python-разработчики перестали быть единственными счастливчиками
Полный обзор OpenAI Agent SDK для Java. Установка через Maven, создание первого AI-агента, сравнение с Python-альтернативами и примеры использования.
V6rge: Windows AI-студия для тех, кто ненавидит Python и CUDA
Обзор V6rge — Windows AI-студии для запуска локальных LLM, генерации изображений и музыки без установки Python и CUDA. Установка, возможности, сравнение.
AgentCrawl: Как создать оптимизированный под LLM скрапер с автоматическим переходом на headless-браузер
AgentCrawl - библиотека для гибридного веб-скрапинга под LLM с автоматическим переходом на Playwright. Оптимизация токенов, чистый Markdown, интеграция Vercel A
GLM-4.7 Flash: китайский снайпер против Qwen 32B
GLM-4.7 Flash бенчмарки, сравнение производительности с Qwen 32B, скачать модель Zhipu AI. Полная инструкция по запуску и квантованию.
LlamaBarn 0.23: macOS-приложение, которое само загружает модели и не просит помощи
Обзор LlamaBarn 0.23 - macOS-приложения для локальных LLM с автоматической загрузкой моделей, Router Mode и оптимизацией памяти. Установка через Homebrew.
Ghost Engine: как запустить Llama-3-8B на 3 ГБ VRAM и не сойти с ума
Революционный метод сжатия LLM через архитектуру Predator-Prey. Запускаем Llama-3-8B на 3 ГБ видеопамяти — полный обзор технологии.
Claude Cowork: полный обзор агентского режима Anthropic на macOS — возможности, интеграции и реальные недостатки
Разбираем Claude Cowork — агентский режим Anthropic для macOS. Как работает изолированная Linux VM, интеграции MCP, подписка Claude Max. Реальные проблемы с про
On-device браузерный агент на Qwen: локальный Chrome без облаков
Как установить и использовать браузерный AI-агент на Qwen для автоматизации задач прямо в Chrome без интернета. On-device решение для приватности.
Оптимизированный Top-K для LLM: ускорение инференса в 20 раз на CPU с AVX2
Как оптимизированный Top-K с AVX2 ускоряет выборку токенов в llama.cpp до 20 раз на обычных процессорах. Бенчмарки, интеграция, сравнение с альтернативами.
WallPlan: как нейросети генерируют планировки через графы стен, а не пиксели
Технический разбор WallPlan - нейросети, которая генерирует архитектурные планировки через графы стен, а не пиксели. Три CNN: WinNet, GraphNet, LabelNet.
Iris Agent: фреймворк, где вы видите каждую шестерёнку
Обзор минималистичного Iris Agent - open-source фреймворка для создания и обучения AI-агентов с полной прозрачностью архитектуры.
FLUX.2 Klein на стероидах: заставляем 9B-модель летать быстрее мысли на A100
Готовые скрипты Gradio и FastAPI для FLUX.2 Klein с оптимизациями torch.compile и fused QKV. Запуск за 0.9 секунды на A100.